天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 社科論文 > 圖書檔案論文 >

基于學(xué)術(shù)論文全文的研究方法句自動抽取研究

發(fā)布時間:2021-09-06 14:20
  研究方法是科技文獻(xiàn)中的重要內(nèi)容,是解決學(xué)科領(lǐng)域問題的方法、工具、手段或技術(shù)。研究方法的描述通常以句子為單位。將分散在科技文獻(xiàn)中的研究方法句進(jìn)行匯總,可以輔助科研工作者快速地搜尋合適的研究方法。根據(jù)方法使用主體,將研究方法句進(jìn)一步分為論文使用方法句和論文引用方法句。論文使用方法句是指論文中使用的研究方法的描述句。論文引用方法句是指論文對前人使用過的研究方法的描述句。本文使用多種基于神經(jīng)網(wǎng)絡(luò)的句子分類模型從科技文獻(xiàn)全文本中進(jìn)行研究方法句抽取。在模型詞向量表示層,論文使用BERT和word2vec兩種詞向量模型。在模型的特征選擇層,本文選用三種不同的網(wǎng)絡(luò),分別為卷積神經(jīng)網(wǎng)絡(luò)、雙向長短時記憶網(wǎng)絡(luò)和注意力機(jī)制網(wǎng)絡(luò)。另外,論文使用兩種模型訓(xùn)練方式,分別為單層次結(jié)構(gòu)和兩層次結(jié)構(gòu)。實驗結(jié)果表明,基于BERT的單層次結(jié)構(gòu)的雙向長短時記憶網(wǎng)絡(luò)模型取得了較優(yōu)的性能。本文從《情報學(xué)報》已發(fā)表論文中進(jìn)行研究方法句的抽取并分析研究方法句的分布情況。分析發(fā)現(xiàn),《情報學(xué)報》逐漸重視情報學(xué)中理論的發(fā)展并關(guān)注建設(shè)情報學(xué)學(xué)科的理論體系。 

【文章來源】:情報學(xué)報. 2020,39(06)北大核心CSSCICSCD

【文章頁數(shù)】:11 頁

【部分圖文】:

基于學(xué)術(shù)論文全文的研究方法句自動抽取研究


研究方法句抽取模型框架

分布情況,年份,分布情況,論文


論文引用方法句是論文中對先前工作的引用。引用包括多種情況,如與已有方法進(jìn)行比較或使用已有研究工作中的方法的情況都需要引用對應(yīng)的文獻(xiàn)。論文引用方法句占比是指論文引用方法句和本文句子總數(shù)量的比例。本文取每一年份下所有論文的論文引用方法句占比的平均數(shù)。論文引用方法句占比越高,則表示論文中較傾向于使用已有方法或與已有方法進(jìn)行比較研究。具體分布如圖3b所示。從圖3b中可以發(fā)現(xiàn),論文引用方法句的分布分為3個階段。第一階段,2009—2010年,呈現(xiàn)急速上升的趨勢。在這個階段,論文引用方法句比例上升。這一現(xiàn)象表明,在這一階段《情報學(xué)報》中的論文較傾向于使用已有研究工作中的方法或是提出新方法與已有方法進(jìn)行比較。第二階段,2010—2014年,呈現(xiàn)波動上升的趨勢。在這個階段,論文引用方法句比例緩慢上升。這一現(xiàn)象表明,在這一階段,《情報學(xué)報》中的論文中仍習(xí)慣于使用已有研究工作中的方法或與已有方法相比較。第三階段,2014—2018年,呈現(xiàn)波動下降的趨勢。在這個階段,論文引用方法句比例波動下降。這一現(xiàn)象與圖3a中這一階段論文使用方法句比例下降的趨勢相同。因此,可以看出在這一時期,《情報學(xué)報》中有關(guān)研究型和實驗型的論文占比下降,理論研究型論文數(shù)量上升,從而使論文引用方法句的數(shù)量也隨之下降。5 結(jié)論與展望

框架圖,神經(jīng)網(wǎng)絡(luò),序列,向量


本文使用神經(jīng)網(wǎng)絡(luò)序列標(biāo)注模型進(jìn)行實驗,并選擇性能最優(yōu)的模型進(jìn)行研究方法句抽取。在神經(jīng)網(wǎng)絡(luò)序列標(biāo)注模型中,本文選擇使用兩種不同的詞向量表示層和三種不同的特征選擇層。詞向量表示層主要將輸入的詞語轉(zhuǎn)化為模型能夠理解的向量表示。如圖2所示,假設(shè)需要詞序列為{pi,s,1,pi,s,2,,pi,s,w,?,pi,s,w}。該詞序列輸入到詞向量層后轉(zhuǎn)變?yōu)樵~向量表示{vi,s,1,vi,s,2,?,vi,s,w,?,vi,s,w}。經(jīng)過特征選擇層后經(jīng)過softmax以得到最終的句子標(biāo)簽yi,s。在詞向量表示層,本文使用兩種預(yù)訓(xùn)練詞向量模型,分別是word2vec領(lǐng)域詞向量[15]和BERT(bidirectional encoder representations from transformers)開源語言模型[16]。特征選擇層主要從輸入中自動學(xué)習(xí)有用的特征。如圖2所示,特征選擇層的輸入為詞序列的詞向量表示{vi,s,1,vi,s,2,?,vi,s,w,?,vi,s,w}。特征選擇層從詞向量中學(xué)習(xí)到對分類任務(wù)有用的特征。在該層中,本文使用卷積神經(jīng)網(wǎng)絡(luò)、雙向長短時記憶網(wǎng)絡(luò)和結(jié)合注意力機(jī)制的雙向長短時記憶網(wǎng)絡(luò)。另外,在模型結(jié)構(gòu)方面,本文使用兩種結(jié)構(gòu)的模型,分別是單層次模型和兩層次模型。下面分別對不同的詞向量表示層、特征選擇層和模型結(jié)構(gòu)進(jìn)行介紹。3.3.1 詞向量表示層選擇

【參考文獻(xiàn)】:
期刊論文
[1]我國情報學(xué)理論的來源、應(yīng)用及學(xué)科專屬度研究[J]. 王芳,陳鋒,祝娜,楊京.  情報學(xué)報. 2016 (11)
[2]細(xì)粒度科技論文摘要句子分類方法[J]. 華秀麗,徐凡,王中卿,李培峰.  計算機(jī)工程. 2012(14)

博士論文
[1]學(xué)科領(lǐng)域本體學(xué)習(xí)及學(xué)術(shù)資源語義標(biāo)注研究[D]. 蔣婷.南京大學(xué) 2017



本文編號:3387617

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/tushudanganlunwen/3387617.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶b05aa***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com