天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁(yè) > 論文百科 > 期刊論文 >

基于集成學(xué)習(xí)的OA期刊論文元數(shù)據(jù)提取方法研究

發(fā)布時(shí)間:2017-12-18 18:02

  本文關(guān)鍵詞:基于集成學(xué)習(xí)的OA期刊論文元數(shù)據(jù)提取方法研究


  更多相關(guān)文章: 論文元數(shù)據(jù) 元數(shù)據(jù)提取 統(tǒng)計(jì)機(jī)器學(xué)習(xí) 集成學(xué)習(xí)


【摘要】:在建設(shè)圖書(shū)館數(shù)字資源庫(kù)時(shí),,需要利用互聯(lián)網(wǎng)上的開(kāi)放存取(Open Access,OA)期刊論文作為圖書(shū)館數(shù)字資源庫(kù)建設(shè)的信息源,利用論文元數(shù)據(jù)信息可以提高論文在圖書(shū)館數(shù)字資源庫(kù)中檢索的準(zhǔn)確率和檢索速度。因此,如何準(zhǔn)確和快速地提取OA期刊論文的元數(shù)據(jù)是實(shí)現(xiàn)圖書(shū)館數(shù)字資源庫(kù)建設(shè)的關(guān)鍵。本文在對(duì)國(guó)內(nèi)外論文元數(shù)據(jù)提取方法綜合研究分析基礎(chǔ)上,結(jié)合集成學(xué)習(xí)的思想,從個(gè)體學(xué)習(xí)器的結(jié)論合成和個(gè)體生成方法兩方面出發(fā),對(duì)論文元數(shù)據(jù)提取方法進(jìn)行了研究。 首先,針對(duì)現(xiàn)有的單一元數(shù)據(jù)提取模型提取精度和泛化能力不高的問(wèn)題,從集成學(xué)習(xí)的個(gè)體學(xué)習(xí)器結(jié)論合成方面考慮,提出一種基于貝葉斯融合的論文元數(shù)據(jù)提取方法;鶎觽(gè)體學(xué)習(xí)器分別采用HMM、SVM和CRF三種機(jī)器學(xué)習(xí)算法,對(duì)訓(xùn)練集學(xué)習(xí)生成提取模型,利用已生成的模型提取論文元數(shù)據(jù)并計(jì)算提取的樣本屬于每個(gè)元數(shù)據(jù)類別的后驗(yàn)概率,并對(duì)每個(gè)模型的后驗(yàn)概率加權(quán)計(jì)算,結(jié)合貝葉斯理論對(duì)產(chǎn)生的后驗(yàn)概率融合決策,最終提取論文的元數(shù)據(jù)。 其次,從集成學(xué)習(xí)個(gè)體學(xué)習(xí)器生成方面考慮,提出一種基于元學(xué)習(xí)的論文元數(shù)據(jù)提取方法。先是提出一種基分類器構(gòu)造方法,按照期刊類別構(gòu)建不同的基層訓(xùn)練集,通過(guò)基層SVM學(xué)習(xí)這些構(gòu)造好的訓(xùn)練集生成基分類器,增大了集成學(xué)習(xí)中基層分類器之間的差異性;元層SVM通過(guò)對(duì)基分類器的學(xué)習(xí)結(jié)果進(jìn)行再學(xué)習(xí)生成元分類器,元分類器綜合決策基分類器的輸出結(jié)果,從而得到最終的提取結(jié)果,提高論文元數(shù)據(jù)模型的提取精度和泛化能力。 最后,對(duì)本文提出的方法進(jìn)行實(shí)驗(yàn)驗(yàn)證,實(shí)驗(yàn)結(jié)果表明,本文所提的方法提高了論文元數(shù)據(jù)提取的精度,具有較好的泛化能力,同時(shí)結(jié)合研究成果對(duì)今后的研究工作進(jìn)行了展望。
【學(xué)位授予單位】:燕山大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2012
【分類號(hào)】:TP391.1;G250.76

【參考文獻(xiàn)】

中國(guó)期刊全文數(shù)據(jù)庫(kù) 前7條

1 孔浩;楊勇;王國(guó)胤;;基于多分類器融合的語(yǔ)音識(shí)別方法研究[J];重慶郵電大學(xué)學(xué)報(bào)(自然科學(xué)版);2011年04期

2 周順先;林亞平;王耀南;易葉青;;基于二階隱馬爾可夫模型的文本信息抽取[J];電子學(xué)報(bào);2007年11期

3 張付志;侯娜;劉慧;馬玉靜;;一種基于啟發(fā)式搜索的論文元數(shù)據(jù)提取算法[J];計(jì)算機(jī)應(yīng)用與軟件;2009年09期

4 張銘;銀平;鄧志鴻;楊冬青;;SVM+BiHMM:基于統(tǒng)計(jì)方法的元數(shù)據(jù)抽取混合模型[J];軟件學(xué)報(bào);2008年02期

5 趙琦;劉建華;馮浩然;;從ACE會(huì)議看信息抽取技術(shù)的發(fā)展趨勢(shì)[J];現(xiàn)代圖書(shū)情報(bào)技術(shù);2008年03期

6 劉云中,林亞平,陳治平;基于隱馬爾可夫模型的文本信息抽取[J];系統(tǒng)仿真學(xué)報(bào);2004年03期

7 邱清盈;鄭國(guó)民;馮培恩;武建偉;;基于正則表達(dá)式的專利信息提取方法研究[J];中國(guó)機(jī)械工程;2007年19期

中國(guó)碩士學(xué)位論文全文數(shù)據(jù)庫(kù) 前1條

1 李瑩;文本病歷信息抽取方法研究[D];浙江大學(xué);2009年



本文編號(hào):1305083

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/wenshubaike/xingzhengshiwu/1305083.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶f1eb0***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com