天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 軟件論文 >

一種基于大規(guī)模知識庫的語義相似性計算方法

發(fā)布時間:2018-03-30 17:15

  本文選題:大規(guī)模知識庫 切入點:語義相似性 出處:《計算機研究與發(fā)展》2017年11期


【摘要】:人類知識總量不斷增加,依靠人類產(chǎn)生的結(jié)構(gòu)化大數(shù)據(jù)進行語義分析在推薦系統(tǒng)和信息檢索等領(lǐng)域都有著重要的應(yīng)用.在這些領(lǐng)域中,首要解決的問題是語義相似性計算,之前的研究通過運用以維基百科為代表的大規(guī)模知識庫取得了一定突破,但是其中的路徑并沒有被充分利用.研究基于人類思考方式的雙向最短路徑算法進行單詞和文本的相似性評估,以充分利用知識庫中的路徑信息.提出的算法通過在維基百科中抽取出顆粒度比詞條更細(xì)密的節(jié)點之間的超鏈接關(guān)系,并首次驗證了維基百科之間的普遍連通性,并對2個詞條之間的平均最短路徑長度進行評估.最后,在公開數(shù)據(jù)集上進行的實驗結(jié)果顯示,算法在單詞相似度得分上明顯優(yōu)于現(xiàn)有算法,在文本相似度的得分上趨于先進水平.
[Abstract]:The amount of human knowledge is increasing constantly, and it has important applications in the fields of recommendation system and information retrieval to carry out semantic analysis based on the structural big data produced by human beings.In these fields, the most important problem is semantic similarity calculation. Previous research has made a breakthrough by using the large-scale knowledge base represented by Wikipedia, but the path has not been fully utilized.A bidirectional shortest path algorithm based on human thinking is studied to evaluate the similarity of words and texts in order to make full use of the path information in the knowledge base.The proposed algorithm extracts hyperlinks between nodes with finer granularity than entries in Wikipedia, and for the first time verifies the universal connectivity between Wikipedia.The average shortest path length between two entries is evaluated.Finally, the experimental results on the open datasets show that the algorithm is superior to the existing algorithms in word similarity score, and tends to the advanced level in the text similarity score.
【作者單位】: 中國科學(xué)院軟件研究所;中國科學(xué)院大學(xué);
【基金】:中國科學(xué)院系統(tǒng)優(yōu)化基金項目(Y42901VED2,Y42901VEB1,Y42901VEB2)~~
【分類號】:TP391.1

【相似文獻】

相關(guān)期刊論文 前10條

1 于嘉;網(wǎng)絡(luò)時代的百科全書——維基百科[J];圖書館論壇;2005年04期

2 尹開國;;自由人的自由聯(lián)合:維基百科評介[J];圖書情報工作;2007年02期

3 徐爭榮;;構(gòu)建電影專業(yè)維基百科的設(shè)想[J];圖書情報工作;2009年S1期

4 何筠紅;;在線共享的自由百科全書——維基百科[J];新世紀(jì)圖書館;2006年04期

5 金姬;;危機籠罩維基[J];新民周刊;2013年47期

6 王蘭成;劉曉亮;;維基百科知網(wǎng)的構(gòu)建研究與應(yīng)用進展[J];情報資料工作;2012年05期

7 壽思聰;姚從磊;李曉明;;發(fā)現(xiàn)維基百科文章相關(guān)圖片[J];計算機科學(xué)與探索;2011年07期

8 張海粟;馬大明;鄧智龍;;基于維基百科的語義知識庫及其構(gòu)建方法研究[J];計算機應(yīng)用研究;2011年08期

9 金姬;;網(wǎng)絡(luò)烏托邦之路[J];新民周刊;2013年47期

10 徐蔓;;誰在撼動維基百科[J];互聯(lián)網(wǎng)周刊;2008年01期

相關(guān)會議論文 前4條

1 孟新萍;王會珍;張俐;;維基百科人物屬性自動獲取方法研究[A];第五屆全國青年計算語言學(xué)研討會論文集[C];2010年

2 張葦如;孫樂;韓先培;;基于維基百科和模式聚類的實體關(guān)系抽取方法[A];中國計算語言學(xué)研究前沿進展(2009-2011)[C];2011年

3 謝科;劉奕群;岑榮偉;馬少平;茹立云;楊磊;;基于維基百科層次分類框架的主題推薦系統(tǒng)的研究[A];中國計算語言學(xué)研究前沿進展(2009-2011)[C];2011年

4 溫粉蓮;唐常杰;喬少杰;許剛;劉威;左R,

本文編號:1686854


資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/1686854.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶638ab***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com