天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 搜索引擎論文 >

基于搜索引擎的詞匯語義相似度計算方法

發(fā)布時間:2017-08-23 16:03

  本文關(guān)鍵詞:基于搜索引擎的詞匯語義相似度計算方法


  更多相關(guān)文章: 語義相似度 信息檢索 查詢建議 網(wǎng)絡(luò)檢索


【摘要】:詞匯語義相似度的計算在網(wǎng)頁瀏覽和查詢推薦等網(wǎng)絡(luò)相關(guān)工作中起著重要的作用。傳統(tǒng)的基于分類的方法不能處理持續(xù)出現(xiàn)的新詞。由于網(wǎng)絡(luò)數(shù)據(jù)中隱藏著大量的噪音和冗余,魯棒性和準(zhǔn)確性仍然是一個挑戰(zhàn),因此提出了一種基于搜索引擎的詞匯語義相似度計算方法。語義片段和檢索結(jié)果的頁數(shù)被用來去除詞匯語義相似度計算過程中的噪音和冗余。此外,還提出了一種方法來整合查詢結(jié)果頁數(shù)、語義片段和顯示的搜索結(jié)果的數(shù)量,該方法不需要任何先驗知識與本體。實驗結(jié)果顯示,所提出的方法在Rubenstein-Goodenough測試集的相關(guān)系數(shù)為0.851,優(yōu)于現(xiàn)有的基于網(wǎng)絡(luò)的詞匯語義相似度計算方法,同時在搜索引擎的查詢擴展任務(wù)中具有較為良好的應(yīng)用效果。
【作者單位】: 華東政法大學(xué)計算機科學(xué)與技術(shù)系;
【關(guān)鍵詞】語義相似度 信息檢索 查詢建議 網(wǎng)絡(luò)檢索
【基金】:國家社會科學(xué)基金項目(06BFX051) 上海高校選拔培養(yǎng)優(yōu)秀青年教師科研專項基金(hzf05046)資助
【分類號】:TP391.1
【正文快照】: 1引言詞匯語義相似度的研究在學(xué)術(shù)研究和應(yīng)用中都是一個重要的問題。例如:詞義消歧[1]、知識流構(gòu)造[2-5]、圖像檢索[6]、自然語言處理[7]、主題檢測[8]、查詢推薦等[9]。近年來,隨著網(wǎng)絡(luò)的快速發(fā)展,在許多Web相關(guān)任務(wù)中詞匯語義相似度的計算也越來越重要。在查詢推薦方面[10],

【相似文獻】

中國期刊全文數(shù)據(jù)庫 前10條

1 蔡東風(fēng);白宇;于水;葉娜;任曉娜;;一種基于語境的詞語相似度計算方法[J];中文信息學(xué)報;2010年03期

2 丁政建;張路;;一種改進的本體相似度計算方法[J];計算機工程;2010年24期

3 朱珍元;鄭誠;;一種改進的本體相似度計算方法[J];微型機與應(yīng)用;2011年01期

4 崔韜世;麥范金;;詞語相似度計算方法分析[J];網(wǎng)絡(luò)安全技術(shù)與應(yīng)用;2012年05期

5 王國春;鄭山紅;趙輝;董亞則;;基于階段遞進的綜合本體相似度計算方法[J];吉林大學(xué)學(xué)報(信息科學(xué)版);2014年02期

6 張忠平;田淑霞;劉洪強;;一種新的本體相似度計算方法[J];計算機應(yīng)用研究;2008年10期

7 趙歡;李仁發(fā);王家琴;張在美;;綜合多層信息的本體概念相似度計算方法的研究[J];通信學(xué)報;2009年06期

8 李改;李章鳳;李磊;;一種新的社會化相似度計算方法[J];計算機應(yīng)用研究;2013年09期

9 曾輝;徐海洲;鐘茂生;;基于主題和焦點的問句相似度計算方法[J];科學(xué)技術(shù)與工程;2014年06期

10 張忠平;田淑霞;劉洪強;;一種綜合的本體相似度計算方法[J];計算機科學(xué);2008年12期

中國重要會議論文全文數(shù)據(jù)庫 前8條

1 白宇;于水;葉娜;蔡東風(fēng);任曉娜;;一種基于語境的詞語相似度計算方法[A];第五屆全國信息檢索學(xué)術(shù)會議論文集[C];2009年

2 喬林;黃維通;孟威;;一種改進的知網(wǎng)系統(tǒng)詞語相似度計算方法[A];全國第八屆計算語言學(xué)聯(lián)合學(xué)術(shù)會議(JSCL-2005)論文集[C];2005年

3 菅小艷;鄭家恒;;一種改進的句子相似度計算方法[A];第二屆全國信息檢索與內(nèi)容安全學(xué)術(shù)會議(NCIRCS-2005)論文集[C];2005年

4 盧延科;尹寶生;張桂平;苗雪雷;白宇;;基于偽LCS的中文專利句子相似度計算方法[A];第五屆全國信息檢索學(xué)術(shù)會議論文集[C];2009年

5 章志凌;虞立群;羅海飛;邵曉敏;;基于改進Corpus庫的詞語相似度計算方法[A];第二十四屆中國控制會議論文集(下冊)[C];2005年

6 章成志;李斌;;基于混合策略的查詢串相似度計算方法[A];全國第八屆計算語言學(xué)聯(lián)合學(xué)術(shù)會議(JSCL-2005)論文集[C];2005年

7 陳希友;馮少榮;張東站;薛永生;;基于反饋的用戶訪問預(yù)測模型[A];第二十五屆中國數(shù)據(jù)庫學(xué)術(shù)會議論文集(一)[C];2008年

8 李天寧;肖桐;朱靖波;;科技論文的IPC自動標(biāo)注[A];第四屆全國信息檢索與內(nèi)容安全學(xué)術(shù)會議論文集(上)[C];2008年

中國博士學(xué)位論文全文數(shù)據(jù)庫 前2條

1 蔡圓媛;基于知識整合的詞匯語義相似度計算方法研究[D];北京交通大學(xué);2016年

2 吳小坤;輕量級服務(wù)推薦算法研究[D];北京郵電大學(xué);2015年

中國碩士學(xué)位論文全文數(shù)據(jù)庫 前10條

1 唐積益;推薦系統(tǒng)中相似度計算方法的研究[D];江蘇科技大學(xué);2015年

2 張廣源;微博檢索系統(tǒng)關(guān)鍵技術(shù)研究與實現(xiàn)[D];北京工業(yè)大學(xué);2015年

3 尹路修;XML文檔的聚類研究[D];湖南師范大學(xué);2015年

4 鄒能清;一種基于語義網(wǎng)絡(luò)的中文文本相似度計算方法[D];湘潭大學(xué);2015年

5 鄔明強;基于分段融合的藏文文本相似度計算方法研究[D];西北民族大學(xué);2016年

6 呂亞偉;食品安全網(wǎng)絡(luò)輿情監(jiān)測方法研究[D];北京化工大學(xué);2016年

7 王璐;一種綜合多層次信息的句子相似度計算方法研究[D];重慶大學(xué);2016年

8 高鵬楊;基于多標(biāo)簽學(xué)習(xí)框架的微博文本分類研究[D];東南大學(xué);2016年

9 萬青云;并行LDA、聚類算法的研究及應(yīng)用[D];南昌大學(xué);2016年

10 陳欣;一種基于多屬性本體的概念相似度計算方法的研究[D];東北師范大學(xué);2010年

,

本文編號:725948

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/725948.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶25e60***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com