天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁(yè) > 科技論文 > 搜索引擎論文 >

一種結(jié)合同義詞典和詞對(duì)共現(xiàn)距離的查詢擴(kuò)展方法

發(fā)布時(shí)間:2019-09-22 13:56
【摘要】:為了在檢索過(guò)程中全面表達(dá)查詢意愿,提出一種結(jié)合同義詞典和詞對(duì)共現(xiàn)距離的查詢擴(kuò)展方法。橫向利用同義詞典方法進(jìn)行擴(kuò)展,發(fā)揮它的簡(jiǎn)單、高效優(yōu)勢(shì);縱向利用可觀察的語(yǔ)言事實(shí)統(tǒng)計(jì)上下文詞對(duì)的共現(xiàn)距離,從而對(duì)詞匯語(yǔ)義相關(guān)性進(jìn)行精確和有效的度量,用簡(jiǎn)潔、相關(guān)的詞來(lái)擴(kuò)展查詢?cè)~。實(shí)驗(yàn)表明,該方法在實(shí)際搜索引擎中有較好效果。
【圖文】:

語(yǔ)義圖,程度圖,相關(guān)詞,共現(xiàn)


增加計(jì)算復(fù)雜程度,而且可能引入噪聲。實(shí)驗(yàn)中,取相關(guān)詞的前10個(gè)來(lái)表征該詞在上下文中語(yǔ)義,并在不同w下,計(jì)算相關(guān)詞平均權(quán)重,實(shí)驗(yàn)結(jié)果見(jiàn)圖1! 膶(shí)驗(yàn)可以看出,當(dāng)0<w<30時(shí),相關(guān)詞的平均權(quán)重隨著共現(xiàn)窗口的增大而增大;當(dāng)30<w<50時(shí),相關(guān)詞的平均權(quán)重基本穩(wěn)定;當(dāng)w>50時(shí),相關(guān)詞的平均權(quán)重微有下降。從語(yǔ)義上來(lái)講,詞與詞的潛在相關(guān)性在上下文中只在一定范圍內(nèi)才具有有效,如果超出詞的語(yǔ)義映射范圍,就會(huì)增加不必要的計(jì)算

查準(zhǔn)率,網(wǎng)頁(yè)數(shù)據(jù)庫(kù),查詢擴(kuò)展,相關(guān)詞


慮用戶查看搜索結(jié)果的習(xí)慣,人工統(tǒng)計(jì)前60條搜索結(jié)果的查準(zhǔn)率Pr@ 60(由于涉及到具體的搜索引擎的網(wǎng)頁(yè)數(shù)據(jù)庫(kù),暫時(shí)不統(tǒng)計(jì)查全率)。為了說(shuō)明該查詢擴(kuò)展方法的有效性,將本文提出的方法與不擴(kuò)展、上下文擴(kuò)展方法和同義詞典擴(kuò)展作比較,結(jié)果見(jiàn)圖2。圖1 共現(xiàn)窗口和相關(guān)詞平均權(quán)重的關(guān)系圖Fig·1 Relation between cooccurrencew indow and relevant term s weight圖2 四種擴(kuò)展的查準(zhǔn)率比較Fig·2 Comparison of four expansion strategy308
【作者單位】: 廣西大學(xué)計(jì)算機(jī)與電子信息學(xué)院;
【基金】:國(guó)家863項(xiàng)目資助項(xiàng)目(2007AA01Z403)
【分類號(hào)】:TP391.3

【參考文獻(xiàn)】

相關(guān)期刊論文 前6條

1 李莉;高慶獅;;一種基于語(yǔ)義單元的查詢擴(kuò)展方法[J];計(jì)算機(jī)科學(xué);2008年02期

2 章志凌;虞立群;陳奕秋;羅海飛;邵曉敏;;基于Corpus庫(kù)的詞語(yǔ)相似度計(jì)算方法[J];計(jì)算機(jī)應(yīng)用;2006年03期

3 胡俊峰 ,俞士汶;唐宋詩(shī)中詞匯語(yǔ)義相似度的統(tǒng)計(jì)分析及應(yīng)用[J];中文信息學(xué)報(bào);2002年04期

4 王斌,劉群,張祥;漢英雙語(yǔ)庫(kù)自動(dòng)分段對(duì)齊研究[J];軟件學(xué)報(bào);2000年11期

5 崔航,文繼榮,李敏強(qiáng);基于用戶日志的查詢擴(kuò)展統(tǒng)計(jì)模型[J];軟件學(xué)報(bào);2003年09期

6 田萱;杜小勇;李海華;;語(yǔ)義查詢擴(kuò)展中詞語(yǔ)-概念相關(guān)度的計(jì)算[J];軟件學(xué)報(bào);2008年08期

【共引文獻(xiàn)】

相關(guān)期刊論文 前10條

1 李智;;義素分析法與詞典釋義[J];北方論叢;2007年02期

2 余正濤,樊孝忠,宋麗榮;基于特定問(wèn)題類別的漢語(yǔ)問(wèn)答系統(tǒng)查詢擴(kuò)展[J];北京理工大學(xué)學(xué)報(bào);2005年10期

3 秦莉;;從“工薪族”、“上班族”二個(gè)詞語(yǔ)看民族人的詞類觀[J];才智;2008年19期

4 田久樂(lè);趙蔚;;基于同義詞詞林的詞語(yǔ)相似度計(jì)算方法[J];吉林大學(xué)學(xué)報(bào)(信息科學(xué)版);2010年06期

5 齊波;王成良;;現(xiàn)代漢語(yǔ)短語(yǔ)的機(jī)器識(shí)別[J];重慶工學(xué)院學(xué)報(bào)(自然科學(xué)版);2007年12期

6 尚福華;韓開(kāi)旭;;基于相關(guān)術(shù)語(yǔ)群和同義詞的查詢擴(kuò)展研究[J];長(zhǎng)江大學(xué)學(xué)報(bào)(自然科學(xué)版)理工卷;2010年03期

7 吳佳娣;;現(xiàn)代漢語(yǔ)方位詞的界定和甄別[J];時(shí)代教育(教育教學(xué));2011年04期

8 張俐,李晶皎,胡明涵,姚天順;中文WordNet的研究及實(shí)現(xiàn)[J];東北大學(xué)學(xué)報(bào);2003年04期

9 郗君甫;劉國(guó)華;唐軍軍;祁瑞麗;朱鶴;;基于本體的關(guān)系數(shù)據(jù)庫(kù)關(guān)鍵詞語(yǔ)義查詢擴(kuò)展方法[J];燕山大學(xué)學(xué)報(bào);2010年03期

10 李慧穎;瞿裕忠;;基于關(guān)鍵詞的RDF數(shù)據(jù)查詢方法[J];東南大學(xué)學(xué)報(bào)(自然科學(xué)版);2010年02期

相關(guān)會(huì)議論文 前10條

1 徐海;;英、漢分類詞典編纂芻議[A];中國(guó)辭書學(xué)會(huì)雙語(yǔ)詞典專業(yè)委員會(huì)第四屆年會(huì)暨學(xué)術(shù)研討會(huì)論文集[C];2001年

2 ;THE ECOMMERCE INFORMATION MODEL DRIVEN SEMANTIC SEARCHING ALGORITHM[A];Proceedings of 2006 International Symposium on Distributed Computing and Applications to Business, Engineering and Science[C];2006年

3 章志凌;虞立群;羅海飛;邵曉敏;;基于改進(jìn)Corpus庫(kù)的詞語(yǔ)相似度計(jì)算方法[A];第二十四屆中國(guó)控制會(huì)議論文集(下冊(cè))[C];2005年

4 李永宏;周一心;于洪志;;倉(cāng)央嘉措情歌的詞匯組合與節(jié)律的關(guān)系研究[A];第十屆全國(guó)人機(jī)語(yǔ)音通訊學(xué)術(shù)會(huì)議暨國(guó)際語(yǔ)音語(yǔ)言處理研討會(huì)論文摘要集[C];2009年

5 李月雷;師瑞峰;林麗冰;周一民;;漢語(yǔ)語(yǔ)句語(yǔ)義相似度的計(jì)算方法[A];2008'中國(guó)信息技術(shù)與應(yīng)用學(xué)術(shù)論壇論文集(一)[C];2008年

6 張威;張博剛;廖飛雄;陳月寧;;基于軟件運(yùn)行記錄的交互測(cè)試研究[A];第六屆中國(guó)測(cè)試學(xué)術(shù)會(huì)議論文集[C];2010年

7 高建忠;;漢語(yǔ)動(dòng)賓搭配的自動(dòng)識(shí)別研究[A];自然語(yǔ)言理解與機(jī)器翻譯——全國(guó)第六屆計(jì)算語(yǔ)言學(xué)聯(lián)合學(xué)術(shù)會(huì)議論文集[C];2001年

8 魯松;白碩;;詞距離的計(jì)算方法[A];自然語(yǔ)言理解與機(jī)器翻譯——全國(guó)第六屆計(jì)算語(yǔ)言學(xué)聯(lián)合學(xué)術(shù)會(huì)議論文集[C];2001年

9 李維剛;劉挺;王震;李生;;雙語(yǔ)語(yǔ)料庫(kù)段落重組對(duì)齊方法研究[A];語(yǔ)言計(jì)算與基于內(nèi)容的文本處理——全國(guó)第七屆計(jì)算語(yǔ)言學(xué)聯(lián)合學(xué)術(shù)會(huì)議論文集[C];2003年

10 顏偉;荀恩東;;基于WordNet的英語(yǔ)詞語(yǔ)相似度計(jì)算[A];第二屆全國(guó)學(xué)生計(jì)算語(yǔ)言學(xué)研討會(huì)論文集[C];2004年

相關(guān)博士學(xué)位論文 前10條

1 齊璇;漢語(yǔ)語(yǔ)義知識(shí)的表示及其在漢英機(jī)譯中的應(yīng)用[D];國(guó)防科學(xué)技術(shù)大學(xué);2002年

2 馬紅妹;漢英機(jī)器翻譯中漢語(yǔ)上下文語(yǔ)境的表示與應(yīng)用研究[D];中國(guó)人民解放軍國(guó)防科學(xué)技術(shù)大學(xué);2002年

3 吳健;基于Web服務(wù)的網(wǎng)絡(luò)化產(chǎn)品配置技術(shù)研究[D];浙江大學(xué);2004年

4 余衛(wèi)宇;幾種圖像結(jié)構(gòu)語(yǔ)義模型和圖像[D];華南理工大學(xué);2005年

5 李智;機(jī)器學(xué)習(xí)方法及其在基金項(xiàng)目評(píng)審中的應(yīng)用研究[D];天津大學(xué);2004年

6 曹海龍;基于詞匯化統(tǒng)計(jì)模型的漢語(yǔ)句法分析研究[D];哈爾濱工業(yè)大學(xué);2006年

7 王斌;漢英雙語(yǔ)語(yǔ)料庫(kù)自動(dòng)對(duì)齊研究[D];中國(guó)科學(xué)院研究生院(計(jì)算技術(shù)研究所);1999年

8 李曉黎;WEB信息檢索與分類中的數(shù)據(jù)采掘研究[D];中國(guó)科學(xué)院研究生院(計(jì)算技術(shù)研究所);2001年

9 魯松;自然語(yǔ)言處理中詞相關(guān)性知識(shí)無(wú)導(dǎo)獲取和均衡分類器構(gòu)建[D];中國(guó)科學(xué)院研究生院(計(jì)算技術(shù)研究所);2001年

10 郭巖;網(wǎng)絡(luò)日志中用戶興趣的挖掘及利用[D];中國(guó)科學(xué)院研究生院(計(jì)算技術(shù)研究所);2004年

相關(guān)碩士學(xué)位論文 前10條

1 呂晨;搜索競(jìng)價(jià)廣告關(guān)鍵詞優(yōu)化問(wèn)題研究[D];山東科技大學(xué);2010年

2 羅義兵;領(lǐng)域文本相似度計(jì)算方法研究[D];山東科技大學(xué);2010年

3 程國(guó)斌;基于指示詞語(yǔ)義擴(kuò)展的詞義識(shí)別方法的研究[D];哈爾濱工程大學(xué);2010年

4 張瑤;英漢機(jī)器翻譯中的英語(yǔ)動(dòng)詞漢譯研究[D];大連理工大學(xué);2010年

5 劉金盼;新聞?wù)Z料庫(kù)中基于概念網(wǎng)絡(luò)的詞語(yǔ)相關(guān)度計(jì)算[D];華東師范大學(xué);2011年

6 姚賢明;領(lǐng)域概念自動(dòng)抽取研究[D];昆明理工大學(xué);2010年

7 李春;基于本體的文本信息檢索技術(shù)研究與實(shí)現(xiàn)[D];南京航空航天大學(xué);2009年

8 高建忠;漢語(yǔ)動(dòng)賓搭配的自動(dòng)識(shí)別研究[D];北京語(yǔ)言文化大學(xué);2000年

9 王春霞;基于語(yǔ)料庫(kù)的離合詞研究[D];北京語(yǔ)言文化大學(xué);2001年

10 張春國(guó);工藝語(yǔ)句漢英計(jì)算機(jī)輔助翻譯系統(tǒng)關(guān)鍵技術(shù)研究[D];南京航空航天大學(xué);2004年

【二級(jí)參考文獻(xiàn)】

相關(guān)期刊論文 前10條

1 胡俊峰,俞士汶;唐宋詩(shī)之計(jì)算機(jī)輔助深層研究[J];北京大學(xué)學(xué)報(bào)(自然科學(xué)版);2001年05期

2 顧榕,王小平,曹立明;一種基于潛在語(yǔ)義分析的查詢擴(kuò)展算法[J];計(jì)算機(jī)工程與應(yīng)用;2004年18期

3 魯松,白碩;自然語(yǔ)言處理中詞語(yǔ)上下文有效范圍的定量描述[J];計(jì)算機(jī)學(xué)報(bào);2001年07期

4 張敏,宋睿華,馬少平;基于語(yǔ)義關(guān)系查詢擴(kuò)展的文檔重構(gòu)方法[J];計(jì)算機(jī)學(xué)報(bào);2004年10期

5 胡俊峰 ,俞士汶;唐宋詩(shī)中詞匯語(yǔ)義相似度的統(tǒng)計(jì)分析及應(yīng)用[J];中文信息學(xué)報(bào);2002年04期

6 盛秋艷,何文廣;基于Hopfield神經(jīng)網(wǎng)絡(luò)的概念檢索技術(shù)[J];情報(bào)科學(xué);2004年03期

7 羅威;基于向量空間的中文概念檢索技術(shù)研究[J];情報(bào)理論與實(shí)踐;2003年03期

8 崔航,文繼榮,李敏強(qiáng);基于用戶日志的查詢擴(kuò)展統(tǒng)計(jì)模型[J];軟件學(xué)報(bào);2003年09期

9 高小宇,高慶獅,胡s,

本文編號(hào):2540026


資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/2540026.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶0248a***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com