天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 搜索引擎論文 >

基于統(tǒng)計和特征相結(jié)合的查詢糾錯方法研究

發(fā)布時間:2018-11-24 07:59
【摘要】:【目的】提高搜索引擎查詢糾錯過程中的準(zhǔn)確率和召回率,改善用戶的檢索體驗!痉椒ā刻岢鲆环N基于統(tǒng)計和特征相結(jié)合的查詢糾錯模型,建立混淆集生成模型,將用戶輸入的查詢關(guān)鍵字生成其對應(yīng)的混淆集;建立混淆集排序模型,對混淆集中的詞條進行排序,選出混淆集中最佳的詞條與用戶輸入的查詢關(guān)鍵字對照,以此達(dá)到查錯糾錯的目的!窘Y(jié)果】實驗結(jié)果證明該模型在搜索引擎查詢時具有較好的效果,測試集在110k時的準(zhǔn)確率和召回率分別達(dá)到92.2%和95%,相對于N-gram糾錯模型準(zhǔn)確率和召回率分別提高13.6%和8.3%!揪窒蕖吭撃P椭谢煜纳梢(guī)則有限、模型的訓(xùn)練需要大量的計算!窘Y(jié)論】本模型能夠提高搜索引擎查詢的準(zhǔn)確率及效率,改善用戶的檢索體驗。
[Abstract]:[objective] to improve the accuracy and recall rate in the process of query correction in search engine, and to improve the retrieval experience of users. [methods] A query error correction model based on statistics and features was proposed, and a confusion set generation model was established. The query keyword input by the user is used to generate its corresponding confusion set. The sorting model of confusion set is established, the items in confusion set are sorted, and the best items in confusion set are compared with the query keywords entered by users. [results] the experimental results show that the model has a good effect on search engine query. The accuracy and recall rate of the test set at 110k are 92. 2% and 95%, respectively. The accuracy and recall rate of the N-gram error correction model are improved by 13.6% and 8.3%, respectively. [conclusion] this model can improve the accuracy and efficiency of search engine query and improve the user's retrieval experience.
【作者單位】: 北方工業(yè)大學(xué)計算機學(xué)院;
【基金】:北京市社會科學(xué)基金項目“北京市公共危機事件在網(wǎng)絡(luò)傳播中的演化機制與模型研究”(項目編號:13SHC031) 國家自然科學(xué)基金項目“面向維基百科的多粒度一體化信息抽取方法研究”(項目編號:61103112)的研究成果之一
【分類號】:TP391.3

【相似文獻】

相關(guān)期刊論文 前10條

1 孔敏;方杰;羅斌;;基于圖譜歸一化編輯距離的聚類算法[J];皖西學(xué)院學(xué)報;2007年05期

2 康琪;馬軍;;有向標(biāo)記根樹之間的語義編輯距離[J];模式識別與人工智能;2011年06期

3 廖宏建;楊玉寶;唐連章;;改進的編輯距離計算及其在自動評分中的應(yīng)用[J];廣州大學(xué)學(xué)報(自然科學(xué)版);2012年04期

4 鄒旭楷;一種有效的編輯距離和編輯路徑求解技術(shù)[J];小型微型計算機系統(tǒng);1996年07期

5 瑪依熱·依布拉音;米吉提·阿不里米提;艾斯卡爾·艾木都拉;;基于最小編輯距離的維語詞語檢錯與糾錯研究[J];中文信息學(xué)報;2008年03期

6 趙作鵬;尹志民;王潛平;許新征;江海峰;;一種改進的編輯距離算法及其在數(shù)據(jù)處理中的應(yīng)用[J];計算機應(yīng)用;2009年02期

7 劉坤;楊杰;;基于編輯距離的軌跡相似性度量[J];上海交通大學(xué)學(xué)報;2009年11期

8 李玉擰;張晨光;;滿足度量性質(zhì)的歸一化樹編輯距離[J];北京工業(yè)大學(xué)學(xué)報;2011年04期

9 鄒旭楷;漢字/字符串編輯距離和編輯路徑的有效求解技術(shù)[J];計算機研究與發(fā)展;1996年08期

10 仲紅;張守奇;張瑞;方興;李江華;;基于編輯距離的遠(yuǎn)程數(shù)據(jù)庫安全搜索協(xié)議[J];計算機技術(shù)與發(fā)展;2008年09期

相關(guān)會議論文 前2條

1 張宇;劉挺;高立琦;車萬翔;朱傳靖;;基于常問問題集的在線客服實驗研究[A];全國第八屆計算語言學(xué)聯(lián)合學(xué)術(shù)會議(JSCL-2005)論文集[C];2005年

2 宋銳;林鴻飛;;面向中文新聞領(lǐng)域的移動摘要系統(tǒng)[A];第三屆全國信息檢索與內(nèi)容安全學(xué)術(shù)會議論文集[C];2007年

相關(guān)碩士學(xué)位論文 前10條

1 劉永強;基于編輯距離圖嵌入的圖匹配算法研究[D];西安建筑科技大學(xué);2015年

2 楊薇;基于編輯距離的圖相似性查詢處理[D];燕山大學(xué);2015年

3 韋龍寶;Tai樹編輯距離算法的存儲優(yōu)化與樹的縱向歸并算法[D];中國工程物理研究院;2015年

4 王冬;基于貝葉斯方法和編輯距離的英文語法檢查系統(tǒng)設(shè)計與實現(xiàn)[D];電子科技大學(xué);2014年

5 王培培;編輯距離快速算法研究[D];東北大學(xué);2011年

6 齊彩霞;基于圖編輯距離的圖匹配算法研究[D];西安建筑科技大學(xué);2013年

7 和彥莉;基于圖編輯距離的畫像識別[D];西安電子科技大學(xué);2010年

8 解天書;基于編輯距離算法的中文模糊匹配技術(shù)在大數(shù)據(jù)量環(huán)境中的應(yīng)用[D];湖北大學(xué);2013年

9 王春雨;基于編輯距離的字符串模式匹配算法研究[D];燕山大學(xué);2015年

10 吳波;改進的編輯距離算法的研究及其在電子政務(wù)中的應(yīng)用[D];電子科技大學(xué);2011年



本文編號:2352888

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/2352888.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶4dadf***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com