基于統(tǒng)計(jì)和特征相結(jié)合的查詢糾錯(cuò)方法研究
[Abstract]:[objective] to improve the accuracy and recall rate in the process of query correction in search engine, and to improve the retrieval experience of users. [methods] A query error correction model based on statistics and features was proposed, and a confusion set generation model was established. The query keyword input by the user is used to generate its corresponding confusion set. The sorting model of confusion set is established, the items in confusion set are sorted, and the best items in confusion set are compared with the query keywords entered by users. [results] the experimental results show that the model has a good effect on search engine query. The accuracy and recall rate of the test set at 110k are 92. 2% and 95%, respectively. The accuracy and recall rate of the N-gram error correction model are improved by 13.6% and 8.3%, respectively. [conclusion] this model can improve the accuracy and efficiency of search engine query and improve the user's retrieval experience.
【作者單位】: 北方工業(yè)大學(xué)計(jì)算機(jī)學(xué)院;
【基金】:北京市社會(huì)科學(xué)基金項(xiàng)目“北京市公共危機(jī)事件在網(wǎng)絡(luò)傳播中的演化機(jī)制與模型研究”(項(xiàng)目編號:13SHC031) 國家自然科學(xué)基金項(xiàng)目“面向維基百科的多粒度一體化信息抽取方法研究”(項(xiàng)目編號:61103112)的研究成果之一
【分類號】:TP391.3
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 孔敏;方杰;羅斌;;基于圖譜歸一化編輯距離的聚類算法[J];皖西學(xué)院學(xué)報(bào);2007年05期
2 康琪;馬軍;;有向標(biāo)記根樹之間的語義編輯距離[J];模式識別與人工智能;2011年06期
3 廖宏建;楊玉寶;唐連章;;改進(jìn)的編輯距離計(jì)算及其在自動(dòng)評分中的應(yīng)用[J];廣州大學(xué)學(xué)報(bào)(自然科學(xué)版);2012年04期
4 鄒旭楷;一種有效的編輯距離和編輯路徑求解技術(shù)[J];小型微型計(jì)算機(jī)系統(tǒng);1996年07期
5 瑪依熱·依布拉音;米吉提·阿不里米提;艾斯卡爾·艾木都拉;;基于最小編輯距離的維語詞語檢錯(cuò)與糾錯(cuò)研究[J];中文信息學(xué)報(bào);2008年03期
6 趙作鵬;尹志民;王潛平;許新征;江海峰;;一種改進(jìn)的編輯距離算法及其在數(shù)據(jù)處理中的應(yīng)用[J];計(jì)算機(jī)應(yīng)用;2009年02期
7 劉坤;楊杰;;基于編輯距離的軌跡相似性度量[J];上海交通大學(xué)學(xué)報(bào);2009年11期
8 李玉擰;張晨光;;滿足度量性質(zhì)的歸一化樹編輯距離[J];北京工業(yè)大學(xué)學(xué)報(bào);2011年04期
9 鄒旭楷;漢字/字符串編輯距離和編輯路徑的有效求解技術(shù)[J];計(jì)算機(jī)研究與發(fā)展;1996年08期
10 仲紅;張守奇;張瑞;方興;李江華;;基于編輯距離的遠(yuǎn)程數(shù)據(jù)庫安全搜索協(xié)議[J];計(jì)算機(jī)技術(shù)與發(fā)展;2008年09期
相關(guān)會(huì)議論文 前2條
1 張宇;劉挺;高立琦;車萬翔;朱傳靖;;基于常問問題集的在線客服實(shí)驗(yàn)研究[A];全國第八屆計(jì)算語言學(xué)聯(lián)合學(xué)術(shù)會(huì)議(JSCL-2005)論文集[C];2005年
2 宋銳;林鴻飛;;面向中文新聞?lì)I(lǐng)域的移動(dòng)摘要系統(tǒng)[A];第三屆全國信息檢索與內(nèi)容安全學(xué)術(shù)會(huì)議論文集[C];2007年
相關(guān)碩士學(xué)位論文 前10條
1 劉永強(qiáng);基于編輯距離圖嵌入的圖匹配算法研究[D];西安建筑科技大學(xué);2015年
2 楊薇;基于編輯距離的圖相似性查詢處理[D];燕山大學(xué);2015年
3 韋龍寶;Tai樹編輯距離算法的存儲優(yōu)化與樹的縱向歸并算法[D];中國工程物理研究院;2015年
4 王冬;基于貝葉斯方法和編輯距離的英文語法檢查系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)[D];電子科技大學(xué);2014年
5 王培培;編輯距離快速算法研究[D];東北大學(xué);2011年
6 齊彩霞;基于圖編輯距離的圖匹配算法研究[D];西安建筑科技大學(xué);2013年
7 和彥莉;基于圖編輯距離的畫像識別[D];西安電子科技大學(xué);2010年
8 解天書;基于編輯距離算法的中文模糊匹配技術(shù)在大數(shù)據(jù)量環(huán)境中的應(yīng)用[D];湖北大學(xué);2013年
9 王春雨;基于編輯距離的字符串模式匹配算法研究[D];燕山大學(xué);2015年
10 吳波;改進(jìn)的編輯距離算法的研究及其在電子政務(wù)中的應(yīng)用[D];電子科技大學(xué);2011年
,本文編號:2352888
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/2352888.html