基于線性回歸的相關(guān)查詢推薦
本文選題:查詢?nèi)罩?/strong> 切入點(diǎn):查詢會話 出處:《高技術(shù)通訊》2010年06期
【摘要】:在分析搜索引擎查詢?nèi)罩镜幕A(chǔ)上,提出了一種基于線性回歸的相關(guān)查詢推薦方法。該方法考慮了查詢串之間的多種關(guān)聯(lián)關(guān)系,包括查詢串會話共現(xiàn)、點(diǎn)擊頁面共享和查詢串文本相似性,以避免因直接應(yīng)用查詢串之間的部分關(guān)聯(lián)關(guān)系造成易受查詢?nèi)罩局性胍舻挠绊。相比以往的方?采用線性回歸的方法來識別相關(guān)查詢推薦的有效特征,能更好地解決噪音問題和進(jìn)行有效的相關(guān)查詢推薦。實(shí)驗(yàn)證實(shí),采用線性回歸挖掘的識別中文相關(guān)查詢串的特征非常有效,且所提出的回歸模型的預(yù)測準(zhǔn)確率優(yōu)于現(xiàn)有的方法。
[Abstract]:Based on the analysis of search engine query log, this paper proposes a linear regression based recommendation method for related queries, which takes into account a variety of correlation relationships between query strings, including the co-occurrence of query string sessions. Click page sharing and query string text similarity, to avoid the direct application of query strings between some of the association relationship is vulnerable to the impact of noise in the query log. The linear regression method is used to identify the effective features of the related query recommendation, which can better solve the noise problem and make effective related query recommendation. The feature recognition of Chinese correlation query string by linear regression mining is very effective, and the prediction accuracy of the proposed regression model is better than that of the existing methods.
【作者單位】: 中國科學(xué)技術(shù)大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)系;中國科學(xué)院計(jì)算技術(shù)研究所信息智能與信息安全研究中心;
【基金】:863計(jì)劃(2006AA010105,2007AA01Z416)資助項(xiàng)目
【分類號】:TP391.3
【參考文獻(xiàn)】
相關(guān)期刊論文 前1條
1 崔航,文繼榮,李敏強(qiáng);基于用戶日志的查詢擴(kuò)展統(tǒng)計(jì)模型[J];軟件學(xué)報(bào);2003年09期
【共引文獻(xiàn)】
相關(guān)期刊論文 前10條
1 余正濤,樊孝忠,宋麗榮;基于特定問題類別的漢語問答系統(tǒng)查詢擴(kuò)展[J];北京理工大學(xué)學(xué)報(bào);2005年10期
2 尚福華;韓開旭;;基于相關(guān)術(shù)語群和同義詞的查詢擴(kuò)展研究[J];長江大學(xué)學(xué)報(bào)(自然科學(xué)版)理工卷;2010年03期
3 肖海鵬;鄧曉衡;;基于Web挖掘的關(guān)鍵詞建議模型研究[J];電腦知識與技術(shù);2012年13期
4 霍林;王力;黃俊文;潘英花;;一種結(jié)合同義詞典和詞對共現(xiàn)距離的查詢擴(kuò)展方法[J];廣西大學(xué)學(xué)報(bào)(自然科學(xué)版);2010年02期
5 何攀;劉露;陳犖;王祖文;;基于用戶偏好的地理計(jì)算應(yīng)用檢索[J];兵工自動化;2012年10期
6 張威;張博剛;廖飛雄;陳月寧;;基于軟件運(yùn)行記錄的交互測試研究[J];計(jì)算機(jī)研究與發(fā)展;2010年S1期
7 熊忠陽;向海燕;張玉芳;;結(jié)合用戶日志的局部上下文分析方法[J];計(jì)算機(jī)工程與應(yīng)用;2012年12期
8 郭巖;白碩;于滿泉;;Web使用信息挖掘綜述[J];計(jì)算機(jī)科學(xué);2005年01期
9 李莉;高慶獅;;一種基于語義單元的查詢擴(kuò)展方法[J];計(jì)算機(jī)科學(xué);2008年02期
10 田萱;李冬梅;;上下文信息檢索研究綜述[J];計(jì)算機(jī)科學(xué);2011年09期
相關(guān)會議論文 前10條
1 張威;張博剛;廖飛雄;陳月寧;;基于軟件運(yùn)行記錄的交互測試研究[A];第六屆中國測試學(xué)術(shù)會議論文集[C];2010年
2 王洪俊;賴志國;施水才;肖詩斌;;基于查詢?nèi)罩镜牟樵兘ㄗh挖掘[A];NCIRCS2004第一屆全國信息檢索與內(nèi)容安全學(xué)術(shù)會議論文集[C];2004年
3 盛俊;王明文;余俊英;;一種基于潛在語義的Markov網(wǎng)絡(luò)信息檢索模型[A];第二屆全國信息檢索與內(nèi)容安全學(xué)術(shù)會議(NCIRCS-2005)論文集[C];2005年
4 徐小琴;章成志;;Web信息檢索中相關(guān)詞提示技術(shù)與評測[A];第三屆學(xué)生計(jì)算語言學(xué)研討會論文集[C];2006年
5 章成志;蘇蘭芳;;基于多語境的相關(guān)詞自動提取[A];第三屆學(xué)生計(jì)算語言學(xué)研討會論文集[C];2006年
6 陳志瑋;肖詩斌;施水才;王昕;;一種基于HTML位置信息的查詢擴(kuò)展技術(shù)[A];第三屆學(xué)生計(jì)算語言學(xué)研討會論文集[C];2006年
7 劉悅;許洪波;程學(xué)旗;;互聯(lián)網(wǎng)挖掘和搜索的研究進(jìn)展[A];中文信息處理前沿進(jìn)展——中國中文信息學(xué)會二十五周年學(xué)術(shù)會議論文集[C];2006年
8 吳京慧;余珊珊;王明文;;基于用戶日志聚類的查詢擴(kuò)展模型[A];第三屆全國信息檢索與內(nèi)容安全學(xué)術(shù)會議論文集[C];2007年
9 李東園;白宇;蔡東風(fēng);;基于用戶日志分析的查詢擴(kuò)展研究[A];第四屆全國學(xué)生計(jì)算語言學(xué)研討會會議論文集[C];2008年
10 張志強(qiáng);孟慶海;謝曉芹;;個(gè)性化的社會標(biāo)簽查詢擴(kuò)展技術(shù)研究[A];NDBC2010第27屆中國數(shù)據(jù)庫學(xué)術(shù)會議論文集A輯二[C];2010年
相關(guān)博士學(xué)位論文 前10條
1 陳冬玲;基于潛在語義的個(gè)性化搜索關(guān)鍵技術(shù)研究[D];東北大學(xué);2009年
2 李智;機(jī)器學(xué)習(xí)方法及其在基金項(xiàng)目評審中的應(yīng)用研究[D];天津大學(xué);2004年
3 郭巖;網(wǎng)絡(luò)日志中用戶興趣的挖掘及利用[D];中國科學(xué)院研究生院(計(jì)算技術(shù)研究所);2004年
4 蔡柯柯;基于查詢特征上下文的檢索模型研究[D];浙江大學(xué);2007年
5 田萱;基于上下文的信息檢索關(guān)鍵技術(shù)研究[D];中國人民大學(xué);2007年
6 吳陳;粒和粗集研究及與證據(jù)理論相結(jié)合在不完備數(shù)據(jù)處理中的應(yīng)用[D];南京理工大學(xué);2007年
7 李粵;引文網(wǎng)絡(luò)的可調(diào)優(yōu)先粘貼模型及其應(yīng)用[D];清華大學(xué);2007年
8 羅娜;基于本體的主題爬行技術(shù)研究[D];吉林大學(xué);2009年
9 林建方;詞搭配抽取及在信息檢索中的應(yīng)用研究[D];哈爾濱工業(yè)大學(xué);2010年
10 朱鯤鵬;基于Web日志挖掘的智能信息檢索研究[D];哈爾濱工業(yè)大學(xué);2009年
相關(guān)碩士學(xué)位論文 前10條
1 呂晨;搜索競價(jià)廣告關(guān)鍵詞優(yōu)化問題研究[D];山東科技大學(xué);2010年
2 楊海南;基于語義詞典和局部分析的查詢擴(kuò)展研究[D];武漢理工大學(xué);2010年
3 趙春輝;基于關(guān)聯(lián)規(guī)則挖掘的查詢擴(kuò)展[D];河南大學(xué);2011年
4 李雷;基于Nutch的農(nóng)業(yè)信息搜索引擎實(shí)現(xiàn)和優(yōu)化[D];吉林大學(xué);2011年
5 劉亞妮;搜索競價(jià)廣告關(guān)鍵詞優(yōu)化算法與實(shí)驗(yàn)[D];電子科技大學(xué);2011年
6 王晶;基于領(lǐng)域本體擴(kuò)展查詢的文本信息檢索研究[D];東北石油大學(xué);2011年
7 韓開旭;基于查詢擴(kuò)展的油田網(wǎng)絡(luò)輿情監(jiān)控系統(tǒng)[D];東北石油大學(xué);2011年
8 崔琰;基于用戶興趣及術(shù)語關(guān)系的查詢擴(kuò)展方法[D];河北大學(xué);2011年
9 余強(qiáng);基于語義的設(shè)計(jì)知識個(gè)性化檢索技術(shù)研究及應(yīng)用[D];南京航空航天大學(xué);2010年
10 胡川洌;基于本體的教學(xué)資源語義檢索研究[D];重慶大學(xué);2011年
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 馬云龍;林原;林鴻飛;;基于權(quán)重標(biāo)準(zhǔn)化SimRank方法的查詢擴(kuò)展技術(shù)研究[J];中文信息學(xué)報(bào);2011年01期
2 張磊;李亞楠;王斌;李鵬;蔣在帆;;網(wǎng)頁搜索引擎查詢?nèi)罩镜腟ession劃分研究[J];中文信息學(xué)報(bào);2009年02期
3 馬嘉賽;張永軍;;最小方方法的一種優(yōu)化方法[J];山東大學(xué)學(xué)報(bào)(理學(xué)版);2006年03期
4 ;[J];;年期
5 ;[J];;年期
6 ;[J];;年期
7 ;[J];;年期
8 ;[J];;年期
9 ;[J];;年期
10 ;[J];;年期
相關(guān)會議論文 前5條
1 王洪俊;賴志國;施水才;肖詩斌;;基于查詢?nèi)罩镜牟樵兘ㄗh挖掘[A];NCIRCS2004第一屆全國信息檢索與內(nèi)容安全學(xué)術(shù)會議論文集[C];2004年
2 吳京慧;余珊珊;王明文;;基于用戶日志聚類的查詢擴(kuò)展模型[A];第三屆全國信息檢索與內(nèi)容安全學(xué)術(shù)會議論文集[C];2007年
3 張磊;李亞楠;王斌;李鵬;蔣在帆;;網(wǎng)頁搜索引擎查詢?nèi)罩镜膕ession劃分研究[A];第四屆全國信息檢索與內(nèi)容安全學(xué)術(shù)會議論文集(上)[C];2008年
4 羅準(zhǔn)辰;王挺;;搜索詞同現(xiàn)網(wǎng)絡(luò)研究[A];第六屆全國信息檢索學(xué)術(shù)會議論文集[C];2010年
5 馬云龍;林鴻飛;;基于權(quán)重標(biāo)準(zhǔn)化SimRank方法的查詢擴(kuò)展技術(shù)研究[A];第六屆全國信息檢索學(xué)術(shù)會議論文集[C];2010年
相關(guān)碩士學(xué)位論文 前3條
1 李東園;問答系統(tǒng)中相關(guān)文檔檢索技術(shù)的研究[D];沈陽航空工業(yè)學(xué)院;2009年
2 賀海波;基于日志挖掘的查詢詞推薦研究與實(shí)現(xiàn)[D];北京郵電大學(xué);2010年
3 朱丹梅;搜索引擎作弊檢測方法研究[D];南京郵電大學(xué);2011年
,本文編號:1683297
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/1683297.html