查詢?nèi)罩局胁樵円鈭D的自動識別
本文關(guān)鍵詞:查詢?nèi)罩局胁樵円鈭D的自動識別
更多相關(guān)文章: 查詢意圖識別 查詢?nèi)罩?/b> 用戶行為分析 C.算法
【摘要】:針對用戶對搜索引擎查詢結(jié)果滿意度不高的問題,提出一種基于用戶行為分析的查詢意圖識別方法來提高搜索引擎查詢質(zhì)量。將查詢意圖識別視為一個分類問題,分析搜狗查詢?nèi)罩景l(fā)現(xiàn):信息事務(wù)類查詢串點擊的不同頁面數(shù)較多,分布呈現(xiàn)多極值性;導(dǎo)航類查詢串點擊的不同頁面數(shù)較少,分布呈現(xiàn)單極值性;導(dǎo)航類查詢結(jié)果中,子頁面噪聲對查詢分類結(jié)果產(chǎn)生嚴重干擾。根據(jù)以上特點,提出"不同頁面點擊數(shù)"、"點擊分布值"和"異源頁面點擊數(shù)"三個特征,并結(jié)合前人研究,利用C4.5算法訓(xùn)練分類器,進行查詢意圖識別。實驗結(jié)果中查詢分類的整體正確率達到90%,與Baseline相比,提高了8.5%。結(jié)果表明,該方法對識別用戶查詢意圖是有效的。
【作者單位】: 北京信息科技大學(xué)網(wǎng)絡(luò)文化與數(shù)字傳播北京市重點實驗室;北京市城市系統(tǒng)工程研究中心;
【關(guān)鍵詞】: 查詢意圖識別 查詢?nèi)罩?/strong> 用戶行為分析 C.算法
【基金】:國家自然科學(xué)基金項目(61271304) 北京市教委科技發(fā)展計劃重點項目暨北京市自然科學(xué)基金B(yǎng)類重點項目(KZ201311232037) 北京市屬高等學(xué)校創(chuàng)新團隊建設(shè)與教師職業(yè)發(fā)展計劃項目(IDHT20130519)
【分類號】:TP391.3
【正文快照】: 京市教委科技發(fā)展計劃重點項目暨北京市自然科學(xué)基金B(yǎng)類重點項目(KZ201311232037);北京市屬高等學(xué)校創(chuàng)新團隊建設(shè)與教師職業(yè)發(fā)展計劃項目(IDHT20130519)。李煜,碩士生,主研領(lǐng)域:中文信息處理。呂學(xué)強,教授。李卓,講師。徐麗萍,副研究員。0引言搜索引擎已經(jīng)成為人們從互聯(lián)網(wǎng)上
【參考文獻】
中國期刊全文數(shù)據(jù)庫 前5條
1 李玲俐;;數(shù)據(jù)挖掘中分類算法綜述[J];重慶師范大學(xué)學(xué)報(自然科學(xué)版);2011年04期
2 付博;趙世奇;劉挺;;Web查詢?nèi)罩狙芯烤C述[J];電子學(xué)報;2013年09期
3 張宇;宋巍;劉挺;李生;;基于URL主題的查詢分類方法[J];計算機研究與發(fā)展;2012年06期
4 伍大勇;趙世奇;劉挺;張宇;;融合多類特征的Web查詢意圖識別[J];模式識別與人工智能;2012年03期
5 梅亞敏;郭敏;;基于決策樹和模糊邏輯的玉米顆粒分類研究[J];華中師范大學(xué)學(xué)報(自然科學(xué)版);2013年04期
【共引文獻】
中國期刊全文數(shù)據(jù)庫 前10條
1 傅亞莉;;數(shù)據(jù)挖掘技術(shù)C4.5算法在成績分析中的應(yīng)用[J];重慶理工大學(xué)學(xué)報(自然科學(xué));2013年11期
2 錢鷹;榮佳佳;黃穎;周莉;;一種采用支持向量機和凸包擬合的茄子識別方法[J];重慶郵電大學(xué)學(xué)報(自然科學(xué)版);2013年06期
3 朱德利;;基于Weka的就業(yè)數(shù)據(jù)分析和模式挖掘——以重慶市信管專業(yè)為例[J];重慶師范大學(xué)學(xué)報(自然科學(xué)版);2014年04期
4 李雪偉;呂學(xué)強;董志安;劉克會;;利用URL-Key進行查詢分類[J];北京大學(xué)學(xué)報(自然科學(xué)版);2015年02期
5 張新華;;基于ICA獨立成分和加權(quán)依賴貝葉斯的傳感器節(jié)點故障診斷[J];重慶師范大學(xué)學(xué)報(自然科學(xué)版);2015年02期
6 田萱;張驍;孟祥光;陳志泊;;時間敏感查詢詞補全關(guān)鍵技術(shù)研究綜述[J];電子學(xué)報;2015年06期
7 章沛;陳小瑜;;基于隨機森林分類的快速標簽檢測[J];重慶師范大學(xué)學(xué)報(自然科學(xué)版);2015年05期
8 叢雪燕;;基于誤差模型的混合分類算法[J];計算機與現(xiàn)代化;2014年01期
9 周丹晨;;融合粗糙集和商空間的企業(yè)級信息系統(tǒng)日志挖掘方法[J];計算機科學(xué);2014年S1期
10 劉一正;楊靜;李強;;基于URL的中文多語義名詞在線語義標注[J];計算機工程;2014年10期
中國博士學(xué)位論文全文數(shù)據(jù)庫 前3條
1 伍大勇;搜索引擎中命名實體查詢處理相關(guān)技術(shù)研究[D];哈爾濱工業(yè)大學(xué);2012年
2 鄭曉峰;道路運輸信息系統(tǒng)的數(shù)據(jù)挖掘方法研究與應(yīng)用[D];華南理工大學(xué);2014年
3 張曉娟;查詢意圖自動分類與分析[D];武漢大學(xué);2014年
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前10條
1 胡卉穎;基于GEP和RS的大數(shù)據(jù)集分類模型研究[D];廣西師范學(xué)院;2012年
2 吳守領(lǐng);基于粗糙集屬性約簡的決策樹分類算法的研究[D];廣西大學(xué);2012年
3 張文;魚類行為視頻在線監(jiān)測若干關(guān)鍵技術(shù)研究[D];浙江工業(yè)大學(xué);2012年
4 韓媛媛;熱計量表物聯(lián)網(wǎng)對象名解析服務(wù)系統(tǒng)的安全性研究[D];燕山大學(xué);2012年
5 常成成;基于AdaBoost-SVM的軟件缺陷優(yōu)先級預(yù)測模型的研究[D];南京郵電大學(xué);2013年
6 戰(zhàn)玉彩;基于離散Morse方法的分類挖掘研究[D];山東師范大學(xué);2013年
7 李文靜;知識管理中專家地圖的構(gòu)建技術(shù)研究[D];北京郵電大學(xué);2013年
8 嚴信;基于云模型的模糊支持向量機分類方法研究[D];太原理工大學(xué);2013年
9 孫國峰;垃圾短信治理項目風(fēng)險管理[D];南京郵電大學(xué);2012年
10 李杰;數(shù)據(jù)挖掘中關(guān)聯(lián)規(guī)則算法的分析與優(yōu)化[D];長春理工大學(xué);2013年
【二級參考文獻】
中國期刊全文數(shù)據(jù)庫 前10條
1 萬紅新,彭云,聶承啟;基于模糊集和粗糙集的關(guān)聯(lián)規(guī)則挖掘策略[J];江西師范大學(xué)學(xué)報(自然科學(xué)版);2005年01期
2 陶春梅;王洪煉;;基于組織進化和信息熵的數(shù)據(jù)驅(qū)動分類算法[J];重慶郵電大學(xué)學(xué)報(自然科學(xué)版);2009年04期
3 王柯柯;崔貫勛;倪偉;茍光磊;;基于單元的快速的大數(shù)據(jù)集離群數(shù)據(jù)挖掘算法[J];重慶郵電大學(xué)學(xué)報(自然科學(xué)版);2010年05期
4 韓立新,陳貴海,謝立;一個面向Internet的個性化信息檢索系統(tǒng)模型[J];電子學(xué)報;2002年02期
5 蔡怡峰;彭鑫;錢樂秋;;面向語義構(gòu)件檢索的交互式查詢方案生成[J];電子學(xué)報;2008年08期
6 謝海濤;孟祥武;;適應(yīng)用戶需求進化的個性化信息服務(wù)模型[J];電子學(xué)報;2011年03期
7 喬亞男;齊勇;;查詢語義圖輔助的信息檢索性能預(yù)測模型[J];電子學(xué)報;2011年S1期
8 安德智;;改進的Apriori算法在IDS中的應(yīng)用[J];河北理工大學(xué)學(xué)報(自然科學(xué)版);2011年01期
9 唐發(fā)明,陳綿云,王仲東;基于支持向量機的倉儲害蟲聲音識別[J];華中科技大學(xué)學(xué)報(自然科學(xué)版);2005年02期
10 余瑞康;施潤身;;聚類思想在貝葉斯算法中的應(yīng)用[J];計算機工程與應(yīng)用;2006年28期
中國博士學(xué)位論文全文數(shù)據(jù)庫 前1條
1 楊紅衛(wèi);小麥品質(zhì)分析的信號處理方法研究[D];中國人民解放軍信息工程大學(xué);2005年
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前1條
1 郭煒星;數(shù)據(jù)挖掘分類算法研究[D];浙江大學(xué);2008年
【相似文獻】
中國期刊全文數(shù)據(jù)庫 前10條
1 陸偉;周紅霞;張曉娟;;查詢意圖研究綜述[J];中國圖書館學(xué)報;2013年01期
2 張曉娟;陸偉;;利用查詢重構(gòu)識別查詢意圖[J];現(xiàn)代圖書情報技術(shù);2013年01期
3 江雪;孫樂;;用戶查詢意圖切分的研究[J];計算機學(xué)報;2013年03期
4 白露;郭嘉豐;曹雷;程學(xué)旗;;基于查詢意圖的長尾查詢推薦[J];計算機學(xué)報;2013年03期
5 周之誠;;基于查詢意圖聚類的實時搜索建議[J];現(xiàn)代圖書情報技術(shù);2011年02期
6 唐靜笑;呂學(xué)強;柳成洋;李涵;;用戶查詢意圖的層次化識別方法[J];現(xiàn)代圖書情報技術(shù);2014年01期
7 文軍,文貴華,丁月華;面向查詢意圖的搜索引擎設(shè)計與實現(xiàn)[J];計算機應(yīng)用研究;2002年10期
8 張美珍;王治瑩;;基于用戶查詢意圖的搜索排序算法[J];天津理工大學(xué)學(xué)報;2012年03期
9 伍大勇;趙世奇;劉挺;張宇;;融合多類特征的Web查詢意圖識別[J];模式識別與人工智能;2012年03期
10 吳曉暉;宋萍萍;張榮欣;;有無查詢意圖的分類與實現(xiàn)架構(gòu)模型研究[J];情報科學(xué);2009年12期
中國重要會議論文全文數(shù)據(jù)庫 前3條
1 王俞霖;孫樂;黃云平;李文波;;基于規(guī)則和類型還原的用戶查詢意圖識別[A];中國計算機語言學(xué)研究前沿進展(2007-2009)[C];2009年
2 高鶯;沈潔;陳滄;劉春陽;葉君峰;;一種基于排序?qū)W習(xí)的查詢意圖預(yù)測算法[A];第五屆全國信息檢索學(xué)術(shù)會議論文集[C];2009年
3 華松;洪宇;張劍峰;姚建民;朱巧明;;基于相關(guān)子主題消解的悖向重排序方法研究[A];第六屆全國信息檢索學(xué)術(shù)會議論文集[C];2010年
中國博士學(xué)位論文全文數(shù)據(jù)庫 前1條
1 宋巍;基于主題的查詢意圖識別研究[D];哈爾濱工業(yè)大學(xué);2013年
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前8條
1 張恒慶;網(wǎng)絡(luò)用戶查詢意圖分析[D];北京工業(yè)大學(xué);2014年
2 王井豐;基于百度百科的查詢意圖分類[D];吉林大學(xué);2013年
3 張苗;基于用戶查詢意圖的信息檢索技術(shù)研究與實現(xiàn)方法[D];湖南大學(xué);2013年
4 胡剛;百科知識與統(tǒng)計方法結(jié)合的查詢意圖分類[D];哈爾濱工業(yè)大學(xué);2011年
5 陳杰;基于Web檢索的查詢意圖分類研究[D];華南理工大學(xué);2011年
6 蔡桂秀;基于Markov網(wǎng)絡(luò)團的查詢意圖識別[D];江西師范大學(xué);2012年
7 張培英;基于用戶行為的用戶查詢意圖分析方法及研究[D];西華大學(xué);2011年
8 華松;檢索重排序和文獻權(quán)威度判定方法研究[D];蘇州大學(xué);2012年
,本文編號:861605
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/861605.html