基于百度百科的查詢意圖分類
[Abstract]:Most web pages in the World wide Web are based on the HTML language. With the number of web pages increasing dramatically, search engines become more difficult to search. If the search engine can automatically identify the query intention, the result will be returned to classify the intention, and the user will find the corresponding query results in the intention category, which will greatly improve the user satisfaction. In the actual query, the user input query words may contain multiple query intentions, and the search engine may predict the user's query intention by analyzing the user's browsing behavior. If the search engine can automatically identify the user's query intention and sort the query results effectively, a good return result is very useful to the user. Therefore, it is the key of future search behavior that the search engine actively predicts the user's query intention. If the user input query term is short and the query information requirement is insufficient, most of the query results returned by the general search engine do not meet the query requirements of the user. In view of the inaccuracy of the query results, can search engine classify the query results according to the query intention? However, there is also a great challenge to query the classification of intention, which includes intention representation, intention scope and sentence representation. The main method of this paper is based on Baidu Encyclopedia query intention classification, encyclopedia contains many concepts and categories, and most of the concepts have specific domain keywords, each concept is composed of an article. The users input the new query words and the concepts in encyclopedia to calculate the sentence similarity, walk randomly under the most similar category, and finally get the satisfactory query results. The experimental results show that the proposed method has good experimental results.
【學位授予單位】:吉林大學
【學位級別】:碩士
【學位授予年份】:2013
【分類號】:TP391.3
【共引文獻】
相關期刊論文 前7條
1 趙火軍;溫有奎;;基于引文鏈的知識元挖掘研究[J];情報雜志;2009年03期
2 李玉紅;柴林燕;張琪;;結合分詞技術與語句相似度的主觀題自動判分算法[J];計算機工程與設計;2010年11期
3 邸書靈;劉曉飛;李歡;;基于分詞的語句相似度計算的改進[J];石家莊鐵道大學學報(自然科學版);2011年04期
4 李偉;楊思春;紀濱;;自動答疑系統(tǒng)中問題的聚類分析[J];計算機技術與發(fā)展;2012年03期
5 肖明;曾莉;;基于實例的機器翻譯系統(tǒng)的模型設計[J];西南民族大學學報(自然科學版);2009年04期
6 譚新星;江華;;基于Petri網(wǎng)的機器翻譯研究[J];譯林(學術版);2011年Z1期
7 周群芳;;相似專利檢測研究[J];現(xiàn)代圖書情報技術;2012年11期
相關碩士學位論文 前10條
1 陳繼祥;基于J2EE的網(wǎng)絡考試系統(tǒng)的研究與實現(xiàn)[D];南昌大學;2010年
2 李海光;基于位置和語義特征的中文命名實體關系抽取研究[D];合肥工業(yè)大學;2011年
3 何亞;主觀題輔助評分方法的研究與應用[D];中南大學;2010年
4 李洋;基于本體的智能電網(wǎng)知識檢索系統(tǒng)[D];北京理工大學;2011年
5 錢躍;基于文本挖掘的學者簡歷自動生成[D];大連理工大學;2011年
6 王繼遠;一種用于軟件作業(yè)評判系統(tǒng)的程序結構分析算法的設計與實現(xiàn)[D];北京郵電大學;2007年
7 張鵬;C程序相似代碼識別方法的研究與實現(xiàn)[D];大連理工大學;2008年
8 劉利軍;云南省大型科學儀器共用網(wǎng)業(yè)務系統(tǒng)關鍵技術研究[D];昆明理工大學;2008年
9 王清;基于Globish的規(guī)范子集英漢翻譯系統(tǒng)研究[D];上海師范大學;2008年
10 宋振秋;基于短語模板的機器翻譯研究[D];大連理工大學;2008年
本文編號:2353481
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/2353481.html