基于用戶評價的查詢串與搜索結果特征權重計算
[Abstract]:In this paper, a method of calculating feature weights using a large number of user evaluation results is proposed, which is used to solve the similarity analysis between query strings and search results in search engines. The method makes full use of the user's "potential evaluation" of search results. The user's click on the input query string reflects its internal relevance, which can be obtained by the proposed method. The mathematical model of the problem is established, and the calculation of feature weights is solved by using EM algorithm. Because the functions of the model are complex, it is difficult to calculate the convergence of the model. Therefore, the simulated annealing algorithm is used as a supplement to the EM algorithm to verify the convergence of the algorithm. The experiment uses Baidu search engine to carry out the bidding advertisement. The test data samples are 100 ads and 144,132 query, data. The results show that all the features converge to the global optimal solution. The retrieval accuracy of sampling data was 93.32 and the recall rate was 87.43.
【作者單位】: 北京科技大學信息工程學院 北京科技大學信息工程學院 北京科技大學信息工程學院
【分類號】:TP391.4
【參考文獻】
相關期刊論文 前3條
1 張士峰;混合正態(tài)分布參數(shù)極大似然估計的EM算法[J];飛行器測控學報;2004年04期
2 王偉,鐘義信,孫建,楊力;一種基于EM非監(jiān)督訓練的自組織分詞歧義解決方案[J];中文信息學報;2001年02期
3 李家福,張亞非;基于EM算法的漢語自動分詞方法[J];情報學報;2002年03期
【共引文獻】
相關期刊論文 前10條
1 文庭孝;漢語自動分詞研究進展[J];圖書與情報;2005年05期
2 王微;石志廣;趙宏鐘;付強;;用期望最大化算法抑制角閃爍的預處理方法[J];電光與控制;2009年05期
3 魯強;金偉祖;;基于FMM和CRFs雙層分詞模型的研究[J];電腦知識與技術;2008年28期
4 李紅霞;易麗萍;;EM無監(jiān)督漢語分詞算法[J];電腦知識與技術;2009年12期
5 劉向沖;侯翠霞;申維;張德會;;MML-EM方法及其在化探數(shù)據混合分布中的應用[J];地球科學(中國地質大學學報);2011年02期
6 劉曉英;漢語自動分詞研究的發(fā)展趨勢[J];高校圖書館工作;2005年04期
7 楊哲海;張俊;李之歆;;低通濾波器在高光譜影像分類中的應用[J];海洋測繪;2011年05期
8 解烈軍,侯曉榮,周彩蓮;基于規(guī)則的幾何語言自動分詞算法[J];淮陰師范學院學報(自然科學版);2004年02期
9 曾華琳,李堂秋,史曉東;一種基于提取上下文信息的分詞算法[J];計算機應用;2005年09期
10 吳春穎;王士同;;基于二元語法的N-最大概率中文粗分模型[J];計算機應用;2007年12期
相關會議論文 前1條
1 曾華琳;史曉東;李堂秋;;基于上下文信息提取的概率分詞算法[A];第六屆漢語詞匯語義學研討會論文集[C];2005年
相關博士學位論文 前8條
1 彭強;復雜系統(tǒng)遠程智能故障診斷技術研究[D];南京理工大學;2004年
2 錢俊;單幅雷達影像測圖原理研究[D];武漢大學;2004年
3 喬林;基于多關鍵詞檢索的企業(yè)競爭情報搜集方法研究[D];中國科學技術大學;2006年
4 劉濤;現(xiàn)代信息檢索中的文本分類及圖像恢復研究[D];北京郵電大學;2006年
5 楊哲海;高光譜影像分類若干關鍵技術的研究[D];解放軍信息工程大學;2006年
6 王闐;信息度優(yōu)先算法及在森林資源統(tǒng)計分析中的應用[D];南京林業(yè)大學;2007年
7 鄧巍;噴霧圖像處理及脈寬調制(PWM)變量噴霧的霧化特性研究[D];南京農業(yè)大學;2007年
8 生龍;二型模糊系統(tǒng)理論及應用[D];電子科技大學;2012年
相關碩士學位論文 前10條
1 胡志敏;互聯(lián)網文本自動文摘技術的研究[D];湘潭大學;2010年
2 蘭沖;基于統(tǒng)計規(guī)則的中文分詞研究[D];西安電子科技大學;2011年
3 劉衛(wèi)秋;專利信息檢索系統(tǒng)的研究與實現(xiàn)[D];中南大學;2010年
4 韓月陽;基于S-EK圖最短路徑中文分詞的研究[D];云南大學;2011年
5 高勇;校園網數(shù)字資源搜索引擎的技術研究與實現(xiàn)[D];解放軍信息工程大學;2008年
6 任麗蕓;搜索引擎中文分詞技術研究[D];重慶理工大學;2011年
7 陳小蕾;主基因—多基因性狀與微效多基因性狀的綜合選擇指數(shù)研究[D];西北農林科技大學;2011年
8 宗胡亮;無線信道統(tǒng)計模型識別及其在MIMO系統(tǒng)下的應用[D];南昌大學;2011年
9 關宏超;基于統(tǒng)計的開放式漢語自動分詞[D];大連理工大學;2002年
10 劉軍;基于論點傾向的網絡信息內容實時分析研究[D];四川大學;2003年
【相似文獻】
相關期刊論文 前10條
1 費曉燕,張海燕;一種用EM算法進行數(shù)據清理的方法[J];空軍雷達學院學報;2003年02期
2 張少中,楊南海,王秀坤;貝葉斯網絡參數(shù)的在線學習算法及應用[J];小型微型計算機系統(tǒng);2004年10期
3 吳建國;彭源;;一種基于EM算法的圖像分割改進技術[J];電腦知識與技術;2009年13期
4 彭培福;李樹有;姬永剛;李鵬;;改進的EM算法在說話人識別中的應用[J];遼寧工業(yè)大學學報(自然科學版);2009年03期
5 柳貴東;山拜·達拉拜;;基于EM算法的非高斯噪聲參數(shù)估計[J];通信技術;2011年01期
6 任雁;李艷萍;;基于EM算法的MIMO-OFDM系統(tǒng)半盲信道估計研究[J];長治學院學報;2011年02期
7 徐仁佐,吳新玲;NHPP模型參數(shù)調整與EM算法[J];計算機學報;1992年05期
8 楊沛武;劉飛;;基于動態(tài)概率主元分析的統(tǒng)計過程監(jiān)測[J];計算機與應用化學;2008年04期
9 許麗佳;王厚軍;龍兵;;基于貝葉斯網絡的復雜系統(tǒng)故障預測[J];系統(tǒng)工程與電子技術;2008年04期
10 林鴻;;改進的EM算法——A-ECM算法[J];福建電腦;2009年10期
相關會議論文 前10條
1 馬盡文;何學鋒;;高斯混合模型的數(shù)據尺度可壓縮參數(shù)學習算法[A];第十四屆全國信號處理學術年會(CCSP-2009)論文集[C];2009年
2 丁向東;張勤;;基于EM和規(guī)則算法的半同胞家系單倍型推斷方法[A];中國動物遺傳育種研究進展——第十五次全國動物遺傳育種學術討論會論文集[C];2009年
3 趙揚;馬盡文;;退火EM算法在非監(jiān)督圖像分割中的應用[A];第十二屆全國信號處理學術年會(CCSP-2005)論文集[C];2005年
4 駱俊;馬盡文;;高斯混合模型的遺傳分基融合算法[A];第十二屆全國信號處理學術年會(CCSP-2005)論文集[C];2005年
5 任函;何婷婷;;大規(guī)模在線文本的自動分類研究[A];全國第八屆計算語言學聯(lián)合學術會議(JSCL-2005)論文集[C];2005年
6 王彪;王成儒;王芬芬;;一種改進的運動目標檢測算法[A];計算機技術與應用進展·2007——全國第18屆計算機技術與應用(CACIS)學術會議論文集[C];2007年
7 路晶;馬少平;;基于多例學習的web圖像聚類[A];第四屆全國信息檢索與內容安全學術會議論文集(上)[C];2008年
8 韓玉兵;殷瑋瑋;吳樂南;;基于Wavelet-HMM的圖像超分辨率重建[A];第一屆建立和諧人機環(huán)境聯(lián)合學術會議(HHME2005)論文集[C];2005年
9 李旭超;朱善安;;WCS-HMT模型在圖像分割中的應用[A];2006中國控制與決策學術年會論文集[C];2006年
10 丁X;許侃;;基于文本聚類方法的我國科技管理研究領域的計量研究[A];第三屆科技政策與管理學術研討會暨第二屆科教發(fā)展戰(zhàn)略論壇論文匯編[C];2007年
相關博士學位論文 前10條
1 鄭術蓉;線性不等式約束下的EM算法[D];吉林大學;2004年
2 賈俊杰;空間數(shù)據挖掘中若干關鍵技術研究[D];長安大學;2009年
3 張文專;非線性再生散度隨機效應模型的統(tǒng)計分析[D];云南大學;2004年
4 王麗娟;基于特征評價的模式識別算法研究[D];哈爾濱工業(yè)大學;2007年
5 賴欣;對隨機效應混合治愈模型的一些推廣[D];中國科學技術大學;2009年
6 陳佐;時間序列相空間重構數(shù)據挖掘方法及其在證券市場的應用[D];湖南大學;2007年
7 羅季;有限混合分布模型與線性模型的估計和檢驗問題[D];華東師范大學;2008年
8 孫紅杰;基于主動測量的網絡性能分析[D];哈爾濱工業(yè)大學;2007年
9 田勇;多分辨率隱馬爾可夫模型圖像去噪研究[D];蘭州大學;2009年
10 邵虹;基于內容的醫(yī)學圖像檢索關鍵技術研究[D];東北大學;2005年
相關碩士學位論文 前10條
1 丁春忠;學生成績評價中的因子分析[D];蘇州大學;2004年
2 韓雄振;基于統(tǒng)計學的預測結構域間相互作用方法的研究[D];吉林大學;2006年
3 趙紅;對含有缺失基因型數(shù)據的家系進行單倍型推斷的EM方法[D];東北師范大學;2006年
4 涂慶;中小樣本的擬合優(yōu)度檢驗[D];華中師范大學;2007年
5 劉妍;混合連接函數(shù)模型及其在風險度量中的應用[D];中國人民大學;2008年
6 韓琨;針對遠交林木群體構建連鎖不平衡圖譜[D];浙江林學院;2008年
7 林鴻;EM算法的改進及其在基因序列分析中的應用[D];福州大學;2006年
8 孫蘭;有限混合模型及其應用的研究進展[D];東北師范大學;2006年
9 茹正亮;基于狀態(tài)空間模型的金融時間序列預測方法[D];河海大學;2007年
10 張智勇;基于GMDH的缺失數(shù)據插補方法研究[D];四川大學;2007年
,本文編號:2249981
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/2249981.html