基于HowNet的用戶興趣挖掘研究及應用
本文關鍵詞:基于HowNet的用戶興趣挖掘研究及應用
更多相關文章: HowNet 用戶興趣挖掘 網(wǎng)頁分塊 頁面排序 搜索引擎
【摘要】:搜索引擎中用戶查詢和網(wǎng)頁資源之間的相似度研究一直是頁面排序的研究核心。利用HowNet對詞語的語義層次架構模型,對用戶的檢索詞進行興趣挖掘,同時對檢索詞和挖掘出的興趣關鍵詞的語義相似度計算方法進行改進,用戶的檢索請求與分塊后的網(wǎng)頁資源進行相似度迭代計算。實驗結果表明,改進的算法使得頁面排序的準確率和首頁命中率有了較大提高。
【作者單位】: 江蘇商貿(mào)職業(yè)學院;
【分類號】:TP391.1
【正文快照】: 1引言伴隨著互聯(lián)網(wǎng)的快速發(fā)展,互聯(lián)網(wǎng)平臺上的數(shù)據(jù)呈現(xiàn)出指數(shù)增長的趨勢,搜索引擎成為人們從海量數(shù)據(jù)中獲取信息的主要方式之一。用戶通過輸入檢索關鍵詞向搜索引擎提交檢索請求,搜索引擎根據(jù)用戶提供的檢索關鍵詞在數(shù)據(jù)庫中進行資源匹配,將滿足匹配的資源按照相關性按序輸出[
【參考文獻】
中國期刊全文數(shù)據(jù)庫 前10條
1 王小林;王義;;改進的基于知網(wǎng)的詞語相似度算法[J];計算機應用;2011年11期
2 馬慧芳;史忠植;;一種高效穩(wěn)定的鏈接分析算法[J];計算機應用研究;2011年02期
3 盧露;趙靖;魏登月;;基于社會標注系統(tǒng)的Web用戶聚類算法[J];計算機應用研究;2013年12期
4 孫濱;劉林;;一種基于《知網(wǎng)》的文本語義相似度的計算方法[J];計算機與數(shù)字工程;2014年02期
5 楊博;陳賀昌;朱冠宇;趙學華;;基于超鏈接多樣性分析的新型網(wǎng)頁排名算法[J];計算機學報;2014年04期
6 舒奔;尹珂;;基于內(nèi)容與鏈接分析的主題爬蟲研究與設計[J];計算機與現(xiàn)代化;2014年04期
7 劉健;劉奕群;馬少平;張敏;茹立云;張闊;;搜索引擎用戶行為與用戶滿意度的關聯(lián)研究[J];中文信息學報;2014年01期
8 錢雪忠;吳志媛;;基于網(wǎng)頁概率潛在語義信息的用戶興趣聚類[J];計算機工程與科學;2014年04期
9 史寶明;賀元香;吳崇正;;主題搜索引擎中爬蟲搜索策略的研究[J];計算機工程與應用;2014年02期
10 段淮川;胡平;;基于主題特征和時間因子的改進PageRank算法[J];計算機工程與設計;2010年04期
【共引文獻】
中國期刊全文數(shù)據(jù)庫 前10條
1 李更生;盧罡;;基于時間反饋和分類技術的PageRank改進算法[J];北京化工大學學報(自然科學版);2013年S1期
2 王飛紅;丁澤發(fā);;基于Lucene的垂直搜索引擎設計與實現(xiàn)[J];電子技術與軟件工程;2014年05期
3 鄧丹君;周彩蘭;;基于內(nèi)容相關性和時間分析的改進PageRank算法[J];計算機與數(shù)字工程;2011年01期
4 楊格蘭;涂立;;基于主題相關性和鏈接權重的PageRank算法[J];華中科技大學學報(自然科學版);2012年S1期
5 陳戰(zhàn)勝;鈕文良;王輝;孫浩;;一種適用于大規(guī)模的改進PageRank算法[J];科學技術與工程;2012年34期
6 朱征宇;孫俊華;;改進的基于《知網(wǎng)》的詞匯語義相似度計算[J];計算機應用;2013年08期
7 吳秦;白玉昭;梁久禎;;一種基于語義詞典的局部查詢擴展方法[J];南京大學學報(自然科學);2014年04期
8 郭慶寶;賈代平;;融合反饋信息與內(nèi)容相關度的PageRank改進算法[J];計算機工程與設計;2011年12期
9 張美珍;王治瑩;;基于用戶查詢意圖的搜索排序算法[J];天津理工大學學報;2012年03期
10 彭月娥;楊思春;李心磊;丁菲菲;向恒月;;面向中文問答社區(qū)的問題去重技術研究[J];蘇州科技學院學報(自然科學版);2014年01期
中國碩士學位論文全文數(shù)據(jù)庫 前10條
1 鄧丹君;基于Lucene的垂直搜索引擎關鍵技術研究[D];武漢理工大學;2011年
2 薛萍;基于教育領域的垂直搜索引擎的研究與實現(xiàn)[D];天津師范大學;2011年
3 馬燕;基于快速相似度的Web結構挖掘的研究[D];南京信息工程大學;2011年
4 白玉昭;垂直搜索引擎的研究與實現(xiàn)[D];江南大學;2012年
5 劉夏;基于業(yè)務模型的3G數(shù)據(jù)業(yè)務分析與預測[D];北京郵電大學;2012年
6 郭慶寶;基于PageRank的搜索引擎優(yōu)化方法研究[D];山東師范大學;2012年
7 李輝;基于云計算環(huán)境的web結構挖掘算法研究[D];浙江理工大學;2012年
8 李波;基于自主推理的中文命名實體識別方法研究[D];西北大學;2012年
9 王義;基于語義場的文本檢索技術的研究與實現(xiàn)[D];安徽工業(yè)大學;2012年
10 劉發(fā)明;社會網(wǎng)絡分析與社團發(fā)現(xiàn)[D];山東大學;2012年
【二級參考文獻】
中國期刊全文數(shù)據(jù)庫 前10條
1 劉亞軍,徐易;一種基于加權語義相似度模型的自動問答系統(tǒng)[J];東南大學學報(自然科學版);2004年05期
2 王曉東;郭雷;方俊;董淑福;;一種基于EMD的文檔語義相似性度量[J];電子與信息學報;2008年09期
3 高煒;梁立;;一種改進的基于相似度的本體映射方法[J];甘肅聯(lián)合大學學報(自然科學版);2009年05期
4 李勝;胡和平;;一種基于PLSA的高效檢索方法[J];華中科技大學學報(自然科學版);2010年11期
5 張猛,王大玲,于戈;一種基于自動閾值發(fā)現(xiàn)的文本聚類方法[J];計算機研究與發(fā)展;2004年10期
6 郭景峰;趙玉艷;邊偉峰;李晶;;基于改進的凝聚性和分離性的層次聚類算法[J];計算機研究與發(fā)展;2008年S1期
7 方加沛;黃戰(zhàn);;基于單類別文檔分類的主題爬蟲[J];計算機工程與應用;2010年16期
8 徐茜;彭進業(yè);李展;;本體映射中一種綜合的概念相似度計算方法[J];計算機工程與應用;2010年24期
9 賈瑞玉;耿錦威;寧再早;何成剛;;基于代表點的快速聚類算法[J];計算機工程與應用;2010年33期
10 馬素琴;施化吉;;閾值優(yōu)化的文本密度聚類算法[J];計算機工程與應用;2011年17期
【相似文獻】
中國期刊全文數(shù)據(jù)庫 前10條
1 范玉霞;;基于用戶興趣的分組模型在電子圖書館檢索中的應用研究[J];商場現(xiàn)代化;2010年16期
2 王波,姚敏;基于信息抽取的匿名用戶興趣描述[J];華南理工大學學報(自然科學版);2004年S1期
3 白麗君;;基于COM技術的瀏覽器Agent初探[J];浙江工商大學學報;2006年03期
4 易愛平;廖祝華;張惠;;基于Google的個性化搜索系統(tǒng)的設計與實現(xiàn)[J];電腦知識與技術(學術交流);2007年01期
5 劉娟;;Web數(shù)據(jù)挖掘及其在個性化網(wǎng)上購物實現(xiàn)的探討[J];企業(yè)技術開發(fā);2007年07期
6 鄭雅婷;張鷹;;Web文本挖掘技術在網(wǎng)上購物中的應用[J];牡丹江師范學院學報(自然科學版);2008年04期
7 田曉珍;張敏;;用戶個性化模式中的匹配過濾算法研究[J];運城學院學報;2009年05期
8 謝文玲;潘建國;;基于語義相似度的個性化信息檢索方法[J];計算機應用與軟件;2011年05期
9 周之誠;;用戶意圖聚類的數(shù)字資源推薦方法[J];情報理論與實踐;2011年06期
10 李健;李雪梅;;基于用戶興趣和工作背景的信息收集個性化實現(xiàn)方案[J];圖書館論壇;2007年02期
中國重要會議論文全文數(shù)據(jù)庫 前10條
1 李曉黎;史忠植;梁永全;劉福桃;;INTERNET網(wǎng)上一種識別用戶興趣的學習方法[A];第十六屆全國數(shù)據(jù)庫學術會議論文集[C];1999年
2 廖祝華;劉建勛;易愛平;;基于用戶興趣的Web服務發(fā)現(xiàn)[A];2006年全國開放式分布與并行計算機學術會議論文集(三)[C];2006年
3 許歡慶;王永成;孫強;;基于加權概念網(wǎng)絡的用戶興趣建模[A];第一屆學生計算語言學研討會論文集[C];2002年
4 吳麗輝;張凱;張剛;王斌;;個性化Web信息采集系統(tǒng)PSearch的設計[A];全國第八屆計算語言學聯(lián)合學術會議(JSCL-2005)論文集[C];2005年
5 ;平方愛索互聯(lián)網(wǎng)智能信息系統(tǒng)[A];中國中文信息學會第六次全國會員代表大會暨成立二十五周年學術會議中文信息處理重大成果匯報展資料匯編[C];2006年
6 王勇;劉奕群;張敏;馬少平;茹立云;;基于用戶興趣分析的網(wǎng)頁生命周期建模(英文)[A];第三屆全國信息檢索與內(nèi)容安全學術會議論文集[C];2007年
7 郭巖;白碩;張凱;;網(wǎng)絡日志規(guī)模分析和用戶對Web的訪問動機分析[A];NCIRCS2004第一屆全國信息檢索與內(nèi)容安全學術會議論文集[C];2004年
8 孫靜;郭奇;張志強;馮建華;;一種基于面向領域檢索系統(tǒng)的用戶興趣獲取方法[A];第二十一屆中國數(shù)據(jù)庫學術會議論文集(技術報告篇)[C];2004年
9 張健沛;李連江;楊靜;;個性化搜索引擎排序算法的研究與改進[A];第三屆全國信息檢索與內(nèi)容安全學術會議論文集[C];2007年
10 姜麗華;張宏斌;;基于Multi-Agent的個性化Web信息采集系統(tǒng)[A];中國農(nóng)業(yè)信息科技創(chuàng)新與學科發(fā)展大會論文匯編[C];2007年
中國重要報紙全文數(shù)據(jù)庫 前10條
1 ;增值業(yè)務新老結合效果顯著[N];人民郵電;2006年
2 國防科學技術大學 毛新軍邋常志明;個人助手Agent的研究與應用[N];計算機世界;2007年
3 見習記者 駱海濤;MySpace創(chuàng)始人新生意:用Web2.0做元搜索[N];21世紀經(jīng)濟報道;2006年
4 中國科學院計算技術研究所 王 斌;內(nèi)容為王[N];計算機世界;2004年
5 董軍;資費、渠道、版權三大因素制約彩鈴發(fā)展[N];中國經(jīng)營報;2005年
6 Eric Newcomer;分布式SOA嶄露頭角[N];計算機世界;2007年
7 周婷;中國電信建國內(nèi)最大動態(tài)黃頁數(shù)據(jù)庫[N];中國證券報;2007年
8 應曉敏 竇文華;技術架構[N];計算機世界;2003年
9 姚春鴿;寬帶+娛樂:大發(fā)展孕育新商機[N];人民郵電;2007年
10 方文;什么是Google+?[N];人民郵電;2011年
中國博士學位論文全文數(shù)據(jù)庫 前10條
1 謝興;社會網(wǎng)絡中興趣發(fā)現(xiàn)與信息組織的研究[D];復旦大學;2011年
2 張召;在線論壇用戶興趣圖譜發(fā)現(xiàn)與個性化信息推薦[D];華東師范大學;2012年
3 應曉敏;面向Internet個性化服務的用戶建模技術研究[D];中國人民解放軍國防科學技術大學;2003年
4 羅娜;基于本體的主題爬行技術研究[D];吉林大學;2009年
5 潘建國;基于語義的用戶建模技術與應用研究[D];上海大學;2009年
6 杜阿寧;互聯(lián)網(wǎng)輿情信息挖掘方法研究[D];哈爾濱工業(yè)大學;2007年
7 王燦;基于半監(jiān)督流形學習的Web信息檢索技術研究[D];浙江大學;2009年
8 劉東飛;智能雙語搜索方法及搜索引擎的研究[D];武漢理工大學;2009年
9 陳浩;Web搜索的用戶興趣與智能優(yōu)化研究[D];中南大學;2012年
10 郭巖;網(wǎng)絡日志中用戶興趣的挖掘及利用[D];中國科學院研究生院(計算技術研究所);2004年
中國碩士學位論文全文數(shù)據(jù)庫 前10條
1 劉春旭;大規(guī)模數(shù)據(jù)發(fā)送中基于復合控制原理的用戶興趣的自適應模型[D];四川大學;2001年
2 馮子威;用戶興趣建模的研究[D];哈爾濱工業(yè)大學;2010年
3 張璇;基于用戶興趣的個性化搜索引擎技術研究[D];湖南大學;2010年
4 邱春艷;基于粗糙集理論的智能信息檢索方法的研究[D];東北師范大學;2005年
5 肖坤;面向用戶興趣的校園網(wǎng)聚類搜索引擎的研究與實現(xiàn)[D];國防科學技術大學;2010年
6 楊慧;個性化網(wǎng)絡信息檢索系統(tǒng)的研究和應用[D];南京工業(yè)大學;2005年
7 崔琰;基于用戶興趣及術語關系的查詢擴展方法[D];河北大學;2011年
8 羅建利;基于用戶興趣的概念查詢擴展研究[D];揚州大學;2005年
9 鄧曉嘉;一種基于RSS用戶興趣的個性化搜索系統(tǒng)[D];北京工業(yè)大學;2010年
10 柏桂榮;基于RSS信息源的用戶興趣模型研究[D];南京航空航天大學;2010年
,本文編號:1238141
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/1238141.html