基于HowNet的用戶興趣挖掘研究及應(yīng)用
本文關(guān)鍵詞:基于HowNet的用戶興趣挖掘研究及應(yīng)用
更多相關(guān)文章: HowNet 用戶興趣挖掘 網(wǎng)頁分塊 頁面排序 搜索引擎
【摘要】:搜索引擎中用戶查詢和網(wǎng)頁資源之間的相似度研究一直是頁面排序的研究核心。利用HowNet對詞語的語義層次架構(gòu)模型,對用戶的檢索詞進(jìn)行興趣挖掘,同時(shí)對檢索詞和挖掘出的興趣關(guān)鍵詞的語義相似度計(jì)算方法進(jìn)行改進(jìn),用戶的檢索請求與分塊后的網(wǎng)頁資源進(jìn)行相似度迭代計(jì)算。實(shí)驗(yàn)結(jié)果表明,改進(jìn)的算法使得頁面排序的準(zhǔn)確率和首頁命中率有了較大提高。
【作者單位】: 江蘇商貿(mào)職業(yè)學(xué)院;
【分類號】:TP391.1
【正文快照】: 1引言伴隨著互聯(lián)網(wǎng)的快速發(fā)展,互聯(lián)網(wǎng)平臺上的數(shù)據(jù)呈現(xiàn)出指數(shù)增長的趨勢,搜索引擎成為人們從海量數(shù)據(jù)中獲取信息的主要方式之一。用戶通過輸入檢索關(guān)鍵詞向搜索引擎提交檢索請求,搜索引擎根據(jù)用戶提供的檢索關(guān)鍵詞在數(shù)據(jù)庫中進(jìn)行資源匹配,將滿足匹配的資源按照相關(guān)性按序輸出[
【參考文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前10條
1 王小林;王義;;改進(jìn)的基于知網(wǎng)的詞語相似度算法[J];計(jì)算機(jī)應(yīng)用;2011年11期
2 馬慧芳;史忠植;;一種高效穩(wěn)定的鏈接分析算法[J];計(jì)算機(jī)應(yīng)用研究;2011年02期
3 盧露;趙靖;魏登月;;基于社會標(biāo)注系統(tǒng)的Web用戶聚類算法[J];計(jì)算機(jī)應(yīng)用研究;2013年12期
4 孫濱;劉林;;一種基于《知網(wǎng)》的文本語義相似度的計(jì)算方法[J];計(jì)算機(jī)與數(shù)字工程;2014年02期
5 楊博;陳賀昌;朱冠宇;趙學(xué)華;;基于超鏈接多樣性分析的新型網(wǎng)頁排名算法[J];計(jì)算機(jī)學(xué)報(bào);2014年04期
6 舒奔;尹珂;;基于內(nèi)容與鏈接分析的主題爬蟲研究與設(shè)計(jì)[J];計(jì)算機(jī)與現(xiàn)代化;2014年04期
7 劉健;劉奕群;馬少平;張敏;茹立云;張闊;;搜索引擎用戶行為與用戶滿意度的關(guān)聯(lián)研究[J];中文信息學(xué)報(bào);2014年01期
8 錢雪忠;吳志媛;;基于網(wǎng)頁概率潛在語義信息的用戶興趣聚類[J];計(jì)算機(jī)工程與科學(xué);2014年04期
9 史寶明;賀元香;吳崇正;;主題搜索引擎中爬蟲搜索策略的研究[J];計(jì)算機(jī)工程與應(yīng)用;2014年02期
10 段淮川;胡平;;基于主題特征和時(shí)間因子的改進(jìn)PageRank算法[J];計(jì)算機(jī)工程與設(shè)計(jì);2010年04期
【共引文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前10條
1 李更生;盧罡;;基于時(shí)間反饋和分類技術(shù)的PageRank改進(jìn)算法[J];北京化工大學(xué)學(xué)報(bào)(自然科學(xué)版);2013年S1期
2 王飛紅;丁澤發(fā);;基于Lucene的垂直搜索引擎設(shè)計(jì)與實(shí)現(xiàn)[J];電子技術(shù)與軟件工程;2014年05期
3 鄧丹君;周彩蘭;;基于內(nèi)容相關(guān)性和時(shí)間分析的改進(jìn)PageRank算法[J];計(jì)算機(jī)與數(shù)字工程;2011年01期
4 楊格蘭;涂立;;基于主題相關(guān)性和鏈接權(quán)重的PageRank算法[J];華中科技大學(xué)學(xué)報(bào)(自然科學(xué)版);2012年S1期
5 陳戰(zhàn)勝;鈕文良;王輝;孫浩;;一種適用于大規(guī)模的改進(jìn)PageRank算法[J];科學(xué)技術(shù)與工程;2012年34期
6 朱征宇;孫俊華;;改進(jìn)的基于《知網(wǎng)》的詞匯語義相似度計(jì)算[J];計(jì)算機(jī)應(yīng)用;2013年08期
7 吳秦;白玉昭;梁久禎;;一種基于語義詞典的局部查詢擴(kuò)展方法[J];南京大學(xué)學(xué)報(bào)(自然科學(xué));2014年04期
8 郭慶寶;賈代平;;融合反饋信息與內(nèi)容相關(guān)度的PageRank改進(jìn)算法[J];計(jì)算機(jī)工程與設(shè)計(jì);2011年12期
9 張美珍;王治瑩;;基于用戶查詢意圖的搜索排序算法[J];天津理工大學(xué)學(xué)報(bào);2012年03期
10 彭月娥;楊思春;李心磊;丁菲菲;向恒月;;面向中文問答社區(qū)的問題去重技術(shù)研究[J];蘇州科技學(xué)院學(xué)報(bào)(自然科學(xué)版);2014年01期
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前10條
1 鄧丹君;基于Lucene的垂直搜索引擎關(guān)鍵技術(shù)研究[D];武漢理工大學(xué);2011年
2 薛萍;基于教育領(lǐng)域的垂直搜索引擎的研究與實(shí)現(xiàn)[D];天津師范大學(xué);2011年
3 馬燕;基于快速相似度的Web結(jié)構(gòu)挖掘的研究[D];南京信息工程大學(xué);2011年
4 白玉昭;垂直搜索引擎的研究與實(shí)現(xiàn)[D];江南大學(xué);2012年
5 劉夏;基于業(yè)務(wù)模型的3G數(shù)據(jù)業(yè)務(wù)分析與預(yù)測[D];北京郵電大學(xué);2012年
6 郭慶寶;基于PageRank的搜索引擎優(yōu)化方法研究[D];山東師范大學(xué);2012年
7 李輝;基于云計(jì)算環(huán)境的web結(jié)構(gòu)挖掘算法研究[D];浙江理工大學(xué);2012年
8 李波;基于自主推理的中文命名實(shí)體識別方法研究[D];西北大學(xué);2012年
9 王義;基于語義場的文本檢索技術(shù)的研究與實(shí)現(xiàn)[D];安徽工業(yè)大學(xué);2012年
10 劉發(fā)明;社會網(wǎng)絡(luò)分析與社團(tuán)發(fā)現(xiàn)[D];山東大學(xué);2012年
【二級參考文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前10條
1 劉亞軍,徐易;一種基于加權(quán)語義相似度模型的自動(dòng)問答系統(tǒng)[J];東南大學(xué)學(xué)報(bào)(自然科學(xué)版);2004年05期
2 王曉東;郭雷;方俊;董淑福;;一種基于EMD的文檔語義相似性度量[J];電子與信息學(xué)報(bào);2008年09期
3 高煒;梁立;;一種改進(jìn)的基于相似度的本體映射方法[J];甘肅聯(lián)合大學(xué)學(xué)報(bào)(自然科學(xué)版);2009年05期
4 李勝;胡和平;;一種基于PLSA的高效檢索方法[J];華中科技大學(xué)學(xué)報(bào)(自然科學(xué)版);2010年11期
5 張猛,王大玲,于戈;一種基于自動(dòng)閾值發(fā)現(xiàn)的文本聚類方法[J];計(jì)算機(jī)研究與發(fā)展;2004年10期
6 郭景峰;趙玉艷;邊偉峰;李晶;;基于改進(jìn)的凝聚性和分離性的層次聚類算法[J];計(jì)算機(jī)研究與發(fā)展;2008年S1期
7 方加沛;黃戰(zhàn);;基于單類別文檔分類的主題爬蟲[J];計(jì)算機(jī)工程與應(yīng)用;2010年16期
8 徐茜;彭進(jìn)業(yè);李展;;本體映射中一種綜合的概念相似度計(jì)算方法[J];計(jì)算機(jī)工程與應(yīng)用;2010年24期
9 賈瑞玉;耿錦威;寧再早;何成剛;;基于代表點(diǎn)的快速聚類算法[J];計(jì)算機(jī)工程與應(yīng)用;2010年33期
10 馬素琴;施化吉;;閾值優(yōu)化的文本密度聚類算法[J];計(jì)算機(jī)工程與應(yīng)用;2011年17期
【相似文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前10條
1 范玉霞;;基于用戶興趣的分組模型在電子圖書館檢索中的應(yīng)用研究[J];商場現(xiàn)代化;2010年16期
2 王波,姚敏;基于信息抽取的匿名用戶興趣描述[J];華南理工大學(xué)學(xué)報(bào)(自然科學(xué)版);2004年S1期
3 白麗君;;基于COM技術(shù)的瀏覽器Agent初探[J];浙江工商大學(xué)學(xué)報(bào);2006年03期
4 易愛平;廖祝華;張惠;;基于Google的個(gè)性化搜索系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[J];電腦知識與技術(shù)(學(xué)術(shù)交流);2007年01期
5 劉娟;;Web數(shù)據(jù)挖掘及其在個(gè)性化網(wǎng)上購物實(shí)現(xiàn)的探討[J];企業(yè)技術(shù)開發(fā);2007年07期
6 鄭雅婷;張鷹;;Web文本挖掘技術(shù)在網(wǎng)上購物中的應(yīng)用[J];牡丹江師范學(xué)院學(xué)報(bào)(自然科學(xué)版);2008年04期
7 田曉珍;張敏;;用戶個(gè)性化模式中的匹配過濾算法研究[J];運(yùn)城學(xué)院學(xué)報(bào);2009年05期
8 謝文玲;潘建國;;基于語義相似度的個(gè)性化信息檢索方法[J];計(jì)算機(jī)應(yīng)用與軟件;2011年05期
9 周之誠;;用戶意圖聚類的數(shù)字資源推薦方法[J];情報(bào)理論與實(shí)踐;2011年06期
10 李健;李雪梅;;基于用戶興趣和工作背景的信息收集個(gè)性化實(shí)現(xiàn)方案[J];圖書館論壇;2007年02期
中國重要會議論文全文數(shù)據(jù)庫 前10條
1 李曉黎;史忠植;梁永全;劉福桃;;INTERNET網(wǎng)上一種識別用戶興趣的學(xué)習(xí)方法[A];第十六屆全國數(shù)據(jù)庫學(xué)術(shù)會議論文集[C];1999年
2 廖祝華;劉建勛;易愛平;;基于用戶興趣的Web服務(wù)發(fā)現(xiàn)[A];2006年全國開放式分布與并行計(jì)算機(jī)學(xué)術(shù)會議論文集(三)[C];2006年
3 許歡慶;王永成;孫強(qiáng);;基于加權(quán)概念網(wǎng)絡(luò)的用戶興趣建模[A];第一屆學(xué)生計(jì)算語言學(xué)研討會論文集[C];2002年
4 吳麗輝;張凱;張剛;王斌;;個(gè)性化Web信息采集系統(tǒng)PSearch的設(shè)計(jì)[A];全國第八屆計(jì)算語言學(xué)聯(lián)合學(xué)術(shù)會議(JSCL-2005)論文集[C];2005年
5 ;平方愛索互聯(lián)網(wǎng)智能信息系統(tǒng)[A];中國中文信息學(xué)會第六次全國會員代表大會暨成立二十五周年學(xué)術(shù)會議中文信息處理重大成果匯報(bào)展資料匯編[C];2006年
6 王勇;劉奕群;張敏;馬少平;茹立云;;基于用戶興趣分析的網(wǎng)頁生命周期建模(英文)[A];第三屆全國信息檢索與內(nèi)容安全學(xué)術(shù)會議論文集[C];2007年
7 郭巖;白碩;張凱;;網(wǎng)絡(luò)日志規(guī)模分析和用戶對Web的訪問動(dòng)機(jī)分析[A];NCIRCS2004第一屆全國信息檢索與內(nèi)容安全學(xué)術(shù)會議論文集[C];2004年
8 孫靜;郭奇;張志強(qiáng);馮建華;;一種基于面向領(lǐng)域檢索系統(tǒng)的用戶興趣獲取方法[A];第二十一屆中國數(shù)據(jù)庫學(xué)術(shù)會議論文集(技術(shù)報(bào)告篇)[C];2004年
9 張健沛;李連江;楊靜;;個(gè)性化搜索引擎排序算法的研究與改進(jìn)[A];第三屆全國信息檢索與內(nèi)容安全學(xué)術(shù)會議論文集[C];2007年
10 姜麗華;張宏斌;;基于Multi-Agent的個(gè)性化Web信息采集系統(tǒng)[A];中國農(nóng)業(yè)信息科技創(chuàng)新與學(xué)科發(fā)展大會論文匯編[C];2007年
中國重要報(bào)紙全文數(shù)據(jù)庫 前10條
1 ;增值業(yè)務(wù)新老結(jié)合效果顯著[N];人民郵電;2006年
2 國防科學(xué)技術(shù)大學(xué) 毛新軍邋常志明;個(gè)人助手Agent的研究與應(yīng)用[N];計(jì)算機(jī)世界;2007年
3 見習(xí)記者 駱海濤;MySpace創(chuàng)始人新生意:用Web2.0做元搜索[N];21世紀(jì)經(jīng)濟(jì)報(bào)道;2006年
4 中國科學(xué)院計(jì)算技術(shù)研究所 王 斌;內(nèi)容為王[N];計(jì)算機(jī)世界;2004年
5 董軍;資費(fèi)、渠道、版權(quán)三大因素制約彩鈴發(fā)展[N];中國經(jīng)營報(bào);2005年
6 Eric Newcomer;分布式SOA嶄露頭角[N];計(jì)算機(jī)世界;2007年
7 周婷;中國電信建國內(nèi)最大動(dòng)態(tài)黃頁數(shù)據(jù)庫[N];中國證券報(bào);2007年
8 應(yīng)曉敏 竇文華;技術(shù)架構(gòu)[N];計(jì)算機(jī)世界;2003年
9 姚春鴿;寬帶+娛樂:大發(fā)展孕育新商機(jī)[N];人民郵電;2007年
10 方文;什么是Google+?[N];人民郵電;2011年
中國博士學(xué)位論文全文數(shù)據(jù)庫 前10條
1 謝興;社會網(wǎng)絡(luò)中興趣發(fā)現(xiàn)與信息組織的研究[D];復(fù)旦大學(xué);2011年
2 張召;在線論壇用戶興趣圖譜發(fā)現(xiàn)與個(gè)性化信息推薦[D];華東師范大學(xué);2012年
3 應(yīng)曉敏;面向Internet個(gè)性化服務(wù)的用戶建模技術(shù)研究[D];中國人民解放軍國防科學(xué)技術(shù)大學(xué);2003年
4 羅娜;基于本體的主題爬行技術(shù)研究[D];吉林大學(xué);2009年
5 潘建國;基于語義的用戶建模技術(shù)與應(yīng)用研究[D];上海大學(xué);2009年
6 杜阿寧;互聯(lián)網(wǎng)輿情信息挖掘方法研究[D];哈爾濱工業(yè)大學(xué);2007年
7 王燦;基于半監(jiān)督流形學(xué)習(xí)的Web信息檢索技術(shù)研究[D];浙江大學(xué);2009年
8 劉東飛;智能雙語搜索方法及搜索引擎的研究[D];武漢理工大學(xué);2009年
9 陳浩;Web搜索的用戶興趣與智能優(yōu)化研究[D];中南大學(xué);2012年
10 郭巖;網(wǎng)絡(luò)日志中用戶興趣的挖掘及利用[D];中國科學(xué)院研究生院(計(jì)算技術(shù)研究所);2004年
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前10條
1 劉春旭;大規(guī)模數(shù)據(jù)發(fā)送中基于復(fù)合控制原理的用戶興趣的自適應(yīng)模型[D];四川大學(xué);2001年
2 馮子威;用戶興趣建模的研究[D];哈爾濱工業(yè)大學(xué);2010年
3 張璇;基于用戶興趣的個(gè)性化搜索引擎技術(shù)研究[D];湖南大學(xué);2010年
4 邱春艷;基于粗糙集理論的智能信息檢索方法的研究[D];東北師范大學(xué);2005年
5 肖坤;面向用戶興趣的校園網(wǎng)聚類搜索引擎的研究與實(shí)現(xiàn)[D];國防科學(xué)技術(shù)大學(xué);2010年
6 楊慧;個(gè)性化網(wǎng)絡(luò)信息檢索系統(tǒng)的研究和應(yīng)用[D];南京工業(yè)大學(xué);2005年
7 崔琰;基于用戶興趣及術(shù)語關(guān)系的查詢擴(kuò)展方法[D];河北大學(xué);2011年
8 羅建利;基于用戶興趣的概念查詢擴(kuò)展研究[D];揚(yáng)州大學(xué);2005年
9 鄧曉嘉;一種基于RSS用戶興趣的個(gè)性化搜索系統(tǒng)[D];北京工業(yè)大學(xué);2010年
10 柏桂榮;基于RSS信息源的用戶興趣模型研究[D];南京航空航天大學(xué);2010年
,本文編號:1238141
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/1238141.html