一個新的個性化搜索引擎排序算法
本文關鍵詞:一個新的個性化搜索引擎排序算法
更多相關文章: 個性化排序 用戶興趣模型 奇異值分解 k-means聚類算法 樸素貝葉斯分類器
【摘要】:通過對現(xiàn)有個性化搜索引擎排序算法的研究,提出了一個新的排序算法。該算法首先在不同粒度上多次使用SVD技術和k-means聚類技術,將用戶瀏覽歷史及其所包含的詞在不同層次上進行文檔聚類和詞聚類,創(chuàng)建兩棵加權興趣樹:文檔類樹和詞類樹。其中,樹中每個節(jié)點的權值表示用戶對該類文檔或該類詞的感興趣程度。接著,利用樸素貝葉斯分類器對搜索引擎得到的網(wǎng)頁進行文檔分類和詞分類,并根據(jù)分類結果進行網(wǎng)頁評分。最后,將網(wǎng)頁根據(jù)文檔得分降序排列。實驗表明該方法能為用戶提供更為精確的個性化排序。
【作者單位】: 太原科技大學計算機科學與技術學院;
【關鍵詞】: 個性化排序 用戶興趣模型 奇異值分解 k-means聚類算法 樸素貝葉斯分類器
【分類號】:TP391.3
【正文快照】: 在早期的搜索引擎中,搜索結果的排序只是以檢索器在數(shù)據(jù)庫中找到匹配網(wǎng)頁的先后順序排列。隨著互聯(lián)網(wǎng)的不斷發(fā)展,大量的垃圾信息和重復信息充斥著互聯(lián)網(wǎng),影響了用戶對感興趣信息的訪問。而傳統(tǒng)的搜索引擎排序只能依靠關鍵詞的相似度計算,當數(shù)據(jù)達到千萬級別的時候,用戶的一次
【參考文獻】
中國期刊全文數(shù)據(jù)庫 前5條
1 劉海峰;王元元;張學仁;;基于潛在語義空間的文本檢索問題研究[J];情報科學;2007年05期
2 曾春,邢春曉,周立柱;個性化服務技術綜述[J];軟件學報;2002年10期
3 曾春,邢春曉,周立柱;基于內(nèi)容過濾的個性化搜索算法[J];軟件學報;2003年05期
4 常璐,夏祖奇;搜索引擎的幾種常用排序算法[J];圖書情報工作;2003年06期
5 楊思洛;搜索引擎的排序技術研究[J];現(xiàn)代圖書情報技術;2005年01期
中國碩士學位論文全文數(shù)據(jù)庫 前2條
1 馮超;K-means聚類算法的研究[D];大連理工大學;2007年
2 張躍火;基于用戶興趣偏好模型的個性化搜索算法[D];重慶大學;2010年
【共引文獻】
中國期刊全文數(shù)據(jù)庫 前10條
1 汪潔;朱軍;;基于Linux的中文垃圾郵件過濾系統(tǒng)設計與實現(xiàn)[J];安徽農(nóng)業(yè)大學學報;2011年02期
2 姚克娟,李晉宏;應用Agent技術實現(xiàn)個性化信息服務[J];北方工業(yè)大學學報;2004年03期
3 王麗影;劉媛媛;李建英;;個性化服務在網(wǎng)絡課程中的應用研究[J];辦公自動化;2009年20期
4 李偉;黃穎;;基于HtmlParser的網(wǎng)頁信息提取[J];兵工自動化;2007年07期
5 張俊芬;;搜索引擎之競價排名的法律問題研究[J];北京郵電大學學報(社會科學版);2009年06期
6 紀良浩;王國胤;楊勇;;基于協(xié)作過濾的Web日志數(shù)據(jù)預處理研究[J];重慶郵電學院學報(自然科學版);2006年05期
7 紀良浩;;協(xié)作過濾信息推薦技術研究[J];重慶郵電大學學報(自然科學版);2012年01期
8 陳大平;;搜索引擎技術方式之探析[J];長春理工大學學報(高教版);2009年10期
9 許建潮;王紅梅;;改進的協(xié)同過濾算法[J];吉林大學學報(信息科學版);2008年01期
10 辛勤芳;;基于項目聚類的協(xié)同過濾算法研究[J];赤峰學院學報(自然科學版);2011年09期
中國重要會議論文全文數(shù)據(jù)庫 前10條
1 雷育生;甘仞初;楊軍;;一種基于用戶偏好的虛擬網(wǎng)站信息結構自適應調整算法[A];2007年全國第十一屆企業(yè)信息化與工業(yè)工程學術會議論文集[C];2007年
2 梁偉賢;;網(wǎng)絡搜索引擎發(fā)展現(xiàn)狀的探討[A];2007中國科協(xié)年會——通信與信息發(fā)展高層論壇論文集[C];2007年
3 徐羽瓊;李石堅;姚敏;;基于情境感知的個性化郵件服務[A];第四屆和諧人機環(huán)境聯(lián)合學術會議論文集[C];2008年
4 劉詠梅;盧鴻劍;杜美玲;;基于Multi-agent的個人電腦客戶定制服務推薦系統(tǒng)[A];2006中國控制與決策學術年會論文集[C];2006年
5 湯志偉;王菁;;面向公眾的電子政務個性化信息服務體系的構建[A];中國信息經(jīng)濟學會2007年學術年會論文集[C];2007年
6 劉濤;王曉光;黃琨;;數(shù)字圖書館的發(fā)展及其技術概論[A];信息時代——科技情報研究學術論文集(第三輯)[C];2008年
7 趙立江;何欽銘;;聚類分析在個性化學習中的研究與應用[A];NCIRCS2004第一屆全國信息檢索與內(nèi)容安全學術會議論文集[C];2004年
8 柯慧燕;;基于粗糙集的遠程教育個性化服務研究[A];第二屆全國信息檢索與內(nèi)容安全學術會議(NCIRCS-2005)論文集[C];2005年
9 宋巍;張宇;劉挺;李生;;基于檢索歷史上下文的個性化查詢重構技術研究[A];第五屆全國信息檢索學術會議論文集[C];2009年
10 杜亞軍;裴崢;彭宏;徐揚;;基于不確定性推理的主題推薦方法[A];第二十屆全國數(shù)據(jù)庫學術會議論文集(研究報告篇)[C];2003年
中國博士學位論文全文數(shù)據(jù)庫 前10條
1 劉玉國;基于內(nèi)容的互聯(lián)網(wǎng)輿情信息挖掘關鍵技術研究[D];山東大學;2011年
2 林甲灶;構建個性化智能移動電子商務系統(tǒng)的關鍵技術與方法研究[D];蘭州大學;2011年
3 張衛(wèi);基于XaaS的制造服務鏈形成與應用研究[D];浙江大學;2011年
4 朱振方;基于微粒群和遺傳優(yōu)化的文本過濾關鍵技術研究[D];山東師范大學;2012年
5 朱征宇;Web資源組織與服務性能研究[D];重慶大學;2003年
6 張曉剛;面向軟件過程改進的知識管理技術研究[D];中國科學院研究生院(軟件研究所);2004年
7 陳福集;電子政務系統(tǒng)中面向公眾的信息集成化管理與個性化服務研究[D];合肥工業(yè)大學;2004年
8 楊震;個性化信息獲取方法的研究[D];大連理工大學;2004年
9 周娜;基于Web的制造業(yè)電子商務平臺關鍵技術的研究與應用[D];南京航空航天大學;2005年
10 趙野軍;橡膠擠出機智能CAD的技術和方法研究[D];北京化工大學;2005年
中國碩士學位論文全文數(shù)據(jù)庫 前10條
1 吳則則;支持動態(tài)演進的用戶興趣模型挖掘方法研究[D];山東科技大學;2010年
2 高兆梓;基于專利分析的競爭對手分類系統(tǒng)研究[D];山東科技大學;2010年
3 蔡宏果;基于基因表達式編程的Web個性化推薦技術研究[D];廣西師范學院;2010年
4 劉建東;基于Web訪問信息挖掘的數(shù)字圖書館個性化服務研究[D];浙江理工大學;2010年
5 許坤;基于本體的應急信息管理系統(tǒng)的研究與設計[D];鄭州大學;2010年
6 蔡宇虹;基于主題的元搜索引擎關鍵技術研究[D];哈爾濱工程大學;2010年
7 劉文輝;基于鏈接結構的網(wǎng)頁排序算法研究[D];哈爾濱工程大學;2010年
8 何瑩杰;個性化圖書信息服務技術研究[D];哈爾濱工程大學;2010年
9 汪永偉;搜索引擎中網(wǎng)頁排序算法的研究與實現(xiàn)[D];哈爾濱工程大學;2010年
10 孟慶海;基于社會書簽的個性化查詢詞擴展技術研究[D];哈爾濱工程大學;2010年
【二級參考文獻】
中國期刊全文數(shù)據(jù)庫 前10條
1 盧效峰,鄭權;基于用戶行為分析的搜索引擎模型[J];北方工業(yè)大學學報;2004年03期
2 李育嫦;搜索引擎中完善關鍵詞檢索功能的探索[J];圖書與情報;2003年05期
3 丁璇,侯漢清,章成志;中文網(wǎng)頁標引源主題表達能力的調查統(tǒng)計[J];大學圖書館學報;2002年06期
4 羅敏,王麗娜,張煥國;基于無監(jiān)督聚類的入侵檢測方法[J];電子學報;2003年11期
5 應曉敏,劉明,竇文華;一種面向個性化服務的無需反例集的用戶建模方法[J];國防科技大學學報;2002年03期
6 陶蕾;一種智能型的信息檢索方法:隱含語義索引法[J];情報理論與實踐;2004年03期
7 陶劍文;;一種自動獲取用戶興趣的個性化搜索算法[J];情報理論與實踐;2007年04期
8 陳海龍;搜索引擎的評價標準及方法研究[J];情報雜志;2001年09期
9 袁文莉;中文搜索引擎分類檢索工具發(fā)展的大趨勢[J];情報雜志;2004年05期
10 馮翱,劉斌,盧增祥,路海明,王普,李衍達;Open Bookmark——基于Agent的信息過濾系統(tǒng)[J];清華大學學報(自然科學版);2001年03期
中國碩士學位論文全文數(shù)據(jù)庫 前2條
1 曹渝昆;基于RDF的個性化服務模型[D];重慶大學;2002年
2 劉俊暉;企業(yè)內(nèi)部個性化搜索系統(tǒng)的研究與實現(xiàn)[D];復旦大學;2008年
【相似文獻】
中國期刊全文數(shù)據(jù)庫 前10條
1 李俊,張靈玲,周文輝,潘金貴;一個智能用戶接口Agent設計與實現(xiàn)[J];軟件學報;1999年08期
2 歐潔,林守勛,李錦濤;數(shù)字圖書館中的個性化信息檢索[J];微電子學與計算機;2002年07期
3 王志軍,于超;基于隱式反饋的個人信息檢索技術及實現(xiàn)[J];計算機工程;2003年06期
4 龔婕,姜軍,張桂林;基于奇異值分解和支持向量機的人臉檢測[J];計算機與數(shù)字工程;2003年01期
5 徐科;崔志明;;基于搜索歷史的用戶興趣模型的研究[J];計算機技術與發(fā)展;2006年05期
6 許春漫;;數(shù)字圖書館個性化信息檢索模型研究[J];現(xiàn)代圖書情報技術;2006年03期
7 喬曉明;劉有耀;;基于粗糙集理論和FCM的圖像聚類方法[J];微計算機信息;2007年12期
8 鄭運剛;馬建國;;基于分類的用戶興趣漂移模型[J];情報雜志;2008年01期
9 許天亮;王義峰;曾平;;個性化元搜索引擎技術研究[J];電子科技;2008年01期
10 張東娜;劉博;;三種屬性約簡方法的比較研究[J];電腦知識與技術;2008年04期
中國重要會議論文全文數(shù)據(jù)庫 前10條
1 曾建國;陳光夢;;基于張量分解的動態(tài)紋理合成技術研究[A];中國儀器儀表學會第九屆青年學術會議論文集[C];2007年
2 倪蓉蓉;阮秋琦;;一種新的數(shù)字水印算法的研究[A];第十屆全國信號處理學術年會(CCSP-2001)論文集[C];2001年
3 王修運;柏森;李秀;劉陽;粘永健;;基于圖像直方圖不變矩和奇異值分解的圖像認證方法[A];第三屆全國數(shù)字成像技術及相關材料發(fā)展與應用學術研討會論文摘要集[C];2004年
4 徐慧英;朱信忠;趙建民;殷建平;;基于分塊奇異值分解的數(shù)字水印算法及實現(xiàn)[A];2005年全國理論計算機科學學術年會論文集[C];2005年
5 李蓓;金聰;;基于奇異值分解的數(shù)字水印算法[A];第一屆建立和諧人機環(huán)境聯(lián)合學術會議(HHME2005)論文集[C];2005年
6 聶秀山;關華勇;關東東;;基于奇異值分解的三維網(wǎng)格數(shù)字水印算法[A];第十二屆全國圖象圖形學學術會議論文集[C];2005年
7 聶秀山;矯立峰;錢建磊;劉杰英;;一種基于SVD的三維模型數(shù)字水印算法[A];2008'中國信息技術與應用學術論壇論文集(一)[C];2008年
8 杜先峰;張愛輝;任震林;丁文霞;;一種嵌入位置隨機變化的數(shù)字視頻可見水印算法[A];2008年中國高校通信類院系學術研討會論文集(下冊)[C];2009年
9 劉俊景;蔣華;;一種基于離散余弦變換與奇異值分解的數(shù)字圖像水印算法[A];2007年全國開放式分布與并行計算機學術會議論文集(下冊)[C];2007年
10 余香敏;焦占亞;;一種基于DWT與SVD的數(shù)字圖像水印算法[A];2008年全國開放式分布與并行計算機學術會議論文集(下冊)[C];2008年
中國博士學位論文全文數(shù)據(jù)庫 前10條
1 梁毅雄;基于子空間分析的人臉特征提取及識別研究[D];重慶大學;2005年
2 胡蓉;增量機器學習算法研究[D];南京理工大學;2013年
3 劉小軍;人臉識別技術研究[D];中國科學院電子學研究所;2001年
4 梁棟;基于多視圖的參數(shù)估計與形狀重構[D];安徽大學;2002年
5 呂英華;信息隱藏相關方法及應用的研究[D];吉林大學;2007年
6 劉艷艷;子空間特征提取方法及其在人臉識別中的應用[D];大連理工大學;2008年
7 荊永君;教育資源分布式配送與調度算法研究[D];東北師范大學;2008年
8 王好賢;數(shù)字視頻水印嵌入和抽取算法研究[D];哈爾濱工業(yè)大學;2008年
9 陸銘;WEB2.0網(wǎng)絡熱點發(fā)現(xiàn)與個性化檢索研究[D];中國科學技術大學;2012年
10 顏端武;面向知識服務的智能推薦系統(tǒng)研究[D];南京理工大學;2007年
中國碩士學位論文全文數(shù)據(jù)庫 前10條
1 孫鑫;元搜索引擎結果個性化排序的研究與實現(xiàn)[D];中國石油大學;2008年
2 崔頃頃;基于個性化搜索的系統(tǒng)研究與設計[D];北京交通大學;2011年
3 魏雪娟;基于傅立葉變換技術的人臉識別系統(tǒng)[D];四川大學;2005年
4 龍開文;基于模板匹配的人臉檢測[D];四川大學;2005年
5 李婭;個性化智能元搜索引擎模型研究[D];西南大學;2006年
6 廖文彬;基于矩陣奇異值分解的圖像壓縮方法研究[D];成都理工大學;2007年
7 范河淋;分布式文檔管理系統(tǒng)的研究和實現(xiàn)[D];西北大學;2008年
8 王炫盛;基于Lanczos雙對角化過程的非負矩陣快速分解的初始化方法[D];廈門大學;2009年
9 蘇盛曲;圖像信息隱藏中的數(shù)字水印技術研究[D];南昌大學;2010年
10 許國梁;應用于數(shù)字視頻監(jiān)控系統(tǒng)的人臉識別技術[D];中國人民解放軍國防科學技術大學;2002年
,本文編號:562366
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/562366.html