基于用戶興趣模型的個性化搜索系統(tǒng)的研究
[Abstract]:The rapid development of the Internet not only provides people with a lot of information, but also inevitably makes it difficult for users to obtain valuable information quickly. Search engine has become one of the main ways to obtain network resources, but in practical applications, even users with different backgrounds and needs will get the same results when entering the same query words, even the same ranking of web pages. Therefore, personalized search service based on user interest preference is a direction of search engine development in the future. Based on the research and discussion of the working principle and basic technology of personalized search engine, a simple personalized search prototype system based on user interest model is constructed in this paper. The system firstly acquires the user's browsing history record and preprocesses it. The Chinese word segmentation and the feature word frequency statistics based on TF-IDF algorithm. The interest model of users is established by using spatial vector representation method to select N keywords with the highest weight. Then, the system uses cosine formula to calculate the similarity between the initial search results and the model, to filter the search results, remove the information that users are not interested in, and then select the web pages with high matching degree with the users. Ensure the relevance of web content; By analyzing the user's click behavior on the search results, the relevance between the search results and the query keywords is extracted, and then the weight of the relevant result pages is increased, and the weight of the unrelated pages is reduced. Integrating the results of the above two stages, filtering and reordering the search results according to the degree of relevance, the personalized search for single user is realized. Finally, a personalized search system is designed and implemented with the help of full-text search engine (Lucene) and open source search framework (Solr,) by mining the user's browsing data and clicking behavior. The experiment results show that the personalized search based on user interest model will filter and reorder the search results according to user interest model and user click behavior. The search results accord with the user's interest preference, and improve the precision and user satisfaction of search engine effectively.
【學(xué)位授予單位】:西南大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2013
【分類號】:TP391.3
【參考文獻(xiàn)】
相關(guān)期刊論文 前10條
1 閆炳寬;;基于點擊技術(shù)的用戶興趣數(shù)據(jù)挖掘研究[J];電腦知識與技術(shù);2009年33期
2 曲桂英;馮麗娜;張志嵩;張志海;;基于用戶興趣模型的個性化信息服務(wù)系統(tǒng)研究[J];哈爾濱商業(yè)大學(xué)學(xué)報(自然科學(xué)版);2007年03期
3 林古立;彭宏;馬千里;韋佳;覃姜維;;一種基于關(guān)鍵詞的網(wǎng)頁搜索結(jié)果多樣化方法[J];華南理工大學(xué)學(xué)報(自然科學(xué)版);2011年05期
4 馬千里;林古立;;基于聚類和用戶點擊的在線多樣化排序算法[J];華南理工大學(xué)學(xué)報(自然科學(xué)版);2011年12期
5 陳善雄;彭茂玲;余建橋;;基于分類規(guī)則信息熵的報文處理算法[J];計算機(jī)工程;2010年08期
6 陳一峰;趙恒凱;余小清;萬旺根;;基于本體的用戶興趣模型構(gòu)建研究[J];計算機(jī)工程;2010年21期
7 劉徽;黃寬娜;余建橋;;一種Deep Web爬蟲爬行策略[J];計算機(jī)工程;2012年11期
8 方樹峰;;基于用戶反饋的PageRank改進(jìn)算法[J];計算技術(shù)與自動化;2012年01期
9 沈盈洪;豐翔龍;黃榮游;;基于網(wǎng)頁聚類的搜索結(jié)果優(yōu)化算法研究[J];計算機(jī)應(yīng)用;2010年S1期
10 程陳;齊開悅;陳劍波;;基于Web2.0的綜合搜索引擎[J];計算機(jī)應(yīng)用與軟件;2010年01期
相關(guān)會議論文 前2條
1 吳曉;李丹寧;林潔;冀肖榆;李丹;;個性化搜索引擎中用戶興趣模型的研究[A];第三屆全國信息檢索與內(nèi)容安全學(xué)術(shù)會議論文集[C];2007年
2 藺繼國;徐錫山;;一種基于用戶點擊數(shù)據(jù)的個性化PageRank算法[A];第六屆全國信息檢索學(xué)術(shù)會議論文集[C];2010年
相關(guān)碩士學(xué)位論文 前10條
1 崔頃頃;基于個性化搜索的系統(tǒng)研究與設(shè)計[D];北京交通大學(xué);2011年
2 曾凡興;基于用戶興趣和瀏覽行為的個性化推薦技術(shù)研究[D];江西農(nóng)業(yè)大學(xué);2011年
3 王宇;基于搜索歷史的用戶興趣建模[D];復(fù)旦大學(xué);2011年
4 張為;公眾論壇信息實時檢索的研究與實現(xiàn)[D];南京理工大學(xué);2012年
5 代旭峰;基于用戶興趣模型的搜索引擎結(jié)果推薦系統(tǒng)[D];復(fù)旦大學(xué);2011年
6 薛凌鴻;基于Flex的多媒體智能答疑系統(tǒng)的設(shè)計與實現(xiàn)[D];北京郵電大學(xué);2012年
7 李婭;個性化智能元搜索引擎模型研究[D];西南大學(xué);2006年
8 劉忠寶;個性化搜索引擎的研究與實現(xiàn)[D];北京工商大學(xué);2007年
9 李家琪;一種基于信息分布的元搜索結(jié)果后處理方法研究[D];北京郵電大學(xué);2008年
10 趙文華;基于用戶的個性化搜索引擎研究[D];首都師范大學(xué);2008年
,本文編號:2428960
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/2428960.html