基于用戶興趣的個(gè)性化搜索引擎研究.pdf 全文免費(fèi)在線閱讀
本文關(guān)鍵詞:基于用戶興趣的個(gè)性化搜索引擎研究,由筆耕文化傳播整理發(fā)布。
文檔介紹:
山西財(cái)經(jīng)大學(xué)碩士學(xué)位論文基于用戶興趣的個(gè)性化搜索引擎研究姓名:李彥輝申請(qǐng)學(xué)位級(jí)別:碩士專業(yè):計(jì)算機(jī)應(yīng)用技術(shù)指導(dǎo)教師:李愛(ài)軍2011-06-10基于用戶興趣的個(gè)性化搜索引擎研究1-技術(shù)的迅速發(fā)展,網(wǎng)絡(luò)提供給人們的信息量越來(lái)越大。搜索引擎作為人們?cè)诰W(wǎng)上查找、獲取信息的主要手段之一,在各個(gè)領(lǐng)域都已得到了廣泛的應(yīng)用。為了給用戶提供個(gè)性化查詢的服務(wù),個(gè)性化搜索引擎應(yīng)運(yùn)而生。經(jīng)過(guò)眾多研究者的不懈努力,個(gè)性化搜索引擎技術(shù)已取得了一些進(jìn)展。針對(duì)當(dāng)前搜索引擎的不足,本文研究并實(shí)現(xiàn)了一個(gè)基于用戶興趣的個(gè)性化搜索引擎系統(tǒng)。首先,本文介紹了傳統(tǒng)搜索引擎以及個(gè)性化搜索引擎的相關(guān)背景知識(shí),并對(duì)Lucene開源技術(shù)做了說(shuō)明。其次,本文在詳細(xì)介紹了與本課題相關(guān)的技術(shù)知識(shí)后,提出本系統(tǒng)開發(fā)的總體設(shè)計(jì)架構(gòu)和系統(tǒng)流程。這種架構(gòu)以減少服務(wù)器端開銷為目的,同時(shí)能很好的解決客戶端存儲(chǔ)限制的缺點(diǎn)造成的排序誤差,而且極具靈活性。最后,本文在搜索引擎中引入基于用戶興趣的個(gè)性化排序算法和個(gè)性化查詢擴(kuò)展算法,將其實(shí)現(xiàn)。通過(guò)實(shí)驗(yàn)驗(yàn)證了這些設(shè)計(jì)和算法的可行性,并為本文今后的研究明確了方向。【關(guān)鍵詞】搜索引擎,個(gè)性化,用戶興趣模型基于用戶興趣的個(gè)性化搜索引擎研究2-AbstractWith the rapid development of technology work can provide people more and more information.Search engine has been widely used in many fields,which is treated as a tool that people can get information on World Wide Web.In order to provide personalized search service for users,personalized search es forth.Because of many researchers contribution,people have made great progress in personalized search engine.Aiming at the existing problems in current search engine systems,this paper is expected to develop a personalized search engine based on user interest.First,this paper introduces the main background knowledge of traditional search engines and personalized search engine,also introduces the Lucene open source technologies.Then,after learning some technical knowledge of developing personalized search engine,this paper proposes the frame and processes of search engine.This frame is to achieve the aim ofreducing the servers’ load.This kind of frame can also solve the problem of the sort error caused by client-sorted users’ interests without losing flexibility.Finally,In this paper,When implementing the search engine,we have introduced peronalized based on user interest in sorting algorithm and personalized query expansion algorithm. The experiment results show the feasibility of these designs and algorithms,determine the direction of my future research.【Key Words】Search Engine,Personality,User Interested Mode 1山西財(cái)經(jīng)大學(xué)學(xué)位論文原創(chuàng)性聲明本人鄭重聲明:所呈交的學(xué)位論文,是本人在導(dǎo)師的指導(dǎo)下,獨(dú)立進(jìn)行研究工作所取得的成果。除文中已經(jīng)注明引用的內(nèi)容外,本論文不包含任何其他個(gè)人或集體已經(jīng)發(fā)表或撰寫過(guò)的作品成果。對(duì)本文的研究所做出重要貢獻(xiàn)的個(gè)人和集體,均已在文中以明確方式標(biāo)明。本人完全意識(shí)到本申明的法律結(jié)果由本人承擔(dān)。學(xué)位論文作者簽名:日期:年月日2山西財(cái)經(jīng)大學(xué)學(xué)位論文版權(quán)使用授權(quán)書本學(xué)位論文作者完全了解學(xué)校有關(guān)保管、使用學(xué)位論文的規(guī)定,同意學(xué)校保留并向國(guó)家有關(guān)部門或機(jī)構(gòu)送交論文的復(fù)印件和電子版,允許論文被查閱和借閱。本人授權(quán)山西財(cái)經(jīng)大學(xué)可以將本學(xué)位論文的全部或部分內(nèi)容編入有關(guān)數(shù)據(jù)庫(kù)進(jìn)行檢索,可以采用影印、縮印或掃描等復(fù)制手段保存和匯編本學(xué)位論文。本學(xué)位論文屬于保密□,不保密□。在年解密后適用本授權(quán)書。(請(qǐng)?jiān)谝陨戏娇騼?nèi)打“√”)學(xué)位論文作者簽名:指導(dǎo)教師簽名:日期:年月日日期:年月日基于用戶興趣的個(gè)性化搜索引擎研究1-1 引言1.為我們提供了大量的信息資源,已經(jīng)成為當(dāng)今和未來(lái)人們獲取信息和資源的主要場(chǎng)所。第27次中國(guó)互聯(lián)網(wǎng)絡(luò)發(fā)展?fàn)顩r統(tǒng)計(jì)報(bào)告[1]顯示,截至2010年12月底,我國(guó)網(wǎng)民規(guī)模達(dá)4.57億,互聯(lián)網(wǎng)普及率攀升至34.3%。搜索引擎使用率首次超過(guò)了網(wǎng)絡(luò)音樂(lè),成為我國(guó)網(wǎng)民規(guī)模最龐大的應(yīng)用,其用戶規(guī)模達(dá)到了37453萬(wàn),使用率達(dá)到了81.9%。搜索引擎的發(fā)展經(jīng)歷了目錄海量搜索、海量搜索、剔除垃圾網(wǎng)頁(yè)、專業(yè)、定向、高準(zhǔn)確性和匹配性等幾個(gè)階段。搜索引擎在收集頁(yè)面的數(shù)量、速度、準(zhǔn)確率方面已得到了長(zhǎng)足的進(jìn)步,但搜索引擎的框架結(jié)構(gòu)和基本技術(shù)并沒(méi)有實(shí)質(zhì)性的突破。而搜索引擎缺乏個(gè)性化的局限性卻日益突出,具體表現(xiàn)在[2]:(1)信息覆蓋面廣,形式各異,而傳統(tǒng)搜索引擎對(duì)所有用戶提供相同的界面和服務(wù),并且檢索的結(jié)果成千上萬(wàn)、良莠不齊,用戶為找到真正感興趣的信息,往往要消耗大量的時(shí)間和精力。(2)人們由于年齡、性別、職業(yè)、學(xué)歷、愛(ài)好等不同,各自感興趣的領(lǐng)域也隨之不同,各自對(duì)詞義的理解也不盡相同,不同的用戶對(duì)同一檢索請(qǐng)求得到的檢索結(jié)果常常有不同的評(píng)價(jià),而目前傳統(tǒng)搜索引擎不能體現(xiàn)用戶的信息需求個(gè)性,即傳統(tǒng)搜索引擎提供的服務(wù)時(shí)“面向檢索”,而不是“面向用戶”的。(3)用戶在不同時(shí)期或階段對(duì)同一檢索請(qǐng)求,所得到的仍是完全相同的檢索結(jié)果,對(duì)用戶不具有自適應(yīng)能力。(4)用戶使
1
內(nèi)容來(lái)自轉(zhuǎn)載請(qǐng)標(biāo)明出處.本文關(guān)鍵詞:基于用戶興趣的個(gè)性化搜索引擎研究,由筆耕文化傳播整理發(fā)布。
,本文編號(hào):246334
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/246334.html