天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當前位置:主頁 > 社科論文 > 圖書檔案論文 >

數(shù)據(jù)挖掘技術(shù)在個性化信息檢索系統(tǒng)中的應(yīng)用研究

發(fā)布時間:2021-08-20 13:25
  隨著網(wǎng)絡(luò)應(yīng)用的普及,網(wǎng)上信息量以驚人的速度增長,并且更新頻繁。人們面對的問題不再是缺乏有用信息,而是如何找到自己所需要的信息。雖然傳統(tǒng)信息檢索技術(shù)在一定程度上滿足了人們的需要,但卻存在著低查準率和低查全率的問題。多數(shù)商業(yè)搜索引擎提供的信息檢索服務(wù),由于側(cè)重通用性而不能滿足不同背景、不同目的用戶的查詢請求。針對這種現(xiàn)狀,作者研究了基于數(shù)據(jù)挖掘的個性化信息檢索系統(tǒng)。論文首先對搜索引擎系統(tǒng)的研究現(xiàn)狀和發(fā)展趨勢進行論述,探討了將數(shù)據(jù)挖掘技術(shù)應(yīng)用于個性化信息檢索系統(tǒng)的可行性,在此基礎(chǔ)上提出了一個基于數(shù)據(jù)挖掘的個性化信息檢索系統(tǒng)的總體框架模型。接著對該系統(tǒng)的主要功能進行較深入的描述,對該系統(tǒng)的的關(guān)鍵技術(shù)進行較深入的研究。最后給出了一種基于Apriori的類別關(guān)聯(lián)規(guī)則的挖掘算法。仿真結(jié)果表明基于Apriori的類別關(guān)聯(lián)規(guī)則的挖掘算法能夠挖掘出用戶的個性化信息,同時表明用戶個性化信息的質(zhì)量好壞與支持度值的大小密切相關(guān)。 

【文章來源】:西安電子科技大學陜西省 211工程院校 教育部直屬院校

【文章頁數(shù)】:73 頁

【學位級別】:碩士

【部分圖文】:

數(shù)據(jù)挖掘技術(shù)在個性化信息檢索系統(tǒng)中的應(yīng)用研究


PIRSBDM 系統(tǒng)體系結(jié)構(gòu)

關(guān)聯(lián)規(guī)則挖掘,步驟,頻繁項目集,算法


部分的內(nèi)容將在本章后面章節(jié)進行介紹。關(guān)聯(lián)規(guī)則挖掘的基本模型如圖 4.1 所示。圖4.1 關(guān)聯(lián)規(guī)則挖掘步驟圖中 D 為數(shù)據(jù)集,算法 1 為頻繁項目集的搜索算法,算法 2 為關(guān)聯(lián)規(guī)則的產(chǎn)生算法,R 為挖出的關(guān)聯(lián)規(guī)則集合。用戶通過指定 minsupport 和 minconfidence 分別與算法 1 和算法 2 交互,并通過與 R 的交互對挖掘結(jié)果進行解釋和評估。本文利用算法 1 挖掘出頻繁項目集作為用戶個性化信息,所以只需指定 minsupport 即可。對于本系統(tǒng)來說,我們只需挖掘出用戶的關(guān)鍵詞組合作為數(shù)據(jù)集 D,設(shè)定好minsupport 的值

神經(jīng)元,輸入層,實時學習,抗噪音


第四章 PIRSBDM 系統(tǒng)關(guān)鍵技術(shù)研究 4聚類方法相比,SOM 網(wǎng)絡(luò)的優(yōu)點在于:可以實現(xiàn)實時學習,網(wǎng)絡(luò)具有自穩(wěn)定性無須外界給出評價函數(shù),能夠識別向量空間中最有意義的特征,抗噪音能力強這些特點將有利于 Web 文檔的聚類。SOM 網(wǎng)絡(luò)由輸入層和競爭層組成,輸入層N 個輸入神經(jīng)元組成,競爭層由 M 個輸出神經(jīng)元組成。輸入層各神經(jīng)元與競爭各神經(jīng)元之間實現(xiàn)全互連接。如圖 4.4 所示,為清楚起見,僅畫出各輸入神經(jīng)元競爭層神經(jīng)元 j 的連接情況,網(wǎng)絡(luò)的連接權(quán)值為ijw (i=1,2,…,N;j=1,2,…,M)。

【參考文獻】:
期刊論文
[1]基于用戶的個性化智能搜索引擎[J]. 金玉堅,劉焱.  現(xiàn)代情報. 2005(07)
[2]一種基于關(guān)聯(lián)分類方法的Web用戶興趣預(yù)測[J]. 陳振,鄭誠,朱小棟.  微機發(fā)展. 2005(05)
[3]搜索引擎Google的檢索規(guī)則[J]. 吳敏.  蘭臺世界. 2005(07)
[4]幾類搜索引擎的原理剖析、比較研究及發(fā)展趨勢探討[J]. 黃知義,周寧.  圖書館學研究. 2005(03)
[5]論搜索引擎的人性化發(fā)展趨勢[J]. 李蘇華,李建偉.  中山大學學報論叢. 2005(01)
[6]Google和百度兩種搜索引擎比較研究[J]. 王香蓮.  現(xiàn)代圖書情報技術(shù). 2004(08)
[7]模糊關(guān)聯(lián)規(guī)則的挖掘算法[J]. 徐鳳生,陸玉昌.  德州學院學報(自然科學版). 2002(02)
[8]一種基于SOM的中文Web文檔層次聚類方法[J]. 陳福集,楊善林.  情報學報. 2002(02)
[9]Archie,Gopher,WAIS和WWW——Internet網(wǎng)上主要信息查詢工具介紹[J]. 黃靜.  圖書館學刊. 2001(03)
[10]Web搜索引擎的現(xiàn)狀分析[J]. 吳果.  河南紡織高等專科學校學報. 2001(02)

博士論文
[1]電子政務(wù)系統(tǒng)中面向公眾的信息集成化管理與個性化服務(wù)研究[D]. 陳福集.合肥工業(yè)大學 2004

碩士論文
[1]關(guān)聯(lián)規(guī)則挖掘技術(shù)研究[D]. 郎瑾.西安電子科技大學 2005
[2]個性化智能信息檢索系統(tǒng)研究[D]. 顧鑫.哈爾濱工程大學 2004



本文編號:3353580

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/tushudanganlunwen/3353580.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶868bd***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com