圖書(shū)信息的改進(jìn)艾普萊數(shù)據(jù)挖掘方法研究與實(shí)現(xiàn)
發(fā)布時(shí)間:2021-04-18 07:58
隨著電子圖書(shū)館在世界范圍內(nèi)大行其道,它已經(jīng)成為人們從圖書(shū)館獲取知識(shí)信息的一種主要手段。從其發(fā)展速度來(lái)看,電子圖書(shū)館在相當(dāng)程度取代紙質(zhì)圖書(shū)館,已經(jīng)成為難以遏制的必然發(fā)展趨勢(shì)。但這并不是說(shuō)電子圖書(shū)館就沒(méi)有任何問(wèn)題,其中存儲(chǔ)的海量信息,就給用戶(hù)如何在短時(shí)間內(nèi)搜索到自己的適用資源增添了不少麻煩。為了有效解決這一問(wèn)題,人們?cè)陔娮訄D書(shū)館信息管理系統(tǒng)的設(shè)計(jì)過(guò)程中,開(kāi)始關(guān)注數(shù)據(jù)挖掘算法的設(shè)計(jì)。本文以數(shù)據(jù)挖掘算法為基礎(chǔ),設(shè)計(jì)了圖書(shū)館信息系統(tǒng)。首先,針對(duì)電子圖書(shū)館中數(shù)據(jù)挖掘前的數(shù)據(jù)預(yù)處理工作進(jìn)行了相關(guān)方法的設(shè)計(jì),主要是依托于K-Means均值聚類(lèi)方法的設(shè)計(jì)。之后,對(duì)電子圖書(shū)館中兩類(lèi)最重要的數(shù)據(jù)信息,用戶(hù)信息和圖書(shū)信息進(jìn)行了聚類(lèi)分析,并進(jìn)行了相關(guān)驗(yàn)證性實(shí)驗(yàn)。其次,對(duì)數(shù)據(jù)挖掘領(lǐng)域中的艾普萊算法進(jìn)行了詳細(xì)的分析,包括方法的操作過(guò)程以及其中存在的問(wèn)題。針對(duì)其主要問(wèn)題進(jìn)行改進(jìn),提出了改進(jìn)艾普萊方法,在改進(jìn)艾普萊方法中,通過(guò)配置計(jì)數(shù)和地址集合設(shè)定,大大降低了剪枝處理的難度,提升了算法在圖書(shū)館系統(tǒng)中信息挖掘的效率。最后,在前面的聚類(lèi)分析和數(shù)據(jù)挖掘方法設(shè)計(jì)的基礎(chǔ)上,對(duì)圖書(shū)館信息系統(tǒng)進(jìn)行詳細(xì)的設(shè)計(jì)并完成聚類(lèi)分析和數(shù)據(jù)挖掘的...
【文章來(lái)源】:哈爾濱理工大學(xué)黑龍江省
【文章頁(yè)數(shù)】:54 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
用戶(hù)信息的聚類(lèi)分析流程設(shè)計(jì)
圖 2-2 用戶(hù)信息相關(guān)的三類(lèi)卡片據(jù)之前選定的能夠表征用戶(hù)特點(diǎn)的下載頻次進(jìn)行分類(lèi),可以的用戶(hù)分類(lèi)三個(gè)類(lèi)別,超頻率使用型、中頻率使用型、低頻過(guò)對(duì) 100 條用戶(hù)信息的梳理,使用電子圖書(shū)館的三個(gè)類(lèi)別的用致如下:表 2-1 電子圖書(shū)館用戶(hù)三個(gè)類(lèi)別的聚類(lèi)分析結(jié)果類(lèi)別 記錄 年均下載頻次 總平均下率使用型 256 15 4率使用型 542 31 13率使用型 202 62 26分用戶(hù)的聚類(lèi)分析結(jié)果如表 2-2 所示。表 2-2 電子圖書(shū)館的部分用戶(hù)的聚類(lèi)分析結(jié)果號(hào) 姓名 年均下載頻次 總均下載頻次 0309 韋紀(jì)州 9 41 低頻0155 宋洋 32 122 中頻
哈爾濱理工大學(xué)工程碩士學(xué)位論文0711 吳兵兵 59 258 超頻率0326 張雪林 32 108 中頻率0608 肖強(qiáng) 11 51 低頻率0326 沈鵬飛 59 277 超頻率0107 張亞為 42 125 中頻率0229 李翔 8 44 低頻率圖書(shū)信息的 K-Means 聚類(lèi)子圖書(shū)館的信息管理系統(tǒng)中,除了用戶(hù)信息以外,圖書(shū)信息在千差萬(wàn)別的海量電子圖書(shū)資源中,哪些電子圖書(shū)更受用戶(hù)的響到電子圖書(shū)館的后期運(yùn)營(yíng)和維護(hù)。所以,一類(lèi)圖書(shū)的被下載反應(yīng)該書(shū)是不是用戶(hù)喜愛(ài)的熱點(diǎn)圖書(shū)的關(guān)鍵。在本文電子圖書(shū)設(shè)計(jì)當(dāng)中,與圖書(shū)信息相關(guān)的三類(lèi)卡片的設(shè)計(jì)結(jié)果,如圖 2-3
【參考文獻(xiàn)】:
期刊論文
[1]對(duì)數(shù)據(jù)流頻繁項(xiàng)集挖掘算法WSW-Imp的改進(jìn)[J]. 王曉霞,王治和. 計(jì)算機(jī)工程與應(yīng)用. 2013(08)
[2]數(shù)據(jù)挖掘取樣方法研究[J]. 胡文瑜,孫志揮,吳英杰. 計(jì)算機(jī)研究與發(fā)展. 2011(01)
[3]我國(guó)公共圖書(shū)館服務(wù)體系建設(shè):治理模式研究[J]. 梁欣. 中國(guó)圖書(shū)館學(xué)報(bào). 2009(06)
[4]從知識(shí)運(yùn)動(dòng)的角度認(rèn)識(shí)圖書(shū)館[J]. 周慧. 中國(guó)圖書(shū)館學(xué)報(bào). 2009(06)
[5]解決數(shù)據(jù)樣本不平衡性的頻繁子圖挖掘算法[J]. 謝玓,尚學(xué)群,王淼,張延園. 計(jì)算機(jī)工程與應(yīng)用. 2008(36)
[6]WEB使用挖掘研究[J]. 黃浩,王建軍. 計(jì)算機(jī)系統(tǒng)應(yīng)用. 2008(01)
[7]數(shù)據(jù)挖掘在數(shù)字圖書(shū)館中的應(yīng)用研究[J]. 潘旭武,陳玲洪. 浙江高校圖書(shū)情報(bào)工作. 2007(01)
[8]關(guān)聯(lián)規(guī)則挖掘的常用算法及其比較分析[J]. 涂承勝. 重慶三峽學(xué)院學(xué)報(bào). 2006(03)
[9]基于數(shù)據(jù)挖掘的數(shù)字圖書(shū)館個(gè)性化服務(wù)[J]. 夏南強(qiáng),張紅梅. 圖書(shū)館學(xué)研究. 2006(01)
[10]數(shù)據(jù)挖掘技術(shù)在圖書(shū)館工作中的應(yīng)用[J]. 黃蘭. 圖書(shū)館學(xué)研究. 2005(07)
博士論文
[1]基于粗糙集的指標(biāo)體系構(gòu)建及綜合評(píng)價(jià)方法研究[D]. 李遠(yuǎn)遠(yuǎn).武漢理工大學(xué) 2009
碩士論文
[1]基于數(shù)據(jù)倉(cāng)庫(kù)的學(xué)生就業(yè)管理系統(tǒng)的研究[D]. 金雪嶠.電子科技大學(xué) 2010
[2]可視化數(shù)據(jù)挖掘技術(shù)的研究與實(shí)現(xiàn)[D]. 施惠娟.華東師范大學(xué) 2010
[3]數(shù)據(jù)挖掘技術(shù)在數(shù)字化校園中的應(yīng)用[D]. 鄒晶晶.中南大學(xué) 2009
[4]基于粗糙集的屬性約簡(jiǎn)與規(guī)則提取[D]. 黃麗萍.廈門(mén)大學(xué) 2007
本文編號(hào):3145120
【文章來(lái)源】:哈爾濱理工大學(xué)黑龍江省
【文章頁(yè)數(shù)】:54 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
用戶(hù)信息的聚類(lèi)分析流程設(shè)計(jì)
圖 2-2 用戶(hù)信息相關(guān)的三類(lèi)卡片據(jù)之前選定的能夠表征用戶(hù)特點(diǎn)的下載頻次進(jìn)行分類(lèi),可以的用戶(hù)分類(lèi)三個(gè)類(lèi)別,超頻率使用型、中頻率使用型、低頻過(guò)對(duì) 100 條用戶(hù)信息的梳理,使用電子圖書(shū)館的三個(gè)類(lèi)別的用致如下:表 2-1 電子圖書(shū)館用戶(hù)三個(gè)類(lèi)別的聚類(lèi)分析結(jié)果類(lèi)別 記錄 年均下載頻次 總平均下率使用型 256 15 4率使用型 542 31 13率使用型 202 62 26分用戶(hù)的聚類(lèi)分析結(jié)果如表 2-2 所示。表 2-2 電子圖書(shū)館的部分用戶(hù)的聚類(lèi)分析結(jié)果號(hào) 姓名 年均下載頻次 總均下載頻次 0309 韋紀(jì)州 9 41 低頻0155 宋洋 32 122 中頻
哈爾濱理工大學(xué)工程碩士學(xué)位論文0711 吳兵兵 59 258 超頻率0326 張雪林 32 108 中頻率0608 肖強(qiáng) 11 51 低頻率0326 沈鵬飛 59 277 超頻率0107 張亞為 42 125 中頻率0229 李翔 8 44 低頻率圖書(shū)信息的 K-Means 聚類(lèi)子圖書(shū)館的信息管理系統(tǒng)中,除了用戶(hù)信息以外,圖書(shū)信息在千差萬(wàn)別的海量電子圖書(shū)資源中,哪些電子圖書(shū)更受用戶(hù)的響到電子圖書(shū)館的后期運(yùn)營(yíng)和維護(hù)。所以,一類(lèi)圖書(shū)的被下載反應(yīng)該書(shū)是不是用戶(hù)喜愛(ài)的熱點(diǎn)圖書(shū)的關(guān)鍵。在本文電子圖書(shū)設(shè)計(jì)當(dāng)中,與圖書(shū)信息相關(guān)的三類(lèi)卡片的設(shè)計(jì)結(jié)果,如圖 2-3
【參考文獻(xiàn)】:
期刊論文
[1]對(duì)數(shù)據(jù)流頻繁項(xiàng)集挖掘算法WSW-Imp的改進(jìn)[J]. 王曉霞,王治和. 計(jì)算機(jī)工程與應(yīng)用. 2013(08)
[2]數(shù)據(jù)挖掘取樣方法研究[J]. 胡文瑜,孫志揮,吳英杰. 計(jì)算機(jī)研究與發(fā)展. 2011(01)
[3]我國(guó)公共圖書(shū)館服務(wù)體系建設(shè):治理模式研究[J]. 梁欣. 中國(guó)圖書(shū)館學(xué)報(bào). 2009(06)
[4]從知識(shí)運(yùn)動(dòng)的角度認(rèn)識(shí)圖書(shū)館[J]. 周慧. 中國(guó)圖書(shū)館學(xué)報(bào). 2009(06)
[5]解決數(shù)據(jù)樣本不平衡性的頻繁子圖挖掘算法[J]. 謝玓,尚學(xué)群,王淼,張延園. 計(jì)算機(jī)工程與應(yīng)用. 2008(36)
[6]WEB使用挖掘研究[J]. 黃浩,王建軍. 計(jì)算機(jī)系統(tǒng)應(yīng)用. 2008(01)
[7]數(shù)據(jù)挖掘在數(shù)字圖書(shū)館中的應(yīng)用研究[J]. 潘旭武,陳玲洪. 浙江高校圖書(shū)情報(bào)工作. 2007(01)
[8]關(guān)聯(lián)規(guī)則挖掘的常用算法及其比較分析[J]. 涂承勝. 重慶三峽學(xué)院學(xué)報(bào). 2006(03)
[9]基于數(shù)據(jù)挖掘的數(shù)字圖書(shū)館個(gè)性化服務(wù)[J]. 夏南強(qiáng),張紅梅. 圖書(shū)館學(xué)研究. 2006(01)
[10]數(shù)據(jù)挖掘技術(shù)在圖書(shū)館工作中的應(yīng)用[J]. 黃蘭. 圖書(shū)館學(xué)研究. 2005(07)
博士論文
[1]基于粗糙集的指標(biāo)體系構(gòu)建及綜合評(píng)價(jià)方法研究[D]. 李遠(yuǎn)遠(yuǎn).武漢理工大學(xué) 2009
碩士論文
[1]基于數(shù)據(jù)倉(cāng)庫(kù)的學(xué)生就業(yè)管理系統(tǒng)的研究[D]. 金雪嶠.電子科技大學(xué) 2010
[2]可視化數(shù)據(jù)挖掘技術(shù)的研究與實(shí)現(xiàn)[D]. 施惠娟.華東師范大學(xué) 2010
[3]數(shù)據(jù)挖掘技術(shù)在數(shù)字化校園中的應(yīng)用[D]. 鄒晶晶.中南大學(xué) 2009
[4]基于粗糙集的屬性約簡(jiǎn)與規(guī)則提取[D]. 黃麗萍.廈門(mén)大學(xué) 2007
本文編號(hào):3145120
本文鏈接:http://sikaile.net/tushudanganlunwen/3145120.html
最近更新
教材專(zhuān)著