【摘要】:互聯(lián)網(wǎng)和電子商務(wù)的發(fā)展,產(chǎn)生了大量的數(shù)據(jù),從而導(dǎo)致網(wǎng)絡(luò)資源的信息過載。當(dāng)搜索引擎技術(shù)已經(jīng)無法解決信息過載問題時(shí),推薦系統(tǒng)應(yīng)運(yùn)而生。常見的推薦系統(tǒng)有:協(xié)同過濾推薦、基于內(nèi)容的推薦和基于圖的推薦,但它們都存在數(shù)據(jù)稀疏和計(jì)算量大的問題,使得推薦結(jié)果不準(zhǔn)確和實(shí)時(shí)性差。針對(duì)這些問題進(jìn)行深入研究,主要工作和貢獻(xiàn)如下:首先,針對(duì)傳統(tǒng)K-means算法隨機(jī)選擇初始聚類中心,極易造成聚類結(jié)果不準(zhǔn)確的問題,提出了一種基于最小方差和最大化最小距離的思想改進(jìn)K-means算法初始聚類中心的選擇方法。接著提出了一種基于用戶信任關(guān)系和評(píng)分偏好的新方法度量用戶之間的相似度,從而在一定程度上解決了推薦系統(tǒng)在計(jì)算用戶相似度時(shí)面臨的數(shù)據(jù)稀疏問題。其次,提出了一種改進(jìn)K-means聚類的推薦方法IKC(Improved K-means Clustering Recommendation Method)。利用基于信任關(guān)系的用戶相似度代替K-means算法中對(duì)象之間的歐式距離;接著用改進(jìn)的K-means算法對(duì)用戶進(jìn)行聚類劃分,把相似度較高的用戶聚集到同一個(gè)子類中,然后用Top-N算法生成推薦列表。在MovieLens(1M)和Epinions數(shù)據(jù)集上的實(shí)驗(yàn)表明:基于IKC算法的推薦方法在相同數(shù)據(jù)集下不同數(shù)據(jù)稀疏度的平均絕對(duì)誤差和均分根誤差兩項(xiàng)指標(biāo)都較其他四種比較算法小,解決了數(shù)據(jù)稀疏問題;且IKC算法在相同的數(shù)據(jù)集上的執(zhí)行效率也較其他四種比較算法高,解決了計(jì)算量大的問題。所以IKC算法在推薦系統(tǒng)的準(zhǔn)確性和實(shí)時(shí)性方面都有很大的提高。
【學(xué)位授予單位】:華中科技大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2016
【分類號(hào)】:TP391.3
【參考文獻(xiàn)】
相關(guān)期刊論文 前6條
1 鄧海;覃華;孫欣;;一種優(yōu)化初始中心的K-means聚類算法[J];計(jì)算機(jī)技術(shù)與發(fā)展;2013年11期
2 Feng Xie;Zhen Chen;Hongfeng Xu;Xiwei Feng;Qi Hou;;TST: Threshold Based Similarity Transitivity Method in Collaborative Filtering with Cloud Computing[J];Tsinghua Science and Technology;2013年03期
3 張靖;段富;;優(yōu)化初始聚類中心的改進(jìn)k-means算法[J];計(jì)算機(jī)工程與設(shè)計(jì);2013年05期
4 賈冬艷;張付志;;基于雙重鄰居選取策略的協(xié)同過濾推薦算法[J];計(jì)算機(jī)研究與發(fā)展;2013年05期
5 羅敏,王麗娜,張煥國;基于無監(jiān)督聚類的入侵檢測(cè)方法[J];電子學(xué)報(bào);2003年11期
6 陳鐵梅,黃道平,陸顧新,朱學(xué)鋒;模式聚類在數(shù)據(jù)預(yù)處理中的應(yīng)用研究[J];計(jì)算機(jī)與應(yīng)用化學(xué);2003年03期
相關(guān)碩士學(xué)位論文 前2條
1 劉坤朋;數(shù)據(jù)挖掘中聚類算法的研究[D];長沙理工大學(xué);2010年
2 周涓;基于最大最小距離法的多中心聚類算法研究[D];重慶大學(xué);2006年
,
本文編號(hào):
2543180
本文鏈接:http://sikaile.net/jingjilunwen/dianzishangwulunwen/2543180.html