天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

啟發(fā)式的快速個(gè)人博客聚類技術(shù)研究和實(shí)現(xiàn)

發(fā)布時(shí)間:2017-06-05 00:10

  本文關(guān)鍵詞:啟發(fā)式的快速個(gè)人博客聚類技術(shù)研究和實(shí)現(xiàn),,由筆耕文化傳播整理發(fā)布。


【摘要】:博客平臺(tái)作為現(xiàn)在人們記錄分享生活的重要網(wǎng)絡(luò)平臺(tái),對于個(gè)人來說,博客內(nèi)容的正確歸檔描述具有重大意義,本文提出啟發(fā)式的快速個(gè)人博客聚類技術(shù),跟以往對于博客的聚類不同,本文主要針對個(gè)人特點(diǎn),對于單獨(dú)的個(gè)人博客進(jìn)行聚類,并對聚類簇進(jìn)行描述。本文根據(jù)個(gè)人博客內(nèi)容特點(diǎn),設(shè)計(jì)一種啟發(fā)式的相似內(nèi)容獲取,用于用戶的輔助聚類,其中相似內(nèi)容獲取是基于博客用戶之間的相似度,本文提出一種基于用戶興趣集結(jié)合跟時(shí)間順序密切相關(guān)的興趣集序列的用戶相似度模型,在此基礎(chǔ)上獲取相似內(nèi)容。在類別描述上,本文不同于其他研究,提出一種根據(jù)自身博客平臺(tái)數(shù)據(jù)的半自動(dòng)化聚類簇描述方法,結(jié)合人工描述和自動(dòng)描述的方法,事先利用主題提取技術(shù)提取類別源數(shù)據(jù)的主題,對其進(jìn)行人工描述,然后再根據(jù)聚類簇結(jié)果的主題信息進(jìn)行自動(dòng)匹配,其中類別源數(shù)據(jù)來源于自身博客平臺(tái),更符合數(shù)據(jù)本身的特點(diǎn)。實(shí)驗(yàn)結(jié)果表明,在個(gè)人博客聚類場景下,啟發(fā)式的快速博客聚類在準(zhǔn)確率和召回率上都優(yōu)于單純采用聚類算法進(jìn)行聚類,文中提出的結(jié)合人工描述和自動(dòng)描述的聚類簇描述方法相比于傳統(tǒng)自動(dòng)描述在準(zhǔn)確率的基礎(chǔ)上也有更好的可讀性。
【關(guān)鍵詞】:個(gè)人博客 啟發(fā)式 聚類 聚類簇描述
【學(xué)位授予單位】:浙江大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2015
【分類號】:TP393.092
【目錄】:
  • 摘要4-5
  • Abstract5-11
  • 第1章 緒論11-15
  • 1.1 課題背景11-13
  • 1.2 本文工作13-14
  • 1.3 本文組織14
  • 1.4 本文小結(jié)14-15
  • 第2章 相關(guān)工作15-22
  • 2.1 文本聚類15-16
  • 2.2 文本特征提取16-18
  • 2.2.1 文檔頻數(shù)特征選擇16-17
  • 2.2.2 單詞權(quán)特征選擇17
  • 2.2.3 單詞熵特征選擇17
  • 2.2.4 主題特征選擇17-18
  • 2.3 類別描述18-20
  • 2.3.1 基于統(tǒng)計(jì)的類別描述18-19
  • 2.3.2 基于外源數(shù)據(jù)的類別描述19
  • 2.3.3 基于聚類過程的類別描述19-20
  • 2.4 單詞相似度計(jì)算20-21
  • 2.4.1 潛在語義分析方法(LSA,Latent Semantic Anslysis)20
  • 2.4.2 利用本體知識計(jì)算20-21
  • 2.4.3 利用大規(guī)模的語料計(jì)算21
  • 2.5 本章小結(jié)21-22
  • 第3章 問題描述及數(shù)據(jù)模型定義22-26
  • 3.1 問題描述22-25
  • 3.2 數(shù)據(jù)模型定義25
  • 3.3 本章小結(jié)25-26
  • 第4章 基于時(shí)間順序興趣集的用戶相似度計(jì)算26-39
  • 4.1 用戶相似度模型26
  • 4.2 用戶相似度計(jì)算框架26-31
  • 4.2.1 興趣集相似度27-28
  • 4.2.2 興趣集序列相似度28-31
  • 4.2.3 用戶相似度31
  • 4.3 分布式的單詞相似度計(jì)算31-38
  • 4.3.1 單詞相似度定義32
  • 4.3.2 單詞相似度計(jì)算32-38
  • 4.4 本章小結(jié)38-39
  • 第5章 啟發(fā)式的個(gè)人博客聚類39-50
  • 5.1 啟發(fā)式的相似內(nèi)容獲取39-44
  • 5.1.1 類別表示源數(shù)據(jù)獲取40-41
  • 5.1.2 基于目標(biāo)博主的相似博客獲取41-44
  • 5.2 綜合特征生成44-46
  • 5.2.1 單詞熵提取文本特征44-45
  • 5.2.2 基于LDA的主題特征45
  • 5.2.3 綜合特征45-46
  • 5.3 基于博客平臺(tái)數(shù)據(jù)的半自動(dòng)化聚類簇描述46-49
  • 5.4 本章小結(jié)49-50
  • 第6章 系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)50-56
  • 6.1 系統(tǒng)結(jié)構(gòu)50-51
  • 6.2 啟發(fā)式數(shù)據(jù)搜索爬取模塊51-52
  • 6.2.1 啟發(fā)式離線搜索數(shù)據(jù)爬取模塊51
  • 6.2.2 啟發(fā)式在線搜索數(shù)據(jù)爬取模塊51-52
  • 6.3 類別描述求解模塊52-53
  • 6.4 相似詞計(jì)算模塊53
  • 6.5 用戶相似度計(jì)算模塊53-54
  • 6.6 聚類模塊54-55
  • 6.7 本章小結(jié)55-56
  • 第7章 實(shí)驗(yàn)結(jié)果及分析56-64
  • 7.1 聚類評價(jià)方法56-57
  • 7.2 實(shí)驗(yàn)結(jié)果及結(jié)果分析57-63
  • 7.2.1 啟發(fā)式個(gè)人博客聚類算法的比較實(shí)驗(yàn)57-62
  • 7.2.2 聚類簇描述的實(shí)驗(yàn)62-63
  • 7.3 本章小結(jié)63-64
  • 第8章 總結(jié)和展望64-66
  • 8.1 本文主要工作和貢獻(xiàn)64
  • 8.2 未來研究工作展望64-66
  • 參考文獻(xiàn)66-70
  • 致謝70

【相似文獻(xiàn)】

中國期刊全文數(shù)據(jù)庫 前10條

1 ;個(gè)人博客有價(jià)? 無價(jià)?[J];電腦愛好者;2006年18期

2 ;個(gè)人博客&個(gè)人網(wǎng)站排行榜[J];互聯(lián)網(wǎng)周刊;2009年24期

3 Nowlene;;人人都需要Myware[J];數(shù)字通信;2007年04期

4 曾來海;謝華忠;;個(gè)人博客——記者的又一陣地[J];聲屏世界;2006年10期

5 小新;;Google Adsense收入 亂賬細(xì)算[J];電腦愛好者;2008年12期

6 于會(huì)見;;個(gè)人博客設(shè)計(jì)芻議[J];裝飾;2011年08期

7 秦軒;;全球政要掀起博客風(fēng)潮[J];中國新聞周刊;2006年19期

8 ;網(wǎng)絡(luò)[J];電腦愛好者;2008年07期

9 孫曉彥;;綜論網(wǎng)絡(luò)媒介的人際交流功能[J];科學(xué)之友;2010年12期

10 陳勇;謝雪環(huán);成筠;;基于PHP的個(gè)人博客系統(tǒng)[J];福建電腦;2009年09期

中國重要報(bào)紙全文數(shù)據(jù)庫 前10條

1 本報(bào)特約記者 楊劍;個(gè)人博客的謀生路[N];電腦報(bào);2006年

2 嚴(yán)輝文;個(gè)人博客回避不了社會(huì)責(zé)任[N];湖北日報(bào);2007年

3 本報(bào)記者 江毓;個(gè)人博客:盈利不是夢想[N];海峽財(cái)經(jīng)導(dǎo)報(bào);2006年

4 周婷;個(gè)人博客掀起商業(yè)廣告潮[N];中國證券報(bào);2007年

5 侯磊 張風(fēng)虎;網(wǎng)上曬心情 “博客”訴心聲[N];戰(zhàn)士報(bào);2009年

6 本報(bào)記者  雷賓建;謹(jǐn)防個(gè)人博客對負(fù)面信息的放大效應(yīng)[N];通信信息報(bào);2006年

7 李曉明;求職簡歷:新增個(gè)人博客[N];中國婦女報(bào);2006年

8 ;X5dj,所有人的網(wǎng)上家園[N];中國計(jì)算機(jī)報(bào);2006年

9 胡龍華 盛曉明 記者  徐光明;輔導(dǎo)員博客拓展師生溝通空間[N];中國教育報(bào);2006年

10 陳忠群 周鋒;警察開博客 架起警民連心橋[N];人民公安報(bào);2006年

中國碩士學(xué)位論文全文數(shù)據(jù)庫 前4條

1 林秋霞;啟發(fā)式的快速個(gè)人博客聚類技術(shù)研究和實(shí)現(xiàn)[D];浙江大學(xué);2015年

2 李艷梅;個(gè)人博客之文體特征研究[D];首都師范大學(xué);2007年

3 閆偉光;基于Java EE的個(gè)人博客管理系統(tǒng)的設(shè)計(jì)和實(shí)現(xiàn)[D];內(nèi)蒙古大學(xué);2013年

4 尚云龍;關(guān)于網(wǎng)絡(luò)博客系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D];電子科技大學(xué);2013年


  本文關(guān)鍵詞:啟發(fā)式的快速個(gè)人博客聚類技術(shù)研究和實(shí)現(xiàn),由筆耕文化傳播整理發(fā)布。



本文編號:422473

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/guanlilunwen/ydhl/422473.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶cfccd***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請E-mail郵箱bigeng88@qq.com
少妇丰满a一区二区三区| 欧美日韩无卡一区二区| 日韩中文字幕人妻精品| 中文字幕高清不卡一区| 精品人妻久久一品二品三品| 中文字幕禁断介一区二区| 国产精品免费精品一区二区| 福利专区 久久精品午夜| 欧美一级片日韩一级片 | 亚洲视频一级二级三级| 精品人妻av区波多野结依| 久久免费精品拍拍一区二区| 丰满的人妻一区二区三区| 日韩精品免费一区二区三区| 亚洲欧洲精品一区二区三区| 99久热只有精品视频最新| 高清一区二区三区不卡免费| 正在播放玩弄漂亮少妇高潮| 老熟女露脸一二三四区| 欧美一区二区三区高潮菊竹| 久久精品少妇内射毛片| 亚洲黄片在线免费小视频| 99久热只有精品视频免费看| 亚洲国产日韩欧美三级| 视频一区二区三区自拍偷| 老司机精品在线你懂的| 99日韩在线视频精品免费| 亚洲国产av精品一区二区| 欧美日韩在线视频一区| 国产精品香蕉免费手机视频| 日本在线不卡高清欧美| 国产av一区二区三区久久不卡| 国产日韩欧美国产欧美日韩 | 99久热只有精品视频免费看| 欧美高潮喷吹一区二区| 欧美性高清一区二区三区视频 | 亚洲中文字幕视频在线播放| 亚洲中文字幕日韩在线| 九九蜜桃视频香蕉视频| 一区二区三区亚洲天堂| 在线观看免费午夜福利|