天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁(yè) > 碩博論文 > 信息類碩士論文 >

基于微博平臺(tái)的文本聚類研究與實(shí)現(xiàn)

發(fā)布時(shí)間:2017-12-30 06:20

  本文關(guān)鍵詞:基于微博平臺(tái)的文本聚類研究與實(shí)現(xiàn) 出處:《西北師范大學(xué)》2015年碩士論文 論文類型:學(xué)位論文


  更多相關(guān)文章: 話題聚類 微博 特征向量 可視化 信息增益


【摘要】:Web2.0的技術(shù)應(yīng)用促進(jìn)了網(wǎng)絡(luò)大數(shù)據(jù)時(shí)代的到來(lái),當(dāng)前微博社交方式已成為社會(huì)網(wǎng)絡(luò)的新媒體,上億用戶的使用極大豐富了網(wǎng)絡(luò)大數(shù)據(jù)的存儲(chǔ),這也使得數(shù)據(jù)的深入分析以及存儲(chǔ)挖掘面臨著極大的挑戰(zhàn)。微博的版塊多樣化,使微博文本信息與傳統(tǒng)的文本信息存在很大差異,微博涉及各個(gè)領(lǐng)域,如市場(chǎng)營(yíng)銷、廣告工藝等,其內(nèi)容更是包羅萬(wàn)象,內(nèi)容的碎片化直接導(dǎo)致了網(wǎng)絡(luò)數(shù)據(jù)結(jié)構(gòu)復(fù)雜內(nèi)容龐大。在這種背景下,快速準(zhǔn)確地挖掘出有效的信息進(jìn)行分析便是當(dāng)前網(wǎng)絡(luò)大數(shù)據(jù)應(yīng)用下的主要研究焦點(diǎn)。在微博軟件應(yīng)用研究開(kāi)發(fā)中,話題聚類技術(shù)是其研究結(jié)構(gòu)中的基礎(chǔ)環(huán)節(jié),在這一環(huán)節(jié)工作中,對(duì)微博文本中的內(nèi)容進(jìn)行分類歸納,可以對(duì)深層的話題進(jìn)行分析。傳統(tǒng)的數(shù)據(jù)挖掘技術(shù)是利用關(guān)鍵字進(jìn)行處理,返回的數(shù)據(jù)大多是內(nèi)容重復(fù)性嚴(yán)重的數(shù)據(jù),并且有些數(shù)據(jù)內(nèi)容關(guān)聯(lián)性較小,浪費(fèi)數(shù)據(jù)處理資源。因此利用傳統(tǒng)的關(guān)鍵字技術(shù)對(duì)于微博數(shù)據(jù)的處理顯得不能滿足要求。因此本文基于微博平臺(tái)通過(guò)采用微博文本智能處理算法可以很好的解決這一問(wèn)題。本文需要采集微博文本信息數(shù)據(jù)并對(duì)采集的信息進(jìn)行數(shù)據(jù)預(yù)處理,其次對(duì)文本特征詞進(jìn)行篩選,并通過(guò)利用微博短文本特征,尋找研究特征詞以及篩選特征詞的最優(yōu)方法。針對(duì)微博的特性,研究算法,使得該算法對(duì)微博文本的聚類結(jié)果達(dá)到最優(yōu)化。對(duì)聚類分析的結(jié)果進(jìn)行可視化處理,使文本聚類的結(jié)果清晰明了。最后,通過(guò)實(shí)驗(yàn)驗(yàn)證方法的有效性,并對(duì)文中出現(xiàn)的問(wèn)題做進(jìn)一步研究。
[Abstract]:......
【學(xué)位授予單位】:西北師范大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2015
【分類號(hào)】:TP391.1

【相似文獻(xiàn)】

相關(guān)期刊論文 前10條

1 趙亞琴;周獻(xiàn)中;;一種基于小生境遺傳算法的中文文本聚類新方法[J];計(jì)算機(jī)工程;2006年06期

2 劉務(wù)華;羅鐵堅(jiān);王文杰;;文本聚類技術(shù)的有效性驗(yàn)證[J];計(jì)算機(jī)工程;2007年01期

3 丁X;許侃;;基于文本聚類方法的我國(guó)科技管理研究領(lǐng)域的計(jì)量研究[J];科學(xué)學(xué)研究;2007年S1期

4 孫愛(ài)香;楊鑫華;;關(guān)于文本聚類有效性評(píng)價(jià)的研究[J];山東理工大學(xué)學(xué)報(bào)(自然科學(xué)版);2007年05期

5 丘志宏;宮雷光;;利用上下文提高文本聚類的效果[J];中文信息學(xué)報(bào);2007年06期

6 吳啟明;易云飛;;文本聚類綜述[J];河池學(xué)院學(xué)報(bào);2008年02期

7 李江華;楊書(shū)新;劉利峰;;基于概念格的文本聚類[J];計(jì)算機(jī)應(yīng)用;2008年09期

8 趙文鵬;;淺談文本聚類研究[J];企業(yè)家天地下半月刊(理論版);2009年02期

9 章成志;;文本聚類結(jié)果描述研究綜述[J];現(xiàn)代圖書(shū)情報(bào)技術(shù);2009年02期

10 馬娜;;文本聚類研究[J];電腦知識(shí)與技術(shù);2009年20期

相關(guān)會(huì)議論文 前10條

1 趙世奇;劉挺;李生;;一種基于主題的文本聚類方法[A];第三屆學(xué)生計(jì)算語(yǔ)言學(xué)研討會(huì)論文集[C];2006年

2 王洪俊;俞士汶;蘇祺;施水才;肖詩(shī)斌;;中文文本聚類的特征單元比較[A];第二屆全國(guó)信息檢索與內(nèi)容安全學(xué)術(shù)會(huì)議(NCIRCS-2005)論文集[C];2005年

3 胡吉祥;許洪波;劉悅;王斌;程學(xué)旗;;基于重復(fù)串的短文本聚類研究[A];全國(guó)第八屆計(jì)算語(yǔ)言學(xué)聯(lián)合學(xué)術(shù)會(huì)議(JSCL-2005)論文集[C];2005年

4 白剛;張錚;丁宗堯;朱毅;;中文文本聚類在互聯(lián)網(wǎng)搜索的研究與應(yīng)用[A];第三屆全國(guó)信息檢索與內(nèi)容安全學(xué)術(shù)會(huì)議論文集[C];2007年

5 王明文;付劍波;羅遠(yuǎn)勝;陸旭;;基于協(xié)同聚類的兩階段文本聚類方法研究[A];第四屆全國(guó)信息檢索與內(nèi)容安全學(xué)術(shù)會(huì)議論文集(上)[C];2008年

6 張猛;王大玲;于戈;;一種基于自動(dòng)閾值發(fā)現(xiàn)的文本聚類方法[A];第二十一屆中國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(研究報(bào)告篇)[C];2004年

7 王樂(lè);田李;賈焰;韓偉紅;;一個(gè)并行的文本聚類混合算法[A];第二十四屆中國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(研究報(bào)告篇)[C];2007年

8 王瑩;劉楊;;維基百科的文本聚類方法分析[A];2009年研究生學(xué)術(shù)交流會(huì)通信與信息技術(shù)論文集[C];2009年

9 張寶艷;王慶輝;;中文文本聚類的研究與實(shí)現(xiàn)[A];第一屆學(xué)生計(jì)算語(yǔ)言學(xué)研討會(huì)論文集[C];2002年

10 章成志;;基于多語(yǔ)文本聚類的主題層次體系生成研究1)[A];國(guó)家自然科學(xué)基金委員會(huì)管理科學(xué)部宏觀管理與政策學(xué)科青年基金獲得者交流研討會(huì)論文集[C];2010年

相關(guān)博士學(xué)位論文 前3條

1 徐森;文本聚類集成關(guān)鍵技術(shù)研究[D];哈爾濱工程大學(xué);2010年

2 高茂庭;文本聚類分析若干問(wèn)題研究[D];天津大學(xué);2007年

3 孟憲軍;互聯(lián)網(wǎng)文本聚類與檢索技術(shù)研究[D];哈爾濱工業(yè)大學(xué);2009年

相關(guān)碩士學(xué)位論文 前10條

1 康健;基于Multi-agent和群體智能的藏文網(wǎng)絡(luò)輿情管理研究[D];西南交通大學(xué);2015年

2 張培偉;基于改進(jìn)Single-Pass算法的熱點(diǎn)話題發(fā)現(xiàn)系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D];華中師范大學(xué);2015年

3 郭士串;結(jié)合權(quán)重因子與特征向量的文本聚類研究與應(yīng)用[D];江西理工大學(xué);2015年

4 邵明來(lái);中文文本聚類關(guān)鍵技術(shù)研究[D];廣西大學(xué);2015年

5 王恒靜;基于詞類和搭配的微博輿情文本聚類方法研究[D];江蘇科技大學(xué);2015年

6 吳潔潔;基于RI方法的文本聚類研究[D];南昌大學(xué);2015年

7 樊兆欣;個(gè)性化新聞推薦系統(tǒng)關(guān)鍵技術(shù)研究與實(shí)現(xiàn)[D];北京理工大學(xué);2015年

8 蘇圣瞳;微博熱點(diǎn)話題發(fā)現(xiàn)系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D];復(fù)旦大學(xué);2014年

9 孫東普;融合屬性抽取的多粒度專利文本聚類研究[D];大連理工大學(xué);2015年

10 李蕓;基于爬蟲(chóng)和文本聚類分析的網(wǎng)絡(luò)輿情分析系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)[D];電子科技大學(xué);2014年

,

本文編號(hào):1353711

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/shoufeilunwen/xixikjs/1353711.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶1c0ab***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com
欧美日韩国产一级91| 亚洲国产欧美精品久久| 国产户外勾引精品露出一区| 美国女大兵激情豪放视频播放| 麻豆看片麻豆免费视频| 亚洲一区二区精品久久av| 日韩成人h视频在线观看| 视频一区二区三区自拍偷| 成年人视频日本大香蕉久久| 精品少妇人妻av免费看| 午夜视频成人在线观看| 欧美日韩精品久久第一页| 国产欧美韩日一区二区三区| 日韩精品少妇人妻一区二区| 日韩一级毛一欧美一级乱| 久久热中文字幕在线视频| 丰满人妻一二区二区三区av| 免费观看一区二区三区黄片| 欧美一区二区三区不卡高清视| 久久99精品国产麻豆婷婷洗澡 | 欧美不卡高清一区二区三区| 在线观看免费午夜福利| 亚洲欧美中文字幕精品| 精品人妻一区二区四区| 国产av精品一区二区| 欧美日韩一级黄片免费观看| 99国产高清不卡视频| 欧美精品专区一区二区| 国产在线观看不卡一区二区| 五月天婷亚洲天婷综合网| 在线免费国产一区二区三区| 国产精品久久精品毛片| 国产原创激情一区二区三区| 午夜精品麻豆视频91| 一本色道久久综合狠狠躁| 亚洲精品熟女国产多毛| 人妻熟女欲求不满一区二区| 国产又色又爽又黄又免费| 欧美性欧美一区二区三区| 日韩人妻少妇一区二区| 国产级别精品一区二区视频|