天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當前位置:主頁 > 科技論文 > 軟件論文 >

基于LDA模型的移動投訴文本熱點話題識別

發(fā)布時間:2018-03-03 23:04

  本文選題:移動投訴 切入點:k-means 出處:《數(shù)據(jù)分析與知識發(fā)現(xiàn)》2017年02期  論文類型:期刊論文


【摘要】:【目的】運用中文信息處理和話題識別與追蹤的方法,從大量移動投訴文本中找出有價值的信息!痉椒ā繌姆治鐾对V文本的特點入手,使用k-means先對文本聚類。利用LDA對每個類進行建模,提取話題,并從詞頻、詞跨度和詞長三方面計算每個話題中詞的權值,把權重最大的詞作為該話題的標簽,并計算每個話題的文檔分布概率均值。對具有相同標簽的話題,先按照均值最大的原則去掉重復標簽話題,再對所有話題計算文檔支持率,并將文檔支持率作為話題的熱度,通過熱度區(qū)分熱點話題和一般話題!窘Y果】對投訴文本進行時間上的建模,通過對比一般話題和熱點話題,得出熱點話題的支持文檔率至少是一般話題的3倍,支持文檔率變化趨勢也比一般話題高,說明本文算法是有效的!揪窒蕖繘]有考慮到話題之間的語義關系!窘Y論】利用LDA模型對移動投訴話題檢測初探的方法是比較合理和有效的,對今后此領域的研究具有一定的借鑒意義。
[Abstract]:[objective] to find out valuable information from a large number of mobile complaint texts by means of Chinese information processing and topic recognition and tracking. [methods] starting with the analysis of the characteristics of complaint texts, Using k-means to cluster the text first. Using LDA to model each class, extract the topic, and calculate the word weight of each topic from three aspects of word frequency, word span and word length, take the words with the largest weight as the label of the topic. The document distribution probability mean of each topic is calculated. For the topic with the same label, the repetitive tagged topic is removed according to the principle of maximum mean value, then the document approval rate is calculated for all topics, and the document approval rating is regarded as the hot spot of the topic. Using heat to distinguish hot topic from general topic. [results] the time model of complaint text is established. By comparing general topic with hot topic, the supporting document rate of hot topic is at least three times as high as that of general topic. The trend of supporting document rate changes is also higher than that of general topics, It shows that this algorithm is effective. [limitation] does not take into account the semantic relationship between topics. [conclusion] the method of using LDA model to detect mobile complaint topics is reasonable and effective. It has certain reference significance to the future research in this field.
【作者單位】: 杭州電子科技大學計算機學院;中國計量大學;
【基金】:國家自然科學基金青年基金項目“引入涉身認知機制的漢語隱喻計算模型及其實現(xiàn)”(項目編號:61103101);國家自然科學基金青年基金項目“基于馬爾科夫樹與DRT的漢語句群自動劃分算法研究”(項目編號:61202281) 教育部人文社會科學研究青年基金項目“面向信息處理的漢語隱喻計算研究”(項目編號:10YJCZH052)的研究成果之一
【分類號】:TP391.1

【參考文獻】

相關期刊論文 前7條

1 關鵬;王曰芬;;科技情報分析中LDA主題模型最優(yōu)主題數(shù)確定方法研究[J];現(xiàn)代圖書情報技術;2016年09期

2 徐佳俊;楊樝;姚天f ;付中陽;;基于LDA模型的論壇熱點話題識別和追蹤[J];中文信息學報;2016年01期

3 伍萬坤;吳清烈;顧錦江;;基于EM-LDA綜合模型的電商微博熱點話題發(fā)現(xiàn)[J];現(xiàn)代圖書情報技術;2015年11期

4 唐曉波;向坤;;基于LDA模型和微博熱度的熱點挖掘[J];圖書情報工作;2014年05期

5 張培晶;宋蕾;;基于LDA的微博文本主題建模方法研究述評[J];圖書情報工作;2012年24期

6 張晨逸;孫建伶;丁軼群;;基于MB-LDA模型的微博主題挖掘[J];計算機研究與發(fā)展;2011年10期

7 吳夙慧;成穎;鄭彥寧;潘云濤;;K-means算法研究綜述[J];現(xiàn)代圖書情報技術;2011年05期

相關碩士學位論文 前1條

1 朱穎;基于微博的熱點話題發(fā)現(xiàn)[D];西南大學;2014年

【共引文獻】

相關期刊論文 前10條

1 崔金棟;杜文強;關楊;羅文達;;微博用戶信息個性化推薦主題模型LDA演化分析研究[J];情報科學;2017年08期

2 李婷;陳元春;;基于核距離的聚類算法分析介紹[J];科技展望;2017年21期

3 張申旭;黃震華;;基于多特征的微博熱點主題發(fā)現(xiàn)算法的研究[J];現(xiàn)代計算機(專業(yè)版);2017年19期

4 梁珊;邱明濤;馬靜;;基于LDA-WO混合模型的微博話題有序特征抽取研究[J];情報科學;2017年07期

5 杜秀英;;基于聚類與語義相似分析的多文本自動摘要方法[J];情報雜志;2017年06期

6 張斌;彭其淵;;基于KFAV的中國鐵路貨運客戶細分方法研究[J];交通運輸系統(tǒng)工程與信息;2017年03期

7 孟佳偉;孫紅;;基于Hadoop平臺的K-means算法優(yōu)化綜述[J];軟件導刊;2017年06期

8 馬林進;萬良;馬紹菊;楊婷;易輝凡;;基于詞袋模型的分布式拒絕服務攻擊檢測[J];計算機應用;2017年06期

9 喬琳;胡濤;朱金悅;;基于最小生成樹的K-means驢友結伴推薦算法研究[J];現(xiàn)代商業(yè);2017年16期

10 鄧丹君;姚莉;;基于微博標簽和LDA的微博主題提取算法[J];計算機與數(shù)字工程;2017年05期

相關碩士學位論文 前3條

1 王晶;基于社交媒體的熱點主題挖掘及主題演化分析[D];西南大學;2016年

2 趙寶鈺;基于內外部數(shù)據(jù)結合的港口客戶風險控制系統(tǒng)研究[D];北京交通大學;2016年

3 伍萬坤;面向社交商務的大數(shù)據(jù)分析方法研究[D];東南大學;2015年

【二級參考文獻】

相關期刊論文 前10條

1 劉彤;楊冠燦;蔣繼婭;郭魯鋼;;基于多重關系的專利網(wǎng)絡演化特征與動態(tài)分析——以鋰離子電池領域為例[J];情報學報;2014年12期

2 張晗;徐碩;喬曉東;;融合科技文獻內外部特征的主題模型發(fā)展綜述[J];情報學報;2014年10期

3 范云滿;馬建霞;;基于LDA與新興主題特征分析的新興主題探測研究[J];情報學報;2014年07期

4 唐曉波;向坤;;基于LDA模型和微博熱度的熱點挖掘[J];圖書情報工作;2014年05期

5 郭紅鈺;;基于信息熵理論的特征權重算法研究[J];計算機工程與應用;2013年10期

6 張培晶;宋蕾;;基于LDA的微博文本主題建模方法研究述評[J];圖書情報工作;2012年24期

7 趙迎光;安新穎;李勇;賈曉峰;;一種基于生命周期理論的文獻熱點發(fā)現(xiàn)方法——以腫瘤領域為例[J];現(xiàn)代圖書情報技術;2012年11期

8 王李冬;魏寶剛;袁杰;;基于概率主題模型的文檔聚類[J];電子學報;2012年11期

9 蔡淑琴;張靜;王e,

本文編號:1563066


資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/1563066.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權申明:資料由用戶ad36e***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com
欧美丰满大屁股一区二区三区| 五月婷婷六月丁香在线观看| 久久热在线视频免费观看| 日韩不卡一区二区在线| 日本不卡一本二本三区| 亚洲伦片免费偷拍一区| 国产精品99一区二区三区| 日韩高清一区二区三区四区| 亚洲欧美日韩在线看片| 亚洲熟妇中文字幕五十路| 黄片免费在线观看日韩| 欧美乱妇日本乱码特黄大片| 日本一区不卡在线观看| 美国女大兵激情豪放视频播放| 国内女人精品一区二区三区| 国产精品日韩欧美一区二区| 久久精品国产亚洲av久按摩| 国产成人精品资源在线观看| 免费高清欧美一区二区视频| 亚洲天堂精品1024| 99精品人妻少妇一区二区人人妻| 免费一区二区三区少妇| 这里只有九九热精品视频| 亚洲专区一区中文字幕| 99久久精品国产日本| 久久精品国产第一区二区三区| 久久国产精品热爱视频| 色哟哟在线免费一区二区三区| 欧美日韩综合免费视频| 久久精品免费视看国产成人| 色婷婷成人精品综合一区| 欧美尤物在线视频91| 在线观看视频成人午夜| 亚洲精品偷拍一区二区三区 | 日本不卡一本二本三区| 久久精品少妇内射毛片| 初尝人妻少妇中文字幕在线| 欧美日韩精品人妻二区三区| 国产内射一级一片内射高清视频| 国产老女人性生活视频| 免费啪视频免费欧美亚洲|