天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 碩博論文 > 信息類博士論文 >

基于主題模型的多標(biāo)簽文本分類和流文本數(shù)據(jù)建模若干問題研究

發(fā)布時(shí)間:2016-12-31 08:05

  本文關(guān)鍵詞:基于主題模型的多標(biāo)簽文本分類和流文本數(shù)據(jù)建模若干問題研究,由筆耕文化傳播整理發(fā)布。


《吉林大學(xué)》 2015年

基于主題模型的多標(biāo)簽文本分類和流文本數(shù)據(jù)建模若干問題研究

李熙銘  

【摘要】:文本數(shù)據(jù)是普遍存在的一種數(shù)據(jù)類型,如何分析文本并提煉有用的信息具有重要的意義。主題模型是現(xiàn)今最有效的文本分析算法族之一,本文基于主題模型,研究兩個(gè)亟待解決的文本分析問題:多標(biāo)簽文本分類問題和流文本數(shù)據(jù)建模問題。 多標(biāo)簽文本分類:本文針對(duì)現(xiàn)存有監(jiān)督主題模型存在模型可擴(kuò)展性較差,沒有考慮標(biāo)簽相關(guān)性,標(biāo)簽出現(xiàn)頻率和詞項(xiàng)的標(biāo)簽頻率等問題,提出一些改進(jìn)算法,包括SL-LDA模型,LSTM算法,F(xiàn)LDA模型,DFLDA模型和CPTM算法。實(shí)驗(yàn)結(jié)果表明,相比常用的經(jīng)典分類算法,所提出算法的多標(biāo)簽分類性能更優(yōu);特別地,所提出算法對(duì)于偏斜文本集的分類性能有所提升。 流文本數(shù)據(jù)建模:本文針對(duì)現(xiàn)存主題模型在線學(xué)習(xí)算法存在隨機(jī)梯度誤差較大,需要手動(dòng)設(shè)定學(xué)習(xí)速率和主題采樣的時(shí)間復(fù)雜度較高等問題,提出一些改進(jìn)算法,包括MASVI算法,自適應(yīng)學(xué)習(xí)速率算法和SHVG算法。此外,提出了在線版本的期望傳播算法。實(shí)驗(yàn)結(jié)果表明,所提出算法的文本建模性能更優(yōu),且在多數(shù)情況下收斂速度更快。

【關(guān)鍵詞】:
【學(xué)位授予單位】:吉林大學(xué)
【學(xué)位級(jí)別】:博士
【學(xué)位授予年份】:2015
【分類號(hào)】:TP391.1
【目錄】:

下載全文 更多同類文獻(xiàn)

CAJ全文下載

(如何獲取全文? 歡迎:購買知網(wǎng)充值卡、在線充值、在線咨詢)

CAJViewer閱讀器支持CAJ、PDF文件格式


【參考文獻(xiàn)】

中國期刊全文數(shù)據(jù)庫 前1條

1 徐戈;王厚峰;;自然語言處理中主題模型的發(fā)展[J];計(jì)算機(jī)學(xué)報(bào);2011年08期

【共引文獻(xiàn)】

中國期刊全文數(shù)據(jù)庫 前10條

1 焦健;瞿有利;;知網(wǎng)的話題更新與跟蹤算法研究[J];北京交通大學(xué)學(xué)報(bào);2009年05期

2 林正奎;唐煥玲;魯明羽;王敬東;;基于特征多視圖提升Naive Bayesian的Boosting改進(jìn)算法[J];北京交通大學(xué)學(xué)報(bào);2009年06期

3 蔣宗禮;徐學(xué)可;;一種基于集成學(xué)習(xí)與類指示器的文本分類方法[J];北京工業(yè)大學(xué)學(xué)報(bào);2010年04期

4 張國英,沙蕓,劉玉樹;模式識(shí)別中基于Boosting的特征篩選[J];北京理工大學(xué)學(xué)報(bào);2004年07期

5 李寧;徐虹;;基于文本分類的語義平滑在語言模型中的應(yīng)用(英文)[J];成都信息工程學(xué)院學(xué)報(bào);2008年03期

6 榮騰中;劉朝林;徐旺;;多維復(fù)雜分布的MCMC抽樣[J];重慶理工大學(xué)學(xué)報(bào)(自然科學(xué)版);2010年08期

7 管春;周雒維;盧偉國;;基于多標(biāo)簽RBF神經(jīng)網(wǎng)絡(luò)的電能質(zhì)量復(fù)合擾動(dòng)分類方法[J];電工技術(shù)學(xué)報(bào);2011年08期

8 陳歡歡;陶建鋒;周峰;鄭甲子;;基于EPF-IMM算法的高機(jī)動(dòng)目標(biāo)跟蹤研究[J];電光與控制;2010年10期

9 彭云輝;劉云峰;繆棟;楊小岡;;高斯混合粒子濾波器在狀態(tài)估計(jì)中的應(yīng)用[J];彈箭與制導(dǎo)學(xué)報(bào);2007年01期

10 張仲凱;康健;芮國勝;;基于速度約束的粒子濾波算法研究[J];彈箭與制導(dǎo)學(xué)報(bào);2010年01期

中國重要會(huì)議論文全文數(shù)據(jù)庫 前10條

1 毛存禮;余正濤;線巖團(tuán);郭劍毅;雷雄麗;;基于短信的旅游景點(diǎn)酒店問答系統(tǒng)研究[A];中國自動(dòng)化學(xué)會(huì)控制理論專業(yè)委員會(huì)A卷[C];2011年

2 李?yuàn)欑?孫永宣;高雋;謝昭;;層次Dirichlet過程模型下的目標(biāo)分析與識(shí)別[A];2011中國儀器儀表與測控技術(shù)大會(huì)論文集[C];2011年

3 馬驥;朱慕華;肖桐;朱靖波;;面向移進(jìn)-歸約句法分析器的單模型系統(tǒng)融合算法[A];中國計(jì)算語言學(xué)研究前沿進(jìn)展(2009-2011)[C];2011年

4 ;A Collaborative Method for the Localization of Wireless Sensor Network[A];2009中國控制與決策會(huì)議論文集(3)[C];2009年

5 ;Comparison of Text Categorization Algorithms[A];Proceedings of the First Conference on Web Information System and Applications[C];2004年

6 陳慶軒;鄭德權(quán);趙鐵軍;;多分類器融合的文本分類技術(shù)研究[A];2008'中國信息技術(shù)與應(yīng)用學(xué)術(shù)論壇論文集(二)[C];2008年

7 李文波;孫樂;;一種LDA模型的高效并行求解算法[A];第六屆全國信息檢索學(xué)術(shù)會(huì)議論文集[C];2010年

8 張政;周水庚;周傲英;;一種新的基于kNN和Rocchio的文本分類方法[A];第二十一屆中國數(shù)據(jù)庫學(xué)術(shù)會(huì)議論文集(研究報(bào)告篇)[C];2004年

9 鄭偉;王朝坤;劉璋;王建民;;一種基于隨機(jī)游走模型的多標(biāo)簽分類算法[A];NDBC2010第27屆中國數(shù)據(jù)庫學(xué)術(shù)會(huì)議論文集A輯一[C];2010年

10 劉娜;肖智博;路瑩;唐曉君;肖鵬;;自適應(yīng)主題融合的多文檔自動(dòng)摘要算法[A];2013年中國智能自動(dòng)化學(xué)術(shù)會(huì)議論文集(第五分冊(cè))[C];2013年

中國博士學(xué)位論文全文數(shù)據(jù)庫 前10條

1 鄧斌;B2C在線評(píng)論中的客戶知識(shí)管理研究[D];電子科技大學(xué);2010年

2 丁軼群;基于概率生成模型的文本主題建模及其應(yīng)用[D];浙江大學(xué);2010年

3 甘良志;核學(xué)習(xí)算法與集成方法研究[D];浙江大學(xué);2010年

4 孫韶杰;模糊圖像中感興趣信息的盲復(fù)原方法研究[D];國防科學(xué)技術(shù)大學(xué);2010年

5 侯鋒;中文報(bào)業(yè)出版的文字質(zhì)量智能輔助控制技術(shù)研究[D];國防科學(xué)技術(shù)大學(xué);2010年

6 張翔;文本挖掘技術(shù)研究及其在綜合風(fēng)險(xiǎn)信息網(wǎng)絡(luò)中的應(yīng)用[D];西北大學(xué);2011年

7 張小平;主題模型及其在中醫(yī)臨床診療中的應(yīng)用研究[D];北京交通大學(xué);2011年

8 王中鋒;樹型貝葉斯網(wǎng)絡(luò)分類器鑒別式訓(xùn)練研究[D];北京交通大學(xué);2011年

9 凱瑟(Qaisar Abbas);基于皮膚鏡圖像的皮膚病變檢測方法研究[D];華中科技大學(xué);2011年

10 劉沖;模擬電路故障診斷AdaBoost集成學(xué)習(xí)方法研究[D];大連海事大學(xué);2011年

中國碩士學(xué)位論文全文數(shù)據(jù)庫 前10條

1 呂萬里;中文文本分類技術(shù)研究[D];山東科技大學(xué);2010年

2 楊業(yè)強(qiáng);MIMO-OFDM系統(tǒng)天線選擇技術(shù)的研究[D];哈爾濱工程大學(xué);2010年

3 梁曄平;中文文本自動(dòng)分類相關(guān)算法的研究與實(shí)現(xiàn)[D];華南理工大學(xué);2010年

4 蘇麒勻;基于概率的潛在語義分析模型在搜索引擎商業(yè)文本分類系統(tǒng)中的應(yīng)用研究[D];北京交通大學(xué);2011年

5 林淥;基于新聞主題模型的熱點(diǎn)工作挖掘系統(tǒng)[D];浙江大學(xué);2011年

6 薛維;基于非對(duì)稱先驗(yàn)的作者主題模型[D];浙江大學(xué);2011年

7 金瀘均;智能視頻監(jiān)控中的人體目標(biāo)跟蹤研究[D];電子科技大學(xué);2011年

8 周承興;基于隨機(jī)集的多目標(biāo)跟蹤算法研究[D];西安電子科技大學(xué);2011年

9 蔡紹曉;基于粒子濾波的被動(dòng)傳感器多目標(biāo)跟蹤算法研究[D];西安電子科技大學(xué);2011年

10 周旭東;核磁共振譜信號(hào)參數(shù)的RJMCMC估計(jì)[D];西安電子科技大學(xué);2010年

【二級(jí)參考文獻(xiàn)】

中國期刊全文數(shù)據(jù)庫 前3條

1 李文波;孫樂;張大鯤;;基于Labeled-LDA模型的文本分類新算法[J];計(jì)算機(jī)學(xué)報(bào);2008年04期

2 曹娟;張勇東;李錦濤;唐勝;;一種基于密度的自適應(yīng)最優(yōu)LDA模型選擇方法[J];計(jì)算機(jī)學(xué)報(bào);2008年10期

3 石晶;胡明;石鑫;戴國忠;;基于LDA模型的文本分割[J];計(jì)算機(jī)學(xué)報(bào);2008年10期

【相似文獻(xiàn)】

中國期刊全文數(shù)據(jù)庫 前10條

1 唐亮;段建國;許洪波;梁玲;;基于信息論的文本分類模型[J];計(jì)算機(jī)工程與設(shè)計(jì);2008年24期

2 施化吉;王賢川;李星毅;;基于規(guī)則重構(gòu)的關(guān)聯(lián)文本分類[J];計(jì)算機(jī)工程與設(shè)計(jì);2009年03期

3 劉伍穎;王挺;;適于垃圾文本流過濾的條件概率集成方法[J];計(jì)算機(jī)科學(xué)與探索;2010年05期

4 張征杰;王自強(qiáng);;文本分類及算法綜述[J];電腦知識(shí)與技術(shù);2012年04期

5 彭其華;;關(guān)聯(lián)挖掘下的海量文本信息深入挖掘?qū)崿F(xiàn)[J];微電子學(xué)與計(jì)算機(jī);2013年10期

6 汪明霓;BASIC文本系統(tǒng)[J];計(jì)算機(jī)應(yīng)用研究;1988年01期

7 王東興,冷惠文;大量編程用文本數(shù)據(jù)的統(tǒng)一處理[J];鞍山鋼鐵學(xué)院學(xué)報(bào);1997年06期

8 周鵬;數(shù)據(jù)庫中不規(guī)范文本文件的數(shù)據(jù)轉(zhuǎn)換[J];電腦編程技巧與維護(hù);2005年05期

9 谷峰;吳揚(yáng)揚(yáng);;文本分類關(guān)鍵技術(shù)[J];福建電腦;2006年09期

10 宋東風(fēng);張志浩;;短文本數(shù)據(jù)的自動(dòng)分類[J];電腦與信息技術(shù);2007年01期

中國重要會(huì)議論文全文數(shù)據(jù)庫 前10條

1 許君;王朝坤;劉立超;王建民;劉璋;;云環(huán)境中的近似復(fù)制文本檢測[A];第29屆中國數(shù)據(jù)庫學(xué)術(shù)會(huì)議論文集(B輯)(NDBC2012)[C];2012年

2 易天元;葉春生;;工業(yè)鍋爐圖紙輸入的文本數(shù)據(jù)處理[A];1997中國控制與決策學(xué)術(shù)年會(huì)論文集[C];1997年

3 胡蓉;唐常杰;陳敏敏;欒江;;關(guān)聯(lián)規(guī)則制導(dǎo)的遺傳算法在文本分類中的應(yīng)用[A];第十九屆全國數(shù)據(jù)庫學(xué)術(shù)會(huì)議論文集(研究報(bào)告篇)[C];2002年

4 李文波;孫樂;黃瑞紅;馮元勇;張大鯤;;基于Labeled-LDA模型的文本分類新算法[A];第三屆全國信息檢索與內(nèi)容安全學(xué)術(shù)會(huì)議論文集[C];2007年

5 黃云平;孫樂;李文波;;基于上下文圖模型文本表示的文本分類研究[A];第四屆全國信息檢索與內(nèi)容安全學(xué)術(shù)會(huì)議論文集(上)[C];2008年

6 蔣勇;陳曉靜;;一種多方向手寫文本行提取方法[A];第二十七屆中國控制會(huì)議論文集[C];2008年

7 李瑞;王朝坤;鄭偉;王建民;王偉平;;基于MapReduce框架的近似復(fù)制文本檢測[A];NDBC2010第27屆中國數(shù)據(jù)庫學(xué)術(shù)會(huì)議論文集(B輯)[C];2010年

8 胡俊;黃厚寬;;一種基于SVM的可視化文本分類的方法[A];第二十一屆中國數(shù)據(jù)庫學(xué)術(shù)會(huì)議論文集(技術(shù)報(bào)告篇)[C];2004年

9 勞錦明;韋崗;;文本壓縮技術(shù)研究的新進(jìn)展[A];開創(chuàng)新世紀(jì)的通信技術(shù)——第七屆全國青年通信學(xué)術(shù)會(huì)議論文集[C];2001年

10 江荻;;藏語文本信息處理的歷程與進(jìn)展[A];中文信息處理前沿進(jìn)展——中國中文信息學(xué)會(huì)二十五周年學(xué)術(shù)會(huì)議論文集[C];2006年

中國重要報(bào)紙全文數(shù)據(jù)庫 前2條

1 戴洪玲;[N];中國電腦教育報(bào);2004年

2 山東 黃家貞;[N];電腦報(bào);2001年

中國博士學(xué)位論文全文數(shù)據(jù)庫 前10條

1 孫曉華;基于聚類的文本機(jī)會(huì)發(fā)現(xiàn)關(guān)鍵問題研究[D];哈爾濱工程大學(xué);2010年

2 胡明涵;面向領(lǐng)域的文本分類與挖掘關(guān)鍵技術(shù)研究[D];東北大學(xué) ;2009年

3 尚文倩;文本分類及其相關(guān)技術(shù)研究[D];北京交通大學(xué);2007年

4 霍躍紅;典籍英譯譯者文體分析與文本的譯者識(shí)別[D];大連理工大學(xué);2010年

5 熊云波;文本信息處理的若干關(guān)鍵技術(shù)研究[D];復(fù)旦大學(xué);2006年

6 李自強(qiáng);大規(guī)模文本分類的若干問題研究[D];電子科技大學(xué);2013年

7 楊震;文本分類和聚類中若干問題的研究[D];北京郵電大學(xué);2007年

8 章舜仲;文本分類中詞共現(xiàn)關(guān)系的研究及其應(yīng)用[D];南京理工大學(xué);2010年

9 趙玉茗;文本間語義相關(guān)性計(jì)算及其應(yīng)用研究[D];哈爾濱工業(yè)大學(xué);2009年

10 張友華;面向智能服務(wù)的Web內(nèi)容計(jì)算研究與應(yīng)用[D];中國科學(xué)技術(shù)大學(xué);2006年

中國碩士學(xué)位論文全文數(shù)據(jù)庫 前10條

1 姜英杰;基于本體的短文本分類研究[D];東北師范大學(xué);2010年

2 楊碩;基于VSM文本分類系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D];大連理工大學(xué);2006年

3 馬淵;短文本情感分析技術(shù)研究[D];重慶大學(xué);2011年

4 張超;文本OLAP關(guān)鍵技術(shù)研究[D];山東大學(xué);2012年

5 王寶龍;面向新聞?lì)I(lǐng)域的文本數(shù)據(jù)獲取系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D];北京郵電大學(xué);2010年

6 曾洪波;基于類別裁剪和模糊理論的文本分類算法研究[D];暨南大學(xué);2011年

7 徐立新;互聯(lián)網(wǎng)文本視頻過濾技術(shù)研究與應(yīng)用[D];電子科技大學(xué);2010年

8 梁鵬鵬;概率主題模型及其在關(guān)聯(lián)文本分類中的應(yīng)用研究[D];鄭州大學(xué);2011年

9 劉超;基于主題挖掘和覆蓋的文本分類研究[D];安徽大學(xué);2011年

10 蔡月紅;基于類短語串和半監(jiān)督學(xué)習(xí)的短文本分類研究[D];江蘇大學(xué);2010年


  本文關(guān)鍵詞:基于主題模型的多標(biāo)簽文本分類和流文本數(shù)據(jù)建模若干問題研究,由筆耕文化傳播整理發(fā)布。



本文編號(hào):228998

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/shoufeilunwen/xxkjbs/228998.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶7e6f3***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com