天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

交互式主題建模方法及其應(yīng)用研究

發(fā)布時間:2021-10-31 18:39
  隨著社交媒體和移動互聯(lián)網(wǎng)的發(fā)展,用戶生成內(nèi)容的速度越來越快,用戶發(fā)布的文本數(shù)量也越來越多,使得網(wǎng)絡(luò)信息飛速增長。對文本進行挖掘處理有著很重要的意義。近年來,主題建模方法成為文本挖掘的一個研究熱點,但由于文本特征的復雜性,特別是面向短文本挖掘,主題模型還存在著許多挑戰(zhàn)。本文以交互式主題建模方法為研究目標,以組合建模和不確定性推斷為工具,研究基于人工交互的主題建模方法及其應(yīng)用。主要研究思路如下:首先,考慮單人交互式主題建模方法,假設(shè)模型的參與者為單一的專家用戶,以專家知識為背景研究單個用戶與主題模型的交互策略,并基于專家的交互結(jié)果提出新的主題模型。然后,基于多個用戶提供反饋的場景,考慮不同背景的用戶知識,研究基于眾包的主題建模方法。最后,基于單人交互式和多人交互式的主題建模方法,以用戶角色發(fā)現(xiàn)和信息服務(wù)匹配為目標,研究交互式主題建模方法在不同場景下的應(yīng)用。具體研究工作和創(chuàng)新點如下:(1)基于單人交互式主題建模方法。為了研究專家知識對主題建模的作用,本文提出了一種基于單人交互的主題模型。模型提供了多種交互策略,使專家可以根據(jù)初步的主題建模結(jié)果靈活地調(diào)整主題分布中令人困惑的單詞,并采用了不同的... 

【文章來源】:合肥工業(yè)大學安徽省 211工程院校 教育部直屬院校

【文章頁數(shù)】:113 頁

【學位級別】:博士

【部分圖文】:

交互式主題建模方法及其應(yīng)用研究


圖1.4ITM過程??Fig?l.4?The?process?of?ITM??

主題,單詞,中包


單詞都可以支持用戶對該主題的理解,-?些單詞的存在與主題所表達的含義并不??相關(guān)。??圖2.1顯示了使用LDA在路透社語料庫[44]中發(fā)現(xiàn)的兩個主題。主題(a)的含義??是不明確的,因為該主題由關(guān)于疾病、生活、經(jīng)濟等單詞的混合詞組成。而對于??主題(b)來說,人們可以猜測主題(b)是生物醫(yī)學新聞,但是,主題中的“right”和“float”??這些單詞令人困惑。??s?t?rut?hers?wel?lefneyer??papyrus?end?T'ight?trademark??nasd?cancer?]1〇n?s?jckle?s;°^.??result?j3re-tax?,?del?hi??u—?Cyprus?cell?il〇dtCell?testi|i<7??,hare?lifestyle?eat?—rne?t?eSt??siemens?diagnosis?researcher??carcinossa?hunian?COf油..iCt?technology?gardini?current??contraceptive?berns?t?e?I?n??(a)?(b)??圖2.1無意義的主題(a)和有意義的主題中包含了無意義的單詞(b)??Fig?2.1?Two?topics?mined?from?Reuters?corpus??在線社交媒體的基本特征是言論自由,造成用戶生成內(nèi)容具有無規(guī)則性,進??而使主題一致性成為LDA及其改進模型的難題。為了評價主題的質(zhì)量,Newman??等人引入了一種評估主題一致性的新指標coherence

框架圖,框架,單詞,主題


人類知識被廣泛證明是提高理論模型性能的有用因素。本章旨在將人類專家??的知識整合到主題模型中,并提出新的互動策略來挖掘高質(zhì)量的主題。本章所提??出的iLDA模型的框架如圖2.2所示。如圖2.2所示,iLDA首先通過經(jīng)典主題模型??生成初步的主題-單詞分布,然后iLDA將選擇需要被調(diào)整的主題,將該主題下最??高概率的單詞列表呈現(xiàn)給專家,允許人類專家根據(jù)其背景知識調(diào)整該主題-單詞分??布中不合理的單詞,可以以一定的概率降低某個單詞在主題中的概率。由于主題―??單詞的分布是多項式分布,其概率總和為1,專家降低了不相關(guān)單詞的概率后需要??增加其他相關(guān)單詞的概率,因此模型將根據(jù)專家調(diào)整多出的概率部分分配到剩下??的單詞中,進而生成基于專家知識背景的主觀主題-單詞分布。最終合并主觀和客??觀主題-單詞分布以生成全面的主題詞分布,用于探索下一代主題。重復交互過程,??直到獲得一致且高質(zhì)量的主題為止。??n?n?I??□?i|??:步騷一???計眞客觀芏題???彡.纖布?- ̄ ̄—??!/?^?^???i要涊猶3纖?r??^?1—■r?????

【參考文獻】:
期刊論文
[1]基于概率主題模型的物聯(lián)網(wǎng)服務(wù)發(fā)現(xiàn)[J]. 魏強,金芝,許焱.  軟件學報. 2014(08)
[2]基于LDA的微博文本主題建模方法研究述評[J]. 張培晶,宋蕾.  圖書情報工作. 2012(24)

博士論文
[1]基于概率主題模型的情境建模方法研究[D]. 懷寶興.中國科學技術(shù)大學 2014
[2]基于主題模型的用戶建模研究[D]. 李文峰.北京郵電大學 2013
[3]基于主題模型和隨機游走的標簽技術(shù)研究[D]. 孫甲申.北京郵電大學 2013
[4]基于概率生成模型的文本主題建模及其應(yīng)用[D]. 丁軼群.浙江大學 2010



本文編號:3468650

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/jingjilunwen/xmjj/3468650.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶43aae***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com
草草夜色精品国产噜噜竹菊| 日韩一区二区三区观看| 精品国产亚洲免费91| 字幕日本欧美一区二区| 欧美日韩视频中文字幕| 丰满人妻一二三区av| 精品老司机视频在线观看| 精品国产品国语在线不卡| 日本特黄特色大片免费观看| 五月婷婷综合缴情六月| 免费大片黄在线观看国语| 最近最新中文字幕免费| 久热久热精品视频在线观看 | 亚洲av熟女国产一区二区三区站| 亚洲国产成人爱av在线播放下载| 欧美国产日本高清在线| 亚洲第一视频少妇人妻系列| 国产永久免费高清在线精品| 老熟妇2久久国内精品| 免费播放一区二区三区四区| 日韩精品你懂的在线观看| 中文字幕亚洲精品人妻| 少妇熟女精品一区二区三区| 中文字幕有码视频熟女| 中国少妇精品偷拍视频 | 欧美大胆美女a级视频| 中文文精品字幕一区二区| 美国黑人一级黄色大片| 四十女人口红哪个色好看| 日本人妻精品中文字幕不卡乱码 | 人人爽夜夜爽夜夜爽精品视频| 黄片免费在线观看日韩| 激情偷拍一区二区三区视频| 91精品视频免费播放| av一区二区三区天堂| 国产一级二级三级观看| 国产欧美一区二区色综合| 久久人人爽人人爽大片av| 中文人妻精品一区二区三区四区| 深夜福利欲求不满的人妻| 国产偷拍盗摄一区二区|