面向社會(huì)媒體的文本和屬性分析技術(shù)研究
發(fā)布時(shí)間:2021-09-28 08:39
近年來,隨著社會(huì)媒體網(wǎng)站的興起,越來越多的用戶參與到其中。社會(huì)媒體已經(jīng)成為用戶日常生活中必不可少的一部分。在目前以互聯(lián)網(wǎng)為導(dǎo)向的大環(huán)境中,對(duì)社會(huì)媒體中與用戶相關(guān)的內(nèi)容進(jìn)行深入理解和挖掘是一個(gè)非常重要的研究方向,具有重要的學(xué)術(shù)價(jià)值和應(yīng)用價(jià)值。社會(huì)媒體除了豐富人們的生活,也為研究用戶的文本內(nèi)容和屬性帶來了機(jī)遇與挑戰(zhàn)。首先,用戶所寫的文本內(nèi)容豐富多樣;其次,用戶的屬性信息也復(fù)雜多變,這些都為相關(guān)研究帶來了很大的挑戰(zhàn)。本研究的主要內(nèi)容是面向社會(huì)媒體中與用戶相關(guān)的文本內(nèi)容和屬性的分析技術(shù)。針對(duì)文本內(nèi)容和屬性,本研究分別設(shè)計(jì)了相應(yīng)的模型對(duì)數(shù)據(jù)進(jìn)行建模,以期更好地理解社會(huì)媒體中的用戶。本研究的主要內(nèi)容和創(chuàng)新點(diǎn)總結(jié)如下:(1)建模文本內(nèi)容,提出一種自動(dòng)挖掘辯論文本中的組織短語的無監(jiān)督模型。當(dāng)用戶與其他人辯論的時(shí)候,除了會(huì)使用與辯論主題相關(guān)的聲明和證據(jù)外,還會(huì)使用將證據(jù)和聲明聯(lián)系起來的組織短語(簡稱為shell)。本研究探討如何通過無監(jiān)督的方法區(qū)分shell與主題內(nèi)容;诖,本研究提出了一種隱變量模型——shell主題模型(簡稱為STM)來同時(shí)建模主題和shell。對(duì)于組織短語,本研究使用二元模型對(duì)其...
【文章來源】:北京理工大學(xué)北京市 211工程院校 985工程院校
【文章頁數(shù)】:120 頁
【學(xué)位級(jí)別】:博士
【部分圖文】:
PLSA模型的圖模型表示PLSA模型假設(shè)每個(gè)文檔有多個(gè)主題ˋ并且這些主題在文檔中所占比例不同在
LDA的圖模型表示
看法ˋ來揭露對(duì)方所述觀點(diǎn)的矛盾ˋ以便得到共同的認(rèn)知和意見 除了日常生活中的口頭辯論ˋ書面辯論也是一種重要的辯論方式 辯論文本就是一種用于說服對(duì)方的文本 傳統(tǒng)的辯論文本包括議論短文 法律文件和議會(huì)辯論實(shí)錄等 作為社會(huì)媒體的一種表現(xiàn)形式ˋ在線討論論壇和辯論論壇也越來越流行ˋ辯論論壇為用戶提供了針對(duì)實(shí)事或者熱點(diǎn)的虛擬辯論平臺(tái) 圖 2.1 展示了辯論論壇的一個(gè)實(shí)例
【參考文獻(xiàn)】:
期刊論文
[1]微博中基于多關(guān)系網(wǎng)絡(luò)的話題影響力個(gè)體挖掘(英文)[J]. 丁兆云,賈焰,周斌,韓毅. 中國通信. 2013(01)
本文編號(hào):3411586
【文章來源】:北京理工大學(xué)北京市 211工程院校 985工程院校
【文章頁數(shù)】:120 頁
【學(xué)位級(jí)別】:博士
【部分圖文】:
PLSA模型的圖模型表示PLSA模型假設(shè)每個(gè)文檔有多個(gè)主題ˋ并且這些主題在文檔中所占比例不同在
LDA的圖模型表示
看法ˋ來揭露對(duì)方所述觀點(diǎn)的矛盾ˋ以便得到共同的認(rèn)知和意見 除了日常生活中的口頭辯論ˋ書面辯論也是一種重要的辯論方式 辯論文本就是一種用于說服對(duì)方的文本 傳統(tǒng)的辯論文本包括議論短文 法律文件和議會(huì)辯論實(shí)錄等 作為社會(huì)媒體的一種表現(xiàn)形式ˋ在線討論論壇和辯論論壇也越來越流行ˋ辯論論壇為用戶提供了針對(duì)實(shí)事或者熱點(diǎn)的虛擬辯論平臺(tái) 圖 2.1 展示了辯論論壇的一個(gè)實(shí)例
【參考文獻(xiàn)】:
期刊論文
[1]微博中基于多關(guān)系網(wǎng)絡(luò)的話題影響力個(gè)體挖掘(英文)[J]. 丁兆云,賈焰,周斌,韓毅. 中國通信. 2013(01)
本文編號(hào):3411586
本文鏈接:http://sikaile.net/shoufeilunwen/xxkjbs/3411586.html
最近更新
教材專著