天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 軟件論文 >

跨媒體話題檢測與觀點(diǎn)分析研究

發(fā)布時(shí)間:2021-01-03 00:21
  近年來,社交網(wǎng)站中圖片及視頻爆炸式的增長,當(dāng)今的互聯(lián)網(wǎng)呈現(xiàn)跨媒體的趨勢?缑襟w數(shù)據(jù)指多個(gè)社交網(wǎng)站中多種模態(tài)的數(shù)據(jù),它們之間的底層表現(xiàn)異構(gòu)性,給跨媒體數(shù)據(jù)語義關(guān)聯(lián)的挖掘帶來困難。且由于社交網(wǎng)站是人們獲取并討論熱點(diǎn)話題的聚集地,面向社交網(wǎng)站“話題”分析的跨媒體話題檢測與觀點(diǎn)分析成為輿情分析領(lǐng)域的重要研究課題。但現(xiàn)有研究幾乎沒有專門針對多個(gè)社交網(wǎng)站且多種模態(tài)數(shù)據(jù)的,未能準(zhǔn)確抓住跨媒體數(shù)據(jù)的特點(diǎn),導(dǎo)致研究結(jié)果的片面性。因此,本課題對跨媒體數(shù)據(jù)的話題檢測和觀點(diǎn)分析進(jìn)行研究。該研究課題依托于北京市教育委員會的科學(xué)研究與研究生培養(yǎng)共建的科研項(xiàng)目——基于社交感知的跨媒體數(shù)據(jù)分析與挖掘研究。本論文旨在通過這兩個(gè)研究,對社交網(wǎng)站上的熱門話題進(jìn)行深入的輿情分析,主要的研究內(nèi)容和創(chuàng)新成果如下:1.針對跨媒體數(shù)據(jù)的表現(xiàn)形式異構(gòu)導(dǎo)致無法直接關(guān)聯(lián)計(jì)算的問題,提出了一個(gè)基于圖的方法對跨媒體數(shù)據(jù)進(jìn)行融合的框架,并提出利用社交網(wǎng)站特有的標(biāo)簽信息增強(qiáng)數(shù)據(jù)相似性的關(guān)聯(lián)。通過采用圖的方法,實(shí)現(xiàn)有效的將跨媒體數(shù)據(jù)融合到一個(gè)圖中;通過借助標(biāo)簽信息作為連接不同社交網(wǎng)站的紐帶,實(shí)現(xiàn)消除跨媒體數(shù)據(jù)表現(xiàn)形式異構(gòu)特點(diǎn)帶來的問題。實(shí)驗(yàn)表明該方... 

【文章來源】:北京郵電大學(xué)北京市 211工程院校 教育部直屬院校

【文章頁數(shù)】:70 頁

【學(xué)位級別】:碩士

【部分圖文】:

跨媒體話題檢測與觀點(diǎn)分析研究


圖2-1網(wǎng)絡(luò)輿情分析研究方向和專題??在網(wǎng)絡(luò)輿情基本概念研究中包括三個(gè)專題,第一個(gè)專題為網(wǎng)絡(luò)輿情分析定義??研究,從網(wǎng)絡(luò)輿情涉及到的主體、客體和媒介等多角度對網(wǎng)絡(luò)輿情進(jìn)行內(nèi)涵的解??

概率分布,圖模型,文檔,主題


這種方式被稱為詞袋模型(Bag?of?Words,?BoW)。利用LDA模型去找到??語料庫的潛在主題則是利用了生成過程的逆過程,根據(jù)己經(jīng)得到的文檔,去找到??文檔的主題概率分布,以及每一個(gè)主題下的單詞概率分布,圖2-2描述了?LDA??的概率圖模型。在此首先聲明圖中變量所代表的含義,其中,a,0是狄利克雷分??布參數(shù),0是文檔-主題概率分布,是主題-詞概率分布,z是當(dāng)前采樣詞所屬主??題編號,w是當(dāng)前文檔的當(dāng)前采樣詞,該語料庫共有M篇文檔,每篇文檔有iV個(gè)??詞,共有足個(gè)主題。該模型的生成過程如圖2-2所示:??Q????<D—?—^z)N???M??圖2_2LDA的圖模型??11??

概率分布,果類,文本,文檔


(2)基于主題模型的算法??與話題檢測類似,在觀點(diǎn)聚類中也可采用LDA模型,LDA將文檔和單詞表??示為關(guān)于主題的概率分布,并獲得每篇文檔和所有主題之間的關(guān)系,以及所有單??詞和每個(gè)主題的概率分布,具體LDA模型的生成過程己經(jīng)在上一小節(jié)具體講述,??此處不再贅述,本小節(jié)主要對現(xiàn)有的相關(guān)研究進(jìn)行闡述。Zhao等人[44]提出??TwitterLDA模型,不同于傳統(tǒng)的LDA,被認(rèn)為是第一個(gè)專門為Twitter數(shù)據(jù)設(shè)計(jì)??的主題模型。與傳統(tǒng)的新聞文檔不同,推文短而且噪聲大,TwitterLDA模型對??Twitter網(wǎng)站中的數(shù)據(jù)在LDA的基礎(chǔ)上做出了一個(gè)重大改變,因?yàn)橥莆牡拈L度相??對較短,他們認(rèn)為每條tweet只映射到一個(gè)主題,而不是作為主題多項(xiàng)式分布的??文檔。這種思路后來被很多人釆用,由于現(xiàn)在的社交網(wǎng)站中的數(shù)據(jù)通常都是有字??數(shù)限制的,較為短小,TwitterLDA模型很適用于這種數(shù)據(jù)。Llewellyn等人[45]重??點(diǎn)關(guān)注新聞評論的聚類,與許多社交媒體數(shù)據(jù)一樣,評論數(shù)據(jù)包含非常短的文本??數(shù)據(jù),由于LDA更適用于長文本,文檔中的單詞數(shù)量是LDA模型性能的限制因??素。因此他們提出可以結(jié)合注釋來形成更大的文檔,以提高聚類的質(zhì)量。他們使??-一一

【參考文獻(xiàn)】:
期刊論文
[1]網(wǎng)絡(luò)輿情研究現(xiàn)狀與發(fā)展方向[J]. 王漢熙,萬成娜,劉凱.  哈爾濱工業(yè)大學(xué)學(xué)報(bào)(社會科學(xué)版). 2015(01)
[2]面向用戶觀點(diǎn)分析的多分類器集成和優(yōu)化技術(shù)[J]. 林煜明,朱濤,王曉玲,周傲英.  計(jì)算機(jī)學(xué)報(bào). 2013(08)



本文編號:2953936

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/2953936.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶9615c***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請E-mail郵箱bigeng88@qq.com
亚洲夫妻性生活免费视频| 国产精品久久精品毛片| 亚洲黄香蕉视频免费看| 亚洲五月婷婷中文字幕| 日本视频在线观看不卡| 国产成人精品国产亚洲欧洲| 午夜激情视频一区二区| 91久久国产福利自产拍| 亚洲色图欧美另类人妻| 日韩高清中文字幕亚洲| 99香蕉精品视频国产版| 日本91在线观看视频| 国产精品二区三区免费播放心| 五月婷婷综合缴情六月| 在线播放欧美精品一区| 午夜福利大片亚洲一区| 五月婷婷亚洲综合一区| 日韩精品免费一区三区| 内用黄老外示儒术出处| 国产精品不卡一区二区三区四区 | 久久碰国产一区二区三区| 亚洲精品日韩欧美精品| 91人妻人人澡人人人人精品| 国产不卡最新在线视频| 国产伦精品一区二区三区精品视频| 久久永久免费一区二区| 日韩精品一区二区三区含羞含羞草| 中文久久乱码一区二区| 免费午夜福利不卡片在线 视频| 丰满少妇被猛烈撞击在线视频| 高清免费在线不卡视频| 欧美野外在线刺激在线观看| 欧美一区二区三区高潮菊竹| 国产伦精品一区二区三区精品视频| 亚洲伦片免费偷拍一区| 美日韩一区二区精品系列| 99香蕉精品视频国产版| 日韩欧美好看的剧情片免费| 亚洲国产成人精品一区刚刚| 一区二区三区日韩经典| 色婷婷日本视频在线观看|