票房預(yù)測中的社交網(wǎng)絡(luò)評(píng)論情感挖掘技術(shù)研究
發(fā)布時(shí)間:2021-01-31 02:00
近年來,電影藝術(shù)已經(jīng)深入大眾的學(xué)習(xí)娛樂生活中。電影市場每一年都會(huì)經(jīng)歷大起大落的票房戰(zhàn)爭,有些影片能夠從觀眾挑剔的審美觀眾脫穎而出,有些即時(shí)請(qǐng)了高流量的明星卻依然收獲慘淡的票房,不得不說的是,或許是因?yàn)榻鼉赡昶狈空w的不盡如人意。電影制作方與影評(píng)媒體的矛盾不斷地被擺在大眾面前,似乎一些電影票房失利,直接因素就是由于觀眾的執(zhí)白影評(píng)導(dǎo)致的。隨著社交媒體的興起,電影評(píng)論的發(fā)布者不再局限于電影研究員或?qū)<覍W(xué)者,各大電影評(píng)分類網(wǎng)站、影評(píng)類自媒體、觀眾本身迅速占據(jù)輿論的風(fēng)口浪尖,或是為喜歡的影片發(fā)生或是提出尖銳的批評(píng)。影評(píng)對(duì)于電影市場票房到底有多大影響力,以及能從影評(píng)中挖掘出多少有價(jià)值的信息服務(wù)于電影的票房預(yù)測,這是本文主要探究的問題。本文從構(gòu)建多關(guān)系主題模型開始,將短影評(píng)中涉及的所有電影關(guān)注點(diǎn)挖掘出來。另一方面,利用已有的數(shù)據(jù)訓(xùn)練情感分類的LSTM模型。將短影評(píng)匯聚利用人名識(shí)別算法提取所有主創(chuàng)的短句,然后利用與訓(xùn)練的情感分類模型對(duì)這些短句提取情感特征。將所提取的正負(fù)面情感占比的變化情況作為特征加入到預(yù)測模型之中,利用生命周期構(gòu)建多階段的電影票房預(yù)測模型。最后得出結(jié)論,在首周使用非線性的SVR模型而...
【文章來源】:南京郵電大學(xué)江蘇省
【文章頁數(shù)】:57 頁
【學(xué)位級(jí)別】:碩士
【部分圖文】:
多階段票房預(yù)測總體框架
圖 2.1 統(tǒng)計(jì)分詞方法礎(chǔ)上,以二元模型(2-gram)為基本模型經(jīng)過地,假設(shè) 表示了多個(gè)字組成的句子。其中詞語為 ( ) = ( )= ( ) ( ) ( ) ( 大,利用馬爾科夫假設(shè),假定該詞最多只與前二元模型。則上式表示為 ( ) = ( )= ш ( ) 合概率表達(dá)一種 的合理程度。那么在所有分詞技術(shù)的目標(biāo)。假設(shè)最佳切分是 ,那么分
命名實(shí)體識(shí)別任務(wù)以及歧義現(xiàn)象
【參考文獻(xiàn)】:
期刊論文
[1]面向領(lǐng)域文獻(xiàn)的無監(jiān)督中文分詞自動(dòng)優(yōu)化方法[J]. 倪維健,孫浩浩,劉彤,曾慶田. 數(shù)據(jù)分析與知識(shí)發(fā)現(xiàn). 2018(02)
[2]一個(gè)有效的基于GBRT的早期電影票房預(yù)測模型[J]. 韓忠明,原碧鴻,陳炎,趙寧,段大高. 計(jì)算機(jī)應(yīng)用研究. 2018(02)
[3]直播平臺(tái)在社交媒體的新發(fā)展——以微博“一直播”為例[J]. 梁宇馳,羅璇. 新聞研究導(dǎo)刊. 2016(19)
[4]用于微博情感分析的一種情感語義增強(qiáng)的深度學(xué)習(xí)模型[J]. 何炎祥,孫松濤,牛菲菲,李飛. 計(jì)算機(jī)學(xué)報(bào). 2017(04)
[5]基于機(jī)器學(xué)習(xí)的中文微博情感分類實(shí)證研究[J]. 劉志明,劉魯. 計(jì)算機(jī)工程與應(yīng)用. 2012(01)
[6]一種改進(jìn)的中文分詞正向最大匹配算法[J]. 王瑞雷,欒靜,潘曉花,盧修配. 計(jì)算機(jī)應(yīng)用與軟件. 2011(03)
[7]基于VSM的文本相似度計(jì)算的研究[J]. 郭慶琳,李艷梅,唐琦. 計(jì)算機(jī)應(yīng)用研究. 2008(11)
[8]融合多特征的最大熵漢語命名實(shí)體識(shí)別模型[J]. 張玥杰,徐智婷,薛向陽. 計(jì)算機(jī)研究與發(fā)展. 2008(06)
[9]中文分詞十年回顧[J]. 黃昌寧,趙海. 中文信息學(xué)報(bào). 2007(03)
[10]停用詞表對(duì)中文文本情感分類的影響[J]. 王素格,魏英杰. 情報(bào)學(xué)報(bào). 2008 (02)
碩士論文
[1]基于統(tǒng)計(jì)和語義信息的中文分詞算法研究[D]. 李良潔.青島科技大學(xué) 2015
本文編號(hào):3010004
【文章來源】:南京郵電大學(xué)江蘇省
【文章頁數(shù)】:57 頁
【學(xué)位級(jí)別】:碩士
【部分圖文】:
多階段票房預(yù)測總體框架
圖 2.1 統(tǒng)計(jì)分詞方法礎(chǔ)上,以二元模型(2-gram)為基本模型經(jīng)過地,假設(shè) 表示了多個(gè)字組成的句子。其中詞語為 ( ) = ( )= ( ) ( ) ( ) ( 大,利用馬爾科夫假設(shè),假定該詞最多只與前二元模型。則上式表示為 ( ) = ( )= ш ( ) 合概率表達(dá)一種 的合理程度。那么在所有分詞技術(shù)的目標(biāo)。假設(shè)最佳切分是 ,那么分
命名實(shí)體識(shí)別任務(wù)以及歧義現(xiàn)象
【參考文獻(xiàn)】:
期刊論文
[1]面向領(lǐng)域文獻(xiàn)的無監(jiān)督中文分詞自動(dòng)優(yōu)化方法[J]. 倪維健,孫浩浩,劉彤,曾慶田. 數(shù)據(jù)分析與知識(shí)發(fā)現(xiàn). 2018(02)
[2]一個(gè)有效的基于GBRT的早期電影票房預(yù)測模型[J]. 韓忠明,原碧鴻,陳炎,趙寧,段大高. 計(jì)算機(jī)應(yīng)用研究. 2018(02)
[3]直播平臺(tái)在社交媒體的新發(fā)展——以微博“一直播”為例[J]. 梁宇馳,羅璇. 新聞研究導(dǎo)刊. 2016(19)
[4]用于微博情感分析的一種情感語義增強(qiáng)的深度學(xué)習(xí)模型[J]. 何炎祥,孫松濤,牛菲菲,李飛. 計(jì)算機(jī)學(xué)報(bào). 2017(04)
[5]基于機(jī)器學(xué)習(xí)的中文微博情感分類實(shí)證研究[J]. 劉志明,劉魯. 計(jì)算機(jī)工程與應(yīng)用. 2012(01)
[6]一種改進(jìn)的中文分詞正向最大匹配算法[J]. 王瑞雷,欒靜,潘曉花,盧修配. 計(jì)算機(jī)應(yīng)用與軟件. 2011(03)
[7]基于VSM的文本相似度計(jì)算的研究[J]. 郭慶琳,李艷梅,唐琦. 計(jì)算機(jī)應(yīng)用研究. 2008(11)
[8]融合多特征的最大熵漢語命名實(shí)體識(shí)別模型[J]. 張玥杰,徐智婷,薛向陽. 計(jì)算機(jī)研究與發(fā)展. 2008(06)
[9]中文分詞十年回顧[J]. 黃昌寧,趙海. 中文信息學(xué)報(bào). 2007(03)
[10]停用詞表對(duì)中文文本情感分類的影響[J]. 王素格,魏英杰. 情報(bào)學(xué)報(bào). 2008 (02)
碩士論文
[1]基于統(tǒng)計(jì)和語義信息的中文分詞算法研究[D]. 李良潔.青島科技大學(xué) 2015
本文編號(hào):3010004
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/3010004.html
最近更新
教材專著