票房預測中的社交網(wǎng)絡(luò)評論情感挖掘技術(shù)研究
發(fā)布時間:2021-01-31 02:00
近年來,電影藝術(shù)已經(jīng)深入大眾的學習娛樂生活中。電影市場每一年都會經(jīng)歷大起大落的票房戰(zhàn)爭,有些影片能夠從觀眾挑剔的審美觀眾脫穎而出,有些即時請了高流量的明星卻依然收獲慘淡的票房,不得不說的是,或許是因為近兩年票房整體的不盡如人意。電影制作方與影評媒體的矛盾不斷地被擺在大眾面前,似乎一些電影票房失利,直接因素就是由于觀眾的執(zhí)白影評導致的。隨著社交媒體的興起,電影評論的發(fā)布者不再局限于電影研究員或?qū)<覍W者,各大電影評分類網(wǎng)站、影評類自媒體、觀眾本身迅速占據(jù)輿論的風口浪尖,或是為喜歡的影片發(fā)生或是提出尖銳的批評。影評對于電影市場票房到底有多大影響力,以及能從影評中挖掘出多少有價值的信息服務(wù)于電影的票房預測,這是本文主要探究的問題。本文從構(gòu)建多關(guān)系主題模型開始,將短影評中涉及的所有電影關(guān)注點挖掘出來。另一方面,利用已有的數(shù)據(jù)訓練情感分類的LSTM模型。將短影評匯聚利用人名識別算法提取所有主創(chuàng)的短句,然后利用與訓練的情感分類模型對這些短句提取情感特征。將所提取的正負面情感占比的變化情況作為特征加入到預測模型之中,利用生命周期構(gòu)建多階段的電影票房預測模型。最后得出結(jié)論,在首周使用非線性的SVR模型而...
【文章來源】:南京郵電大學江蘇省
【文章頁數(shù)】:57 頁
【學位級別】:碩士
【部分圖文】:
多階段票房預測總體框架
圖 2.1 統(tǒng)計分詞方法礎(chǔ)上,以二元模型(2-gram)為基本模型經(jīng)過地,假設(shè) 表示了多個字組成的句子。其中詞語為 ( ) = ( )= ( ) ( ) ( ) ( 大,利用馬爾科夫假設(shè),假定該詞最多只與前二元模型。則上式表示為 ( ) = ( )= ш ( ) 合概率表達一種 的合理程度。那么在所有分詞技術(shù)的目標。假設(shè)最佳切分是 ,那么分
命名實體識別任務(wù)以及歧義現(xiàn)象
【參考文獻】:
期刊論文
[1]面向領(lǐng)域文獻的無監(jiān)督中文分詞自動優(yōu)化方法[J]. 倪維健,孫浩浩,劉彤,曾慶田. 數(shù)據(jù)分析與知識發(fā)現(xiàn). 2018(02)
[2]一個有效的基于GBRT的早期電影票房預測模型[J]. 韓忠明,原碧鴻,陳炎,趙寧,段大高. 計算機應用研究. 2018(02)
[3]直播平臺在社交媒體的新發(fā)展——以微博“一直播”為例[J]. 梁宇馳,羅璇. 新聞研究導刊. 2016(19)
[4]用于微博情感分析的一種情感語義增強的深度學習模型[J]. 何炎祥,孫松濤,牛菲菲,李飛. 計算機學報. 2017(04)
[5]基于機器學習的中文微博情感分類實證研究[J]. 劉志明,劉魯. 計算機工程與應用. 2012(01)
[6]一種改進的中文分詞正向最大匹配算法[J]. 王瑞雷,欒靜,潘曉花,盧修配. 計算機應用與軟件. 2011(03)
[7]基于VSM的文本相似度計算的研究[J]. 郭慶琳,李艷梅,唐琦. 計算機應用研究. 2008(11)
[8]融合多特征的最大熵漢語命名實體識別模型[J]. 張玥杰,徐智婷,薛向陽. 計算機研究與發(fā)展. 2008(06)
[9]中文分詞十年回顧[J]. 黃昌寧,趙海. 中文信息學報. 2007(03)
[10]停用詞表對中文文本情感分類的影響[J]. 王素格,魏英杰. 情報學報. 2008 (02)
碩士論文
[1]基于統(tǒng)計和語義信息的中文分詞算法研究[D]. 李良潔.青島科技大學 2015
本文編號:3010004
【文章來源】:南京郵電大學江蘇省
【文章頁數(shù)】:57 頁
【學位級別】:碩士
【部分圖文】:
多階段票房預測總體框架
圖 2.1 統(tǒng)計分詞方法礎(chǔ)上,以二元模型(2-gram)為基本模型經(jīng)過地,假設(shè) 表示了多個字組成的句子。其中詞語為 ( ) = ( )= ( ) ( ) ( ) ( 大,利用馬爾科夫假設(shè),假定該詞最多只與前二元模型。則上式表示為 ( ) = ( )= ш ( ) 合概率表達一種 的合理程度。那么在所有分詞技術(shù)的目標。假設(shè)最佳切分是 ,那么分
命名實體識別任務(wù)以及歧義現(xiàn)象
【參考文獻】:
期刊論文
[1]面向領(lǐng)域文獻的無監(jiān)督中文分詞自動優(yōu)化方法[J]. 倪維健,孫浩浩,劉彤,曾慶田. 數(shù)據(jù)分析與知識發(fā)現(xiàn). 2018(02)
[2]一個有效的基于GBRT的早期電影票房預測模型[J]. 韓忠明,原碧鴻,陳炎,趙寧,段大高. 計算機應用研究. 2018(02)
[3]直播平臺在社交媒體的新發(fā)展——以微博“一直播”為例[J]. 梁宇馳,羅璇. 新聞研究導刊. 2016(19)
[4]用于微博情感分析的一種情感語義增強的深度學習模型[J]. 何炎祥,孫松濤,牛菲菲,李飛. 計算機學報. 2017(04)
[5]基于機器學習的中文微博情感分類實證研究[J]. 劉志明,劉魯. 計算機工程與應用. 2012(01)
[6]一種改進的中文分詞正向最大匹配算法[J]. 王瑞雷,欒靜,潘曉花,盧修配. 計算機應用與軟件. 2011(03)
[7]基于VSM的文本相似度計算的研究[J]. 郭慶琳,李艷梅,唐琦. 計算機應用研究. 2008(11)
[8]融合多特征的最大熵漢語命名實體識別模型[J]. 張玥杰,徐智婷,薛向陽. 計算機研究與發(fā)展. 2008(06)
[9]中文分詞十年回顧[J]. 黃昌寧,趙海. 中文信息學報. 2007(03)
[10]停用詞表對中文文本情感分類的影響[J]. 王素格,魏英杰. 情報學報. 2008 (02)
碩士論文
[1]基于統(tǒng)計和語義信息的中文分詞算法研究[D]. 李良潔.青島科技大學 2015
本文編號:3010004
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/3010004.html
最近更新
教材專著