面向社交媒體網(wǎng)絡(luò)的用戶情感分析方法的研究
本文選題:情感分析 + 云計(jì)算 ; 參考:《河南科技大學(xué)》2017年碩士論文
【摘要】:近年來(lái),互聯(lián)網(wǎng)的快速發(fā)展,人們之間交流日益方便快捷,隨著新的多媒體社交平臺(tái)的不斷涌出,圍繞社交平臺(tái)開(kāi)展的交流日益增多,每天有成千上萬(wàn)的用戶通過(guò)社交平臺(tái)發(fā)表他們的言論和看法。這些文本信息中包含有大量的情感傾向(評(píng)論某個(gè)事物的“好”與“壞”)的詞語(yǔ),這些帶有情感傾向的詞語(yǔ)能反映出用戶當(dāng)時(shí)的情感狀態(tài)。一方面,多媒體社交平臺(tái)逐漸發(fā)展成意見(jiàn)挖掘和意見(jiàn)情感分析的評(píng)論文本資料庫(kù);另一方面,多媒體社交平臺(tái)的發(fā)展也為意見(jiàn)的挖掘和情感分析提出了更高的需求。電影的評(píng)論文本是多媒體社交平臺(tái)上比較常見(jiàn)評(píng)論信息,針對(duì)電影評(píng)論的研究已經(jīng)很多很完善了,在傳統(tǒng)的評(píng)論領(lǐng)域的情感分析不好在突破了,因此本文在基于傳統(tǒng)的評(píng)論信息的基礎(chǔ)上結(jié)合了一些其它因素來(lái)對(duì)評(píng)論文本進(jìn)行情感分析,通過(guò)情感分析可以發(fā)現(xiàn)用戶關(guān)注的電影特征,并根據(jù)電影的特征信息,推斷出用戶的偏好,本文提出了將電影的評(píng)論文本信息中的隱含語(yǔ)義內(nèi)容和評(píng)分相結(jié)合構(gòu)建一個(gè)新的電影推薦模型。因此本文是基于多媒體社交平臺(tái)(電影的影評(píng)論壇)的評(píng)論文本信息來(lái)開(kāi)展對(duì)電影推薦和評(píng)分預(yù)測(cè)的方法進(jìn)行研究。并開(kāi)展以下兩個(gè)方面的研究工作:1.對(duì)電影評(píng)論的文本信息中的詞語(yǔ)進(jìn)行統(tǒng)計(jì)和分析,基于知網(wǎng)詞典構(gòu)建了一個(gè)電影領(lǐng)域的情感詞典,用來(lái)對(duì)電影評(píng)論信息進(jìn)行情感分類(lèi),根據(jù)情感分類(lèi)中主題發(fā)散這個(gè)特點(diǎn),提出一種基于情感句提取的電影評(píng)論的分類(lèi)方法。并使用機(jī)器學(xué)習(xí)的方法對(duì)文本進(jìn)行分類(lèi),從而得到它的情感傾向。在一級(jí)情感分類(lèi)的基礎(chǔ)上提出了結(jié)合統(tǒng)計(jì)學(xué)BSI的二級(jí)情感分類(lèi)模型,通過(guò)實(shí)驗(yàn)對(duì)比證明了二級(jí)情感分類(lèi)模型的準(zhǔn)確度相比較一級(jí)情感分類(lèi)提高了5%,且對(duì)未標(biāo)示過(guò)的評(píng)論文本有更佳突出的情感分類(lèi)能力。2.用戶在瀏覽網(wǎng)頁(yè)或者搜索內(nèi)容的時(shí)候都有瀏覽記錄的存在,這些日志數(shù)據(jù)隨著用戶的操作不斷的增多,日志的數(shù)據(jù)能反映出用戶的一些習(xí)慣或偏好,對(duì)這些日志數(shù)據(jù)進(jìn)行統(tǒng)計(jì)分析,從而可以獲取用戶的搜索行為特征,可以把用戶的行為特征進(jìn)行關(guān)聯(lián),從而能得到用戶搜索行為的歷史軌跡,這些用戶搜索行為的歷史軌跡為用戶評(píng)分預(yù)測(cè)精度的提高起到了一定的影響力。由于日志的數(shù)據(jù)比較大,本文是采用Hadoop框架來(lái)開(kāi)展研究的。提出了一種新的推薦方法將評(píng)論中的隱含內(nèi)容與用戶的打分,用戶的日志信息統(tǒng)計(jì)后的數(shù)據(jù)相結(jié)合,設(shè)計(jì)了一種新的電影的推薦模型,首先利用主題挖掘?qū)⑽谋局须[含的主題分布找出來(lái),然后利用主題分布來(lái)刻畫(huà)出用戶的偏好和電影的畫(huà)像,結(jié)合用戶的歷史足跡的統(tǒng)計(jì)和BSI情感預(yù)測(cè)來(lái)構(gòu)建一個(gè)評(píng)分預(yù)測(cè)模型,然后基于邏輯斯蒂回歸模型上訓(xùn)練主題與用戶的打分之間的內(nèi)在聯(lián)系,該算法豐富了推薦數(shù)據(jù)的信息,可以有效的緩解當(dāng)用戶冷啟動(dòng)時(shí),推薦系統(tǒng)中打分稀疏的問(wèn)題。然后利用真實(shí)的數(shù)據(jù)來(lái)進(jìn)行實(shí)驗(yàn)對(duì)比,從實(shí)驗(yàn)的數(shù)據(jù)來(lái)驗(yàn)證這個(gè)模型。
[Abstract]:In recent years , the rapid development of Internet has become more and more convenient and faster . With the emergence of new multimedia social platform , the exchange of the new multimedia social platform is increasing day by day .
【學(xué)位授予單位】:河南科技大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2017
【分類(lèi)號(hào)】:TP391.1
【參考文獻(xiàn)】
相關(guān)期刊論文 前10條
1 朱揚(yáng)勇;孫婧;;推薦系統(tǒng)研究進(jìn)展[J];計(jì)算機(jī)科學(xué)與探索;2015年05期
2 陳誠(chéng);戰(zhàn)蔭偉;李鷹;;基于網(wǎng)頁(yè)鏈接分類(lèi)的PageRank并行算法[J];計(jì)算機(jī)應(yīng)用;2015年01期
3 曹姍姍;王沖;;基于網(wǎng)頁(yè)鏈接與用戶反饋的PageRank算法改進(jìn)研究[J];計(jì)算機(jī)科學(xué);2014年12期
4 劉健;劉奕群;馬少平;張敏;茹立云;張闊;;搜索引擎用戶行為與用戶滿意度的關(guān)聯(lián)研究[J];中文信息學(xué)報(bào);2014年01期
5 韓忠明;張玉沙;張慧;萬(wàn)月亮;黃今慧;;有效的中文微博短文本傾向性分類(lèi)算法[J];計(jì)算機(jī)應(yīng)用與軟件;2012年10期
6 代大明;王中卿;李壽山;李培峰;朱巧明;;基于情緒詞的非監(jiān)督中文情感分類(lèi)方法研究[J];中文信息學(xué)報(bào);2012年04期
7 張劍峰;夏云慶;姚建民;;微博文本處理研究綜述[J];中文信息學(xué)報(bào);2012年04期
8 龐磊;李壽山;周?chē)?guó)棟;;基于情緒知識(shí)的中文微博情感分類(lèi)方法[J];計(jì)算機(jī)工程;2012年13期
9 王中卿;李壽山;朱巧明;李培峰;周?chē)?guó)棟;;基于不平衡數(shù)據(jù)的中文情感分類(lèi)[J];中文信息學(xué)報(bào);2012年03期
10 徐群嶺;;一種新型的中文文本情感計(jì)算模型[J];計(jì)算機(jī)應(yīng)用與軟件;2011年06期
相關(guān)碩士學(xué)位論文 前2條
1 郭偉;網(wǎng)絡(luò)電影評(píng)論的情感挖掘分析[D];吉林大學(xué);2010年
2 崔寶今;基于半監(jiān)督和主動(dòng)學(xué)習(xí)的蛋白質(zhì)關(guān)系抽取研究[D];大連理工大學(xué);2008年
,本文編號(hào):1822312
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/1822312.html