基于用戶情感和網(wǎng)絡(luò)關(guān)系分析的人格預(yù)測模型
本文關(guān)鍵詞:基于用戶情感和網(wǎng)絡(luò)關(guān)系分析的人格預(yù)測模型,由筆耕文化傳播整理發(fā)布。
【摘要】:隨著互聯(lián)網(wǎng)的不斷發(fā)展,各種互聯(lián)網(wǎng)應(yīng)用逐漸深入人們的生活。人們在使用互聯(lián)網(wǎng)應(yīng)用時的習(xí)慣和需求各不相同。因此,個性化逐漸成為了互聯(lián)網(wǎng)推薦系統(tǒng)和廣告展示需要考慮的重要因素。人們的行為習(xí)慣和偏好通常和個人的人格有關(guān)聯(lián),獲取網(wǎng)絡(luò)用戶的人格可以進一步促進個性化應(yīng)用的發(fā)展。傳統(tǒng)的人格測量主要通過心理學(xué)研究人員對研究對象進行訪談或者讓研究對象填寫人格問卷來獲取他們的人格數(shù)據(jù)。這些方法都需要大量的人工參與,難以進行大規(guī)模的用戶人格測量,不適用于互聯(lián)網(wǎng)環(huán)境。近年來社交網(wǎng)絡(luò)迅速發(fā)展,用戶在使用社交網(wǎng)絡(luò)的過程中會產(chǎn)生大量的信息和行為數(shù)據(jù)。人們在網(wǎng)絡(luò)上的行為和實際生活中的行為一樣,與個人的人格息息相關(guān)。通過社交網(wǎng)絡(luò)的數(shù)據(jù)進行人格自動化預(yù)測,可以高效地獲取用戶人格。本文對新浪微博進行研究,提取微博用戶的用戶特征和人格特征,建立預(yù)測模型,對微博用戶人格進行分析預(yù)測,實驗驗證了模型的可行性。本文工作主要包括如下幾點:(1)針對現(xiàn)有的社交網(wǎng)絡(luò)用戶人格預(yù)測研究通常僅考慮用戶統(tǒng)計特征的問題,提出一種新的微博用戶人格預(yù)測方法,對用戶發(fā)布的微博文本進行深入分析,通過情感分析提取用戶的情感特征。同時考慮用戶網(wǎng)絡(luò)關(guān)系特征和微博固有特征,提取微博用戶特征集,并構(gòu)建用戶人格預(yù)測模型,實現(xiàn)了通過微博用戶數(shù)據(jù)對用戶人格進行自動化預(yù)測。(2)針對微博文本中包含大量的網(wǎng)絡(luò)用語和表情符號,傳統(tǒng)情感詞典不適用于微博情感分析的問題,結(jié)合微博網(wǎng)絡(luò)用語對傳統(tǒng)情感詞典進行擴展,同時構(gòu)建微博表情符號詞典。同時,本文結(jié)合中文語法特點,在傳統(tǒng)情感詞典的基礎(chǔ)上加入否定詞典和雙重否定詞典。通過改進后的情感詞典對微博文本進行情感分析。(3)針對現(xiàn)有的用戶人格預(yù)測研究通常僅考慮用戶自身屬性的問題,提出分析微博用戶的網(wǎng)絡(luò)關(guān)系特征,主要考慮用戶與好友之間的相似度和和交互熟悉度。(4)針對人格預(yù)測不同的預(yù)測需求,提出建立連續(xù)預(yù)測模型和分類預(yù)測模型。在分析不同回歸方法的基礎(chǔ)上,提出采用多任務(wù)學(xué)習(xí)方法建立連續(xù)預(yù)測模型。采用支持向量機算法建立分類預(yù)測模型。
【關(guān)鍵詞】:人格預(yù)測 情感分析 網(wǎng)絡(luò)關(guān)系 連續(xù)預(yù)測模型 分類預(yù)測模型
【學(xué)位授予單位】:東華大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2016
【分類號】:TP391.1
【目錄】:
- 摘要4-6
- ABSTRACT6-10
- 第一章 緒論10-15
- 1.1 研究背景與意義10-11
- 1.2 研究現(xiàn)狀11-13
- 1.2.1 國外研究11-12
- 1.2.2 國內(nèi)研究12-13
- 1.3 本文主要研究內(nèi)容13-14
- 1.4 論文的組織結(jié)構(gòu)14-15
- 第二章 人格預(yù)測相關(guān)理論15-20
- 2.1 人格模型簡介15-16
- 2.2 傳統(tǒng)的人格測量方法16
- 2.2.1 訪談16
- 2.2.2 問卷16
- 2.3 社交網(wǎng)絡(luò)用戶特征16-18
- 2.4 社交網(wǎng)絡(luò)用戶人格預(yù)測18-20
- 2.4.1 用戶數(shù)據(jù)獲取方法18-19
- 2.4.2 人格預(yù)測模型19-20
- 第三章 微博用戶特征20-32
- 3.1 微博簡介21
- 3.2 微博固有特征21-24
- 3.2.1 用戶基本特征21-22
- 3.2.2 用戶活躍度22
- 3.2.3 微博影響力22-23
- 3.2.4 固有特征23-24
- 3.3 微博用戶情感特征24-28
- 3.3.1 改進的情感詞典24-25
- 3.3.2 表情詞典25-26
- 3.3.3 情感分析26-27
- 3.3.4 用戶情感特征27-28
- 3.4 網(wǎng)絡(luò)關(guān)系特征28-31
- 3.4.1 用戶相似度28-30
- 3.4.2 交互熟悉度30-31
- 3.4.3 網(wǎng)絡(luò)關(guān)系特征31
- 3.5 本章小結(jié)31-32
- 第四章 用戶人格預(yù)測模型32-38
- 4.1 連續(xù)預(yù)測模型32-36
- 4.1.1 多元線性回歸32-33
- 4.1.2 增量回歸33-34
- 4.1.3 多任務(wù)回歸34-36
- 4.2 分類預(yù)測模型36-37
- 4.3 本章小結(jié)37-38
- 第五章 實驗結(jié)果和分析38-47
- 5.1 實驗數(shù)據(jù)獲取38
- 5.2 用戶特征和人格相關(guān)性分析38-41
- 5.3 實驗結(jié)果和分析41-45
- 5.3.1 連續(xù)預(yù)測模型實驗結(jié)果和分析41-43
- 5.3.2 分類預(yù)測模型實驗結(jié)果和分析43-45
- 5.4 本章小結(jié)45-47
- 第六章 總結(jié)和展望47-49
- 6.1 工作總結(jié)47
- 6.2 工作展望47-49
- 參考文獻49-52
- 附錄52-54
- 攻讀碩士學(xué)位期間取得的研究成果54-55
- 致謝55
【參考文獻】
中國期刊全文數(shù)據(jù)庫 前9條
1 張磊;陳貞翔;楊波;;社交網(wǎng)絡(luò)用戶的人格分析與預(yù)測[J];計算機學(xué)報;2014年08期
2 劉志明;劉魯;;基于機器學(xué)習(xí)的中文微博情感分類實證研究[J];計算機工程與應(yīng)用;2012年01期
3 王素格;李德玉;魏英杰;宋曉雷;;基于同義詞的詞匯情感傾向判別方法[J];中文信息學(xué)報;2009年05期
4 婁德成;姚天f ;;漢語句子語義極性分析和觀點抽取方法的研究[J];計算機應(yīng)用;2006年11期
5 廖傳景;李培芬;;大學(xué)生網(wǎng)絡(luò)行為調(diào)查與人格特質(zhì)變化研究[J];現(xiàn)代遠距離教育;2006年01期
6 朱嫣嵐;閔錦;周雅倩;黃萱菁;吳立德;;基于HowNet的詞匯語義傾向計算[J];中文信息學(xué)報;2006年01期
7 雷靂,柳銘心;青少年的人格特征與互聯(lián)網(wǎng)社交服務(wù)使用偏好的關(guān)系[J];心理學(xué)報;2005年06期
8 劉群,張華平,俞鴻魁,程學(xué)旗;基于層疊隱馬模型的漢語詞法分析[J];計算機研究與發(fā)展;2004年08期
9 李秀敏;互聯(lián)網(wǎng)內(nèi)容偏好與大學(xué)生人格特質(zhì)關(guān)系的研究[J];心理科學(xué);2004年03期
中國重要會議論文全文數(shù)據(jù)庫 前1條
1 李正華;車萬翔;劉挺;;基于XML的語言技術(shù)平臺[A];第五屆全國青年計算語言學(xué)研討會論文集[C];2010年
本文關(guān)鍵詞:基于用戶情感和網(wǎng)絡(luò)關(guān)系分析的人格預(yù)測模型,由筆耕文化傳播整理發(fā)布。
,本文編號:434755
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/434755.html