天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當前位置:主頁 > 科技論文 > 自動化論文 >

基于多標簽學習的社交網(wǎng)絡用戶人格預測方法研究

發(fā)布時間:2017-04-13 00:11

  本文關鍵詞:基于多標簽學習的社交網(wǎng)絡用戶人格預測方法研究,由筆耕文化傳播整理發(fā)布。


【摘要】:隨著Internet的迅速普及,社交網(wǎng)絡開始在大眾生活中扮演重要的角色,人們通過社交網(wǎng)絡進行交流互動正在成為一種重要的溝通方式,借助網(wǎng)絡社交平臺發(fā)表觀點、聯(lián)系好友、討論公共話題等,社交網(wǎng)絡成為了現(xiàn)實社會的延伸。每時每刻都有大量用戶在公共社交網(wǎng)站(如Facebook)上頻繁活動,或瀏覽信息,或更新狀態(tài),隨著用戶在社交網(wǎng)絡中的需求越來越多,如何提供個性化服務已經(jīng)成為網(wǎng)絡社交平臺智能化的研究熱點,如好友推薦,商品推廣等。人格特質(zhì)作為影響用戶行為的重要因素之一,可對個性化服務質(zhì)量的提高產(chǎn)生重要的作用,對社交網(wǎng)絡用戶的人格進行分析和預測具有廣闊的應用前景。在人格心理學領域有多種不同的人格流派,其中,特質(zhì)流派給人格提供了一種相對科學可靠的分析和量化的可能。人格特質(zhì)流派目前最可靠、最主流的模型是大五人格模型,它從五個方面來描述一個人的人格,這五個維度分別為外向性、神經(jīng)質(zhì)或情緒穩(wěn)定性、宜人性或隨和性、盡責性以及開放性,大五人格模型認為人格由多種性格特征所組成并且結(jié)構(gòu)相對穩(wěn)定。大五人格與人們在生活中的行為有關,同時也與網(wǎng)絡行為具有很強的相關性,可以利用網(wǎng)絡挖掘技術,通過建立網(wǎng)絡行為特征與人格特質(zhì)之間的關系計算模型,來實現(xiàn)通過社交網(wǎng)絡信息對用戶的人格特質(zhì)進行預測。近年來,對社交網(wǎng)絡用戶人格預測的相關研究開始出現(xiàn),相比于自陳量表的人格計算手段,利用網(wǎng)絡信息進行自動化的人格預測具有便利性與客觀性。研究者們面向用戶網(wǎng)絡文本信息及可獲得的其它相關信息,進行相應的特征提取,并采用如k NN,SVM,樸素貝葉斯以及決策樹等不同的機器學習算法,構(gòu)建人格預測模型。大量實驗結(jié)果表明,基于社交網(wǎng)絡信息,可以有效地進行自動化的用戶人格預測。但目前工作中預測結(jié)果的準確性并不是特別理想,需要給出更好的適合于用戶人格預測問題的自動化預測方法,以及進一步從網(wǎng)絡社交平臺用戶生成的信息中挖掘出與人格特質(zhì)具有高度相關性的特征,并探索人格特質(zhì)之間的內(nèi)在聯(lián)系。本文基于上述問題,主要做了以下工作:針對用戶在社交網(wǎng)站上的文本狀態(tài)信息,面向人格預測,提出了結(jié)合基于詞的形式特征與語義特征的特征設計方案。其中,基于詞的形式特征包括基于信息增益提取的詞特征,情感特征,語法上的詞性與時態(tài)特征,以及寫作風格特征,并依據(jù)特征與類別標簽集合的相關性,運用MLFSIE-W算法進行特征選擇與加權;語義特征方面,基于Word Net通用本體映射,定義了概念向量,并給出了結(jié)合語義距離與語義重合度的文本語義相關度計算方法;最后根據(jù)語義相關度和基于詞特征的相似度,給出了綜合相似度計算方法。在實驗中,與相關工作采用的各種特征基于相同的機器學習算法進行了對比,隨后還討論了形式特征和語義特征在人格預測中的作用。針對用戶人格預測的相關研究中通常采用單標簽機器學習算法處理的問題,本文采用一種基于隨機游走模型的多標簽用戶人格預測方法來進行分析和處理。因為通過對大五人格的分析以及用戶人格特質(zhì)的表現(xiàn)形式,人格預測問題在本質(zhì)上應該屬于一種多標簽學習問題。在執(zhí)行隨機游走模型算法的過程中,利用綜合相似度改進其原始的基于歐式距離的邊權重計算方法來構(gòu)造隨機游走圖,經(jīng)過迭代與轉(zhuǎn)化,得到每個用戶隸屬于各個類標簽的概率分布,結(jié)合閾值的計算,最終給出多標簽預測結(jié)果。實驗表明,該方法比采用SVM、k NN和NB等主流單標簽分類器的方法具有更好的預測效果,這種方法考慮到了類標簽之間的潛在相關性,預測結(jié)果更為合理。針對目前相關研究中關于社交網(wǎng)絡用戶人格預測的各項評價指標結(jié)果普遍不高的情況,本文提出采用集成學習的方式,結(jié)合隨機游走模型,給出了集成多標簽學習的用戶人格預測方法。在面向多標簽學習的集成方法Ada Boost.MH框架下,改變原始的將多標簽問題分解成多個二分類并用二類分類器作為基分類器同時進行迭代的思想,直接運用基于隨機游走模型的多標簽分類器作為基分類器,既能夠在基分類器的層面上保留類標簽之間的相關性信息,又可以達到集成學習的目的。實驗結(jié)果表明,面向人格預測問題,集成多標簽學習方法是有效的,能夠在多標簽基分類器的基礎上進一步提高預測的各項評價指標結(jié)果,達到更好的預測效果。
【關鍵詞】:社交網(wǎng)絡 人格預測 多標簽學習 社會計算
【學位授予單位】:吉林大學
【學位級別】:碩士
【學位授予年份】:2016
【分類號】:TP393.09;TP181
【目錄】:
  • 摘要4-7
  • abstract7-12
  • 第1章 緒論12-17
  • 1.1 研究背景12-13
  • 1.2 研究內(nèi)容13-15
  • 1.3 研究意義15
  • 1.4 本文結(jié)構(gòu)安排15-17
  • 第2章 相關介紹與研究現(xiàn)狀17-24
  • 2.1 人格模型17
  • 2.2 大五人格17-19
  • 2.3 大五人格與社交網(wǎng)絡19-20
  • 2.4 目前研究現(xiàn)狀20-23
  • 2.5 本章小結(jié)23-24
  • 第3章 特征設計24-33
  • 3.1 數(shù)據(jù)預處理24-25
  • 3.2 基于詞的特征25-29
  • 3.2.1 信息增益25-26
  • 3.2.2 其它形式特征26-27
  • 3.2.3 特征選擇與加權27-29
  • 3.3 語義特征29-32
  • 3.4 本章小結(jié)32-33
  • 第4章 基于隨機游走模型的用戶人格預測33-42
  • 4.1 多標簽學習33-35
  • 4.2 隨機游走模型35-39
  • 4.3 用戶人格預測方法39-40
  • 4.4 本章小結(jié)40-42
  • 第5章 集成多標簽學習方法的用戶人格預測42-50
  • 5.1 集成學習42-43
  • 5.2 提升方法43-46
  • 5.2.1 概述43-44
  • 5.2.2 AdaBoost44-46
  • 5.3 多標簽AdaBoost.MH框架46-47
  • 5.4 用戶人格預測方法47-49
  • 5.5 本章小結(jié)49-50
  • 第6章 實驗及結(jié)果對比分析50-57
  • 6.1 實驗數(shù)據(jù)50-51
  • 6.2 實驗設計51-52
  • 6.3 實驗結(jié)果及分析52-56
  • 6.4 本章小結(jié)56-57
  • 第7章 總結(jié)與展望57-60
  • 7.1 本文工作總結(jié)57-58
  • 7.2 工作展望58-60
  • 參考文獻60-65
  • 作者簡介及在學期間所取得的科研成果65-66
  • 致謝66

【參考文獻】

中國期刊全文數(shù)據(jù)庫 前2條

1 張振海;李士寧;李志剛;陳昊;;一類基于信息熵的多標簽特征選擇算法[J];計算機研究與發(fā)展;2013年06期

2 鄭偉;王朝坤;劉璋;王建民;;一種基于隨機游走模型的多標簽分類算法[J];計算機學報;2010年08期


  本文關鍵詞:基于多標簽學習的社交網(wǎng)絡用戶人格預測方法研究,,由筆耕文化傳播整理發(fā)布。



本文編號:302368

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/302368.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權申明:資料由用戶a1319***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com