社交網(wǎng)絡中的抑郁癥用戶語言和行為特征分析及檢測
發(fā)布時間:2021-09-06 09:16
[目的/意義]通過在線工具來分析社交網(wǎng)絡用戶的語言和行為特征,對抑郁癥患者進行預測性研究。[方法/過程]從推特上收集自我披露的抑郁癥信息,提取抑郁癥用戶和正常用戶在社交網(wǎng)絡中的語言和行為特征信息。在對特征信息進行分析和驗證的基礎上,利用機器學習算法預測抑郁癥用戶。[結(jié)果/結(jié)論]研究發(fā)現(xiàn),用戶在社交網(wǎng)絡上的語言和行為特征能夠反映其心理狀態(tài),從中提取的各類特征可用于抑郁用戶的檢測。在抑郁癥用戶預測方法中,隨機森林分類器的表現(xiàn)最好。基于Empath的詞語類別特征在不同類型分類中具有最高的預測得分,而主題特征的得分排名較低。
【文章來源】:現(xiàn)代情報. 2020,40(06)CSSCI
【文章頁數(shù)】:12 頁
【部分圖文】:
基于社交網(wǎng)絡的抑郁癥用戶檢測模型
從抑郁用戶組和正常用戶組交互特征統(tǒng)計結(jié)果(如圖2)可以發(fā)現(xiàn),抑郁用戶在社交網(wǎng)絡上不如正常用戶活躍,通常他們具有較少的朋友(432<608,p<0.001)。平均每天的發(fā)帖數(shù)量明顯低于正常用戶(25.79<27.92,p<0.001),抑郁用戶平均被關(guān)注數(shù)低于正常用戶(0.330<1.362,p<0.001)。平均每天的收藏數(shù)量較低(7.73<9.73,p=0.032)。另外,他們對事物缺乏興趣,關(guān)注或收藏的內(nèi)容較少。抑郁癥患者在社交網(wǎng)絡上與其他用戶之間的交互活動較少,具體表現(xiàn)在整體的發(fā)帖量明顯低于正常用戶。3.1.2 活動周期性分析
通過對抑郁癥患者帖子的語言結(jié)構(gòu)分析發(fā)現(xiàn),抑郁用戶使用人稱代詞的比例要顯著高于正常用戶,較常使用第一人稱(0.023>0.022,p=0.01)和第二人稱(0.020>0.019,p=0.002),較少使用第三人稱(0.015<0.017,p<0.001)。從心理學的視角看,較多的第一人稱使用率表明,抑郁癥患者更加關(guān)注自身,自我意識或自我感知能力過強。容易產(chǎn)生極端化的思維方式,喜歡用表示極端的副詞,如“完全”、“絕對”或“所有人”(0.0066>0.0059,p<0.001)。每個單詞的平均字符數(shù)存在一定差異(4.749>4.732,p=0.048)。抑郁癥用戶在交流中使用較為簡單的語法形式,缺乏靈活性,語言可讀性(CLI)較低(11.59<11.78,p=0.046),在詞性類別的選擇上更加單一化,運用語言的能力要低于正常用戶組。在連詞(0.019>0.022,p<0.001)、數(shù)詞(0.016<0.018,p<0.001)、情態(tài)助動詞(0.013>0.012,p=0.01)、名詞(0.176<0.179,p=0.006)、副詞(0.061>0.059,p=0.004)、小品詞(0.0049<0.0052,p=0.001)和動詞(0.098<0.104,p<0.001)等詞語使用頻率整體較低。抑郁癥患者語言和內(nèi)容相對貧乏,傾向于使用更多的簡單單詞(4.73<4.74,p=0.047),每個句子平均單詞數(shù)較少(17<37,p=0.002)。結(jié)果見圖4。
【參考文獻】:
期刊論文
[1]近三年國外圖書館學與信息科學領域研究熱點與前沿分析[J]. 劉雅姝,張海濤,徐海玲,李題印. 現(xiàn)代情報. 2019(09)
[2]利用準私密社交網(wǎng)絡文本數(shù)據(jù)檢測抑郁用戶的可行性分析[J]. 劉德喜,邱家洪,萬常選,劉喜平,鐘敏娟,郭海峰,鄧松. 中文信息學報. 2018(09)
[3]2017年國際信息科學與圖書館學研究熱點分析[J]. 田大芳,魏瑞斌. 現(xiàn)代情報. 2018(08)
[4]基于“用戶畫像”的閱讀療法模式研究——以抑郁癥為例[J]. 韓梅花,趙景秀. 大學圖書館學報. 2017(06)
碩士論文
[1]基于情緒詞庫的抑郁癥患者情緒表達分析與預測[D]. 李林堅.浙江大學 2019
[2]基于詞向量的微博用戶抑郁預測方法研究[D]. 方振宇.合肥工業(yè)大學 2017
[3]基于新浪微博的互聯(lián)網(wǎng)用戶心理健康狀態(tài)判別[D]. 胡泉.河南大學 2015
本文編號:3387188
【文章來源】:現(xiàn)代情報. 2020,40(06)CSSCI
【文章頁數(shù)】:12 頁
【部分圖文】:
基于社交網(wǎng)絡的抑郁癥用戶檢測模型
從抑郁用戶組和正常用戶組交互特征統(tǒng)計結(jié)果(如圖2)可以發(fā)現(xiàn),抑郁用戶在社交網(wǎng)絡上不如正常用戶活躍,通常他們具有較少的朋友(432<608,p<0.001)。平均每天的發(fā)帖數(shù)量明顯低于正常用戶(25.79<27.92,p<0.001),抑郁用戶平均被關(guān)注數(shù)低于正常用戶(0.330<1.362,p<0.001)。平均每天的收藏數(shù)量較低(7.73<9.73,p=0.032)。另外,他們對事物缺乏興趣,關(guān)注或收藏的內(nèi)容較少。抑郁癥患者在社交網(wǎng)絡上與其他用戶之間的交互活動較少,具體表現(xiàn)在整體的發(fā)帖量明顯低于正常用戶。3.1.2 活動周期性分析
通過對抑郁癥患者帖子的語言結(jié)構(gòu)分析發(fā)現(xiàn),抑郁用戶使用人稱代詞的比例要顯著高于正常用戶,較常使用第一人稱(0.023>0.022,p=0.01)和第二人稱(0.020>0.019,p=0.002),較少使用第三人稱(0.015<0.017,p<0.001)。從心理學的視角看,較多的第一人稱使用率表明,抑郁癥患者更加關(guān)注自身,自我意識或自我感知能力過強。容易產(chǎn)生極端化的思維方式,喜歡用表示極端的副詞,如“完全”、“絕對”或“所有人”(0.0066>0.0059,p<0.001)。每個單詞的平均字符數(shù)存在一定差異(4.749>4.732,p=0.048)。抑郁癥用戶在交流中使用較為簡單的語法形式,缺乏靈活性,語言可讀性(CLI)較低(11.59<11.78,p=0.046),在詞性類別的選擇上更加單一化,運用語言的能力要低于正常用戶組。在連詞(0.019>0.022,p<0.001)、數(shù)詞(0.016<0.018,p<0.001)、情態(tài)助動詞(0.013>0.012,p=0.01)、名詞(0.176<0.179,p=0.006)、副詞(0.061>0.059,p=0.004)、小品詞(0.0049<0.0052,p=0.001)和動詞(0.098<0.104,p<0.001)等詞語使用頻率整體較低。抑郁癥患者語言和內(nèi)容相對貧乏,傾向于使用更多的簡單單詞(4.73<4.74,p=0.047),每個句子平均單詞數(shù)較少(17<37,p=0.002)。結(jié)果見圖4。
【參考文獻】:
期刊論文
[1]近三年國外圖書館學與信息科學領域研究熱點與前沿分析[J]. 劉雅姝,張海濤,徐海玲,李題印. 現(xiàn)代情報. 2019(09)
[2]利用準私密社交網(wǎng)絡文本數(shù)據(jù)檢測抑郁用戶的可行性分析[J]. 劉德喜,邱家洪,萬常選,劉喜平,鐘敏娟,郭海峰,鄧松. 中文信息學報. 2018(09)
[3]2017年國際信息科學與圖書館學研究熱點分析[J]. 田大芳,魏瑞斌. 現(xiàn)代情報. 2018(08)
[4]基于“用戶畫像”的閱讀療法模式研究——以抑郁癥為例[J]. 韓梅花,趙景秀. 大學圖書館學報. 2017(06)
碩士論文
[1]基于情緒詞庫的抑郁癥患者情緒表達分析與預測[D]. 李林堅.浙江大學 2019
[2]基于詞向量的微博用戶抑郁預測方法研究[D]. 方振宇.合肥工業(yè)大學 2017
[3]基于新浪微博的互聯(lián)網(wǎng)用戶心理健康狀態(tài)判別[D]. 胡泉.河南大學 2015
本文編號:3387188
本文鏈接:http://sikaile.net/tushudanganlunwen/3387188.html