基于社交數(shù)據(jù)挖掘的心理健康預(yù)警建模與分析
發(fā)布時(shí)間:2023-04-04 04:26
本文利用現(xiàn)有的較完善的通用情感詞典,并加入網(wǎng)絡(luò)用詞,構(gòu)建與抑郁癥有關(guān)的情感詞典,結(jié)合現(xiàn)有的情感分析手段分析語句中的情感值。人工篩選抑郁用戶及非抑郁用戶,爬取用戶的基本信息及微博內(nèi)容,從獲取的數(shù)據(jù)中選擇相關(guān)的信息作為特征。將構(gòu)建好的特征向量及人為標(biāo)注的標(biāo)簽(是否抑郁)作為數(shù)據(jù)集,并隨機(jī)劃分為訓(xùn)練集和測(cè)試集,通過XGBoost、SVM、決策樹、lightGBM等算法構(gòu)建不同的分類器,結(jié)合精確率、召回率和F1值等指標(biāo),得出最優(yōu)分類器XGBoost,XGBoost分類模型的準(zhǔn)確率為91%,召回率為59%,F1分?jǐn)?shù)為71%。該實(shí)驗(yàn)結(jié)果也表明用社交數(shù)據(jù)來預(yù)測(cè)抑郁傾向是可行的。
【文章頁數(shù)】:2 頁
【文章目錄】:
1 問題背景
2 數(shù)據(jù)分析
2.1 抑郁和非抑郁用戶的選取
2.2 數(shù)據(jù)獲取及預(yù)處理
2.2.1 數(shù)據(jù)獲取
2.2.2 數(shù)據(jù)預(yù)處理
2.2.3 情緒分析技術(shù)
3 基于情緒詞典的預(yù)測(cè)模型
3.1 特征選取
3.2 實(shí)驗(yàn)結(jié)果及分析
4 總結(jié)
本文編號(hào):3781781
【文章頁數(shù)】:2 頁
【文章目錄】:
1 問題背景
2 數(shù)據(jù)分析
2.1 抑郁和非抑郁用戶的選取
2.2 數(shù)據(jù)獲取及預(yù)處理
2.2.1 數(shù)據(jù)獲取
2.2.2 數(shù)據(jù)預(yù)處理
2.2.3 情緒分析技術(shù)
3 基于情緒詞典的預(yù)測(cè)模型
3.1 特征選取
3.2 實(shí)驗(yàn)結(jié)果及分析
4 總結(jié)
本文編號(hào):3781781
本文鏈接:http://sikaile.net/yixuelunwen/jsb/3781781.html
最近更新
教材專著