基于中文微博語言特征的自殺意念檢測
發(fā)布時間:2020-12-29 08:59
針對自殺意念檢測,建立一個可遷移性強的自殺詞典,并提出詞性特征,以提高基于n-gram特征的自殺意念檢測模型的分類準確率.采用對比實驗與控制變量的方式,以n-gram特征、語言特征(詞匯特征、詞性特征)為輸入特征,以隨機森林、支持向量機算法為驅(qū)動,重點研究語言特征對模型性能的影響,同時探究在不同特征下不同分類算法訓練模型的性能表現(xiàn).結果表明:語言特征對模型性能有大幅提升,通過比較發(fā)現(xiàn),基于n-gram特征與語言特征的模型性能優(yōu)于基于n-gram特征和詞典特征的模型和基于n-gram特征的模型,其中在隨機森林算法下性能提升約20%.
【文章來源】:中北大學學報(自然科學版). 2019年04期
【文章頁數(shù)】:8 頁
【文章目錄】:
0 引言
1 自殺誘因分析及其語言特征
1.1 自殺誘因
1.2 自殺誘因的語言特征
2 語言特征的選取與量化
2.1 特征
2.2 特征量化
3 實驗與結果分析
3.1 假設
3.2 數(shù)據(jù)來源及預處理
3.2.1 數(shù)據(jù)來源
3.2.2 數(shù)據(jù)預處理
3.2.3 數(shù)據(jù)標注
3.3 實驗方法
3.4 自殺意念檢測與模型評估
3.5 實驗結果分析
4 結論
【參考文獻】:
期刊論文
[1]自殺意念與人格特征的研究進展[J]. 楊登樂,姜潮,賈樹華. 醫(yī)學與哲學(A). 2017(01)
[2]邊緣型人格障礙患者自殺意念危險因素研究[J]. 孟艷君,孫寧. 臨床醫(yī)藥實踐. 2014(10)
[3]中國人群自殺行為的研究進展[J]. 宋劍鋒,盧祖洵. 公共衛(wèi)生與預防醫(yī)學. 2008(04)
本文編號:2945375
【文章來源】:中北大學學報(自然科學版). 2019年04期
【文章頁數(shù)】:8 頁
【文章目錄】:
0 引言
1 自殺誘因分析及其語言特征
1.1 自殺誘因
1.2 自殺誘因的語言特征
2 語言特征的選取與量化
2.1 特征
2.2 特征量化
3 實驗與結果分析
3.1 假設
3.2 數(shù)據(jù)來源及預處理
3.2.1 數(shù)據(jù)來源
3.2.2 數(shù)據(jù)預處理
3.2.3 數(shù)據(jù)標注
3.3 實驗方法
3.4 自殺意念檢測與模型評估
3.5 實驗結果分析
4 結論
【參考文獻】:
期刊論文
[1]自殺意念與人格特征的研究進展[J]. 楊登樂,姜潮,賈樹華. 醫(yī)學與哲學(A). 2017(01)
[2]邊緣型人格障礙患者自殺意念危險因素研究[J]. 孟艷君,孫寧. 臨床醫(yī)藥實踐. 2014(10)
[3]中國人群自殺行為的研究進展[J]. 宋劍鋒,盧祖洵. 公共衛(wèi)生與預防醫(yī)學. 2008(04)
本文編號:2945375
本文鏈接:http://sikaile.net/yixuelunwen/binglixuelunwen/2945375.html
最近更新
教材專著