中文微博作者身份識別研究
發(fā)布時間:2018-04-26 00:15
本文選題:中文 + 微博。 參考:《情報學報》2017年01期
【摘要】:本文針對中文微博篇幅短小、無間隔標記等特點,建立了由詞匯特征、淺層句法和深層句法特征集組成的中文微博作者文體特征模型,選取支持向量機、序列最小優(yōu)化支持向量機、樸素貝葉斯和決策樹算法在公開微博語料上進行算法對照實驗、特征集組合實驗和各組文體特征的作者身份識別實驗。實驗結果驗證了本文模型在中文微博作者身份識別任務中的高準確率、召回率和時間效率。
[Abstract]:In this paper, according to the features of Weibo, such as short length and no spacer marks, a stylistic feature model is established, which consists of lexical features, shallow syntactic features and deep syntactic features, and support vector machines are selected. Sequence minimization support vector machines, naive Bayes and decision tree algorithms are used to carry out algorithm control experiments on open Weibo corpus, feature set combination experiments and author identity recognition experiments for each group of stylistic features. The experimental results verify the high accuracy, recall rate and time efficiency of the proposed model in the task of Chinese Weibo author identification.
【作者單位】: 大連外國語大學軟件學院;
【基金】:國家社會科學基金一般項目(15BYY028) 國家教育部回國人員科研啟動基金(教外司[2015]1098) 教育部人文社科青年基金項目(11YJCZH131) 大連外國語大學科研項目(2013XJQN20,2014XJQN15)
【分類號】:TP391.1;TP393.092
【相似文獻】
相關期刊論文 前10條
1 郭飛飛;王小華;諶志群;王榮波;;基于回應消息的中文微博情感分類方法[J];杭州電子科技大學學報;2013年06期
2 文坤梅;徐帥;李瑞軒;辜希武;李玉華;;微博及中文微博信息處理研究綜述[J];中文信息學報;2012年06期
3 王銀;吳新玲;;中文微博情感分析方法研究[J];廣東技術師范學院學報;2014年03期
4 肖s,
本文編號:1803614
本文鏈接:http://sikaile.net/guanlilunwen/ydhl/1803614.html
最近更新
教材專著