微博中個人與非個人用戶分類方法研究
本文關(guān)鍵詞:微博中個人與非個人用戶分類方法研究
更多相關(guān)文章: 個人用戶識別 新浪微博 文本分類 自然語言處理 社交網(wǎng)絡(luò)
【摘要】:分別利用用戶名和微博文本對個人與非個人兩種用戶類型進行判別,并對不同的特征(例如:字特征、詞特征等)進行研究分析;其次,在針對用戶名和微博文本的兩個分類器的基礎(chǔ)上,使用貝葉斯融合方法進行分類器融合,充分利用兩種文本分類信息同時進行用戶類型判斷。實驗結(jié)果表明此方法可以達到較高的識別準(zhǔn)確率,并且分類器融合方法明顯優(yōu)于僅利用用戶名或者微博文本的分類方法。
【作者單位】: 蘇州大學(xué)自然語言處理實驗室;海軍駐河海大學(xué)選培辦;
【關(guān)鍵詞】: 個人用戶識別 新浪微博 文本分類 自然語言處理 社交網(wǎng)絡(luò)
【基金】:國家自然科學(xué)基金(61375073)
【分類號】:TP393.092;TP391.1
【正文快照】: 0引言隨著Web2.0的出現(xiàn)及迅速發(fā)展,社交網(wǎng)站的概念越來越深入人心。各種類型的微型博客(Microblog)即微博相繼產(chǎn)生,成為一個跨時代的產(chǎn)品。一般而言,微博是一個基于用戶關(guān)系的信息獲取、傳播及分享的交流平臺,注冊用戶可以通過SMS、電郵、網(wǎng)站或第三方應(yīng)用在微博網(wǎng)站上面發(fā)布
【參考文獻】
中國期刊全文數(shù)據(jù)庫 前8條
1 周俊生;戴新宇;尹存燕;陳家駿;;基于層疊條件隨機場模型的中文機構(gòu)名自動識別[J];電子學(xué)報;2006年05期
2 曹波;蘇一丹;鄧琦;;基于最大熵模型的中國人名自動識別[J];計算機工程與應(yīng)用;2009年04期
3 鄭家恒,張輝;基于HMM的中國組織機構(gòu)名自動識別[J];計算機應(yīng)用;2002年11期
4 孫茂松,黃昌寧,高海燕,,方捷;中文姓名的自動辨識[J];中文信息學(xué)報;1995年02期
5 張劍峰;夏云慶;姚建民;;微博文本處理研究綜述[J];中文信息學(xué)報;2012年04期
6 文坤梅;徐帥;李瑞軒;辜希武;李玉華;;微博及中文微博信息處理研究綜述[J];中文信息學(xué)報;2012年06期
7 馬俊;周剛;許斌;黃永忠;;基于個人屬性特征的微博用戶影響力分析[J];計算機應(yīng)用研究;2013年08期
8 李澤魁;趙妍妍;秦兵;劉挺;;中文微博情感傾向性分析特征工程[J];山西大學(xué)學(xué)報(自然科學(xué)版);2014年04期
【共引文獻】
中國期刊全文數(shù)據(jù)庫 前10條
1 李玉森;張雪英;袁正午;;面向GIS的地理命名實體識別研究[J];重慶郵電大學(xué)學(xué)報(自然科學(xué)版);2008年06期
2 史永剛;左志宏;;決策樹在中文姓名信息提取中的應(yīng)用研究[J];成都信息工程學(xué)院學(xué)報;2006年02期
3 竇嶸;加羊吉;黃偉;;統(tǒng)計與規(guī)則相結(jié)合的藏文人名自動識別研究[J];長春工程學(xué)院學(xué)報(自然科學(xué)版);2010年02期
4 李建平;王慧強;盧愛平;郝洪亮;馮光升;;基于條件隨機場的網(wǎng)絡(luò)安全態(tài)勢量化感知方法[J];傳感器與微系統(tǒng);2010年10期
5 黃昌寧,孫茂松;中文信息處理最新成果的檢閱——記新加坡中文電腦國際會議ICCC’96[J];國外語言學(xué);1996年04期
6 孫茂松,鄒嘉彥;漢語自動分詞研究評述[J];當(dāng)代語言學(xué);2001年01期
7 黃德根,馬玉霞,楊元生;基于互信息的中文姓名識別方法[J];大連理工大學(xué)學(xué)報;2004年05期
8 黃德根;李澤中;萬如;;基于SVM和CRF的雙層模型中文機構(gòu)名識別[J];大連理工大學(xué)學(xué)報;2010年05期
9 劉利東;信息源中專業(yè)詞語的提取方法[J];德州學(xué)院學(xué)報(自然科學(xué)版);2002年02期
10 劉利東;基于組合度的漢語分詞決策算法研究[J];德州學(xué)院學(xué)報(自然科學(xué)版);2003年02期
中國重要會議論文全文數(shù)據(jù)庫 前10條
1 于江德;王希杰;樊孝忠;;漢語詞法分析中上文和下文孰重孰輕[A];中國計算語言學(xué)研究前沿進展(2009-2011)[C];2011年
2 何正焱;王厚峰;;商品品牌名稱挖掘[A];中國計算語言學(xué)研究前沿進展(2009-2011)[C];2011年
3 金朝;蔣宗禮;;中文機構(gòu)名的識別討論[A];2011高等職業(yè)教育電子信息類專業(yè)學(xué)術(shù)暨教學(xué)研討會論文集[C];2011年
4 周蕾;李培峰;朱巧明;楊季文;;碎片分詞與詞結(jié)合提取的未登錄詞識別方法[A];第六屆漢語詞匯語義學(xué)研討會論文集[C];2005年
5 侯敏;侯敞;;漢英機譯系統(tǒng)譯文質(zhì)量的評測[A];世紀(jì)之交的中國應(yīng)用語言學(xué)研究——第二屆全國語言文字應(yīng)用學(xué)術(shù)研討會論文集[C];1998年
6 張樹武;徐波;黃泰翼;;漢語大詞匯/連續(xù)語音識別語言建模技術(shù)分析[A];第四屆全國人機語音通訊學(xué)術(shù)會議論文集[C];1996年
7 高山;張艷;徐波;宗成慶;韓兆兵;;基于三元統(tǒng)計模型的漢語分詞及標(biāo)注一體化研究[A];自然語言理解與機器翻譯——全國第六屆計算語言學(xué)聯(lián)合學(xué)術(shù)會議論文集[C];2001年
8 季Y
本文編號:511174
本文鏈接:http://sikaile.net/guanlilunwen/ydhl/511174.html