微博中個(gè)人與非個(gè)人用戶分類方法研究
本文關(guān)鍵詞:微博中個(gè)人與非個(gè)人用戶分類方法研究
更多相關(guān)文章: 個(gè)人用戶識(shí)別 新浪微博 文本分類 自然語(yǔ)言處理 社交網(wǎng)絡(luò)
【摘要】:分別利用用戶名和微博文本對(duì)個(gè)人與非個(gè)人兩種用戶類型進(jìn)行判別,并對(duì)不同的特征(例如:字特征、詞特征等)進(jìn)行研究分析;其次,在針對(duì)用戶名和微博文本的兩個(gè)分類器的基礎(chǔ)上,使用貝葉斯融合方法進(jìn)行分類器融合,充分利用兩種文本分類信息同時(shí)進(jìn)行用戶類型判斷。實(shí)驗(yàn)結(jié)果表明此方法可以達(dá)到較高的識(shí)別準(zhǔn)確率,并且分類器融合方法明顯優(yōu)于僅利用用戶名或者微博文本的分類方法。
【作者單位】: 蘇州大學(xué)自然語(yǔ)言處理實(shí)驗(yàn)室;海軍駐河海大學(xué)選培辦;
【關(guān)鍵詞】: 個(gè)人用戶識(shí)別 新浪微博 文本分類 自然語(yǔ)言處理 社交網(wǎng)絡(luò)
【基金】:國(guó)家自然科學(xué)基金(61375073)
【分類號(hào)】:TP393.092;TP391.1
【正文快照】: 0引言隨著Web2.0的出現(xiàn)及迅速發(fā)展,社交網(wǎng)站的概念越來(lái)越深入人心。各種類型的微型博客(Microblog)即微博相繼產(chǎn)生,成為一個(gè)跨時(shí)代的產(chǎn)品。一般而言,微博是一個(gè)基于用戶關(guān)系的信息獲取、傳播及分享的交流平臺(tái),注冊(cè)用戶可以通過(guò)SMS、電郵、網(wǎng)站或第三方應(yīng)用在微博網(wǎng)站上面發(fā)布
【參考文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前8條
1 周俊生;戴新宇;尹存燕;陳家駿;;基于層疊條件隨機(jī)場(chǎng)模型的中文機(jī)構(gòu)名自動(dòng)識(shí)別[J];電子學(xué)報(bào);2006年05期
2 曹波;蘇一丹;鄧琦;;基于最大熵模型的中國(guó)人名自動(dòng)識(shí)別[J];計(jì)算機(jī)工程與應(yīng)用;2009年04期
3 鄭家恒,張輝;基于HMM的中國(guó)組織機(jī)構(gòu)名自動(dòng)識(shí)別[J];計(jì)算機(jī)應(yīng)用;2002年11期
4 孫茂松,黃昌寧,高海燕,,方捷;中文姓名的自動(dòng)辨識(shí)[J];中文信息學(xué)報(bào);1995年02期
5 張劍峰;夏云慶;姚建民;;微博文本處理研究綜述[J];中文信息學(xué)報(bào);2012年04期
6 文坤梅;徐帥;李瑞軒;辜希武;李玉華;;微博及中文微博信息處理研究綜述[J];中文信息學(xué)報(bào);2012年06期
7 馬俊;周剛;許斌;黃永忠;;基于個(gè)人屬性特征的微博用戶影響力分析[J];計(jì)算機(jī)應(yīng)用研究;2013年08期
8 李澤魁;趙妍妍;秦兵;劉挺;;中文微博情感傾向性分析特征工程[J];山西大學(xué)學(xué)報(bào)(自然科學(xué)版);2014年04期
【共引文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前10條
1 李玉森;張雪英;袁正午;;面向GIS的地理命名實(shí)體識(shí)別研究[J];重慶郵電大學(xué)學(xué)報(bào)(自然科學(xué)版);2008年06期
2 史永剛;左志宏;;決策樹(shù)在中文姓名信息提取中的應(yīng)用研究[J];成都信息工程學(xué)院學(xué)報(bào);2006年02期
3 竇嶸;加羊吉;黃偉;;統(tǒng)計(jì)與規(guī)則相結(jié)合的藏文人名自動(dòng)識(shí)別研究[J];長(zhǎng)春工程學(xué)院學(xué)報(bào)(自然科學(xué)版);2010年02期
4 李建平;王慧強(qiáng);盧愛(ài)平;郝洪亮;馮光升;;基于條件隨機(jī)場(chǎng)的網(wǎng)絡(luò)安全態(tài)勢(shì)量化感知方法[J];傳感器與微系統(tǒng);2010年10期
5 黃昌寧,孫茂松;中文信息處理最新成果的檢閱——記新加坡中文電腦國(guó)際會(huì)議ICCC’96[J];國(guó)外語(yǔ)言學(xué);1996年04期
6 孫茂松,鄒嘉彥;漢語(yǔ)自動(dòng)分詞研究評(píng)述[J];當(dāng)代語(yǔ)言學(xué);2001年01期
7 黃德根,馬玉霞,楊元生;基于互信息的中文姓名識(shí)別方法[J];大連理工大學(xué)學(xué)報(bào);2004年05期
8 黃德根;李澤中;萬(wàn)如;;基于SVM和CRF的雙層模型中文機(jī)構(gòu)名識(shí)別[J];大連理工大學(xué)學(xué)報(bào);2010年05期
9 劉利東;信息源中專業(yè)詞語(yǔ)的提取方法[J];德州學(xué)院學(xué)報(bào)(自然科學(xué)版);2002年02期
10 劉利東;基于組合度的漢語(yǔ)分詞決策算法研究[J];德州學(xué)院學(xué)報(bào)(自然科學(xué)版);2003年02期
中國(guó)重要會(huì)議論文全文數(shù)據(jù)庫(kù) 前10條
1 于江德;王希杰;樊孝忠;;漢語(yǔ)詞法分析中上文和下文孰重孰輕[A];中國(guó)計(jì)算語(yǔ)言學(xué)研究前沿進(jìn)展(2009-2011)[C];2011年
2 何正焱;王厚峰;;商品品牌名稱挖掘[A];中國(guó)計(jì)算語(yǔ)言學(xué)研究前沿進(jìn)展(2009-2011)[C];2011年
3 金朝;蔣宗禮;;中文機(jī)構(gòu)名的識(shí)別討論[A];2011高等職業(yè)教育電子信息類專業(yè)學(xué)術(shù)暨教學(xué)研討會(huì)論文集[C];2011年
4 周蕾;李培峰;朱巧明;楊季文;;碎片分詞與詞結(jié)合提取的未登錄詞識(shí)別方法[A];第六屆漢語(yǔ)詞匯語(yǔ)義學(xué)研討會(huì)論文集[C];2005年
5 侯敏;侯敞;;漢英機(jī)譯系統(tǒng)譯文質(zhì)量的評(píng)測(cè)[A];世紀(jì)之交的中國(guó)應(yīng)用語(yǔ)言學(xué)研究——第二屆全國(guó)語(yǔ)言文字應(yīng)用學(xué)術(shù)研討會(huì)論文集[C];1998年
6 張樹(shù)武;徐波;黃泰翼;;漢語(yǔ)大詞匯/連續(xù)語(yǔ)音識(shí)別語(yǔ)言建模技術(shù)分析[A];第四屆全國(guó)人機(jī)語(yǔ)音通訊學(xué)術(shù)會(huì)議論文集[C];1996年
7 高山;張艷;徐波;宗成慶;韓兆兵;;基于三元統(tǒng)計(jì)模型的漢語(yǔ)分詞及標(biāo)注一體化研究[A];自然語(yǔ)言理解與機(jī)器翻譯——全國(guó)第六屆計(jì)算語(yǔ)言學(xué)聯(lián)合學(xué)術(shù)會(huì)議論文集[C];2001年
8 季Y
本文編號(hào):511174
本文鏈接:http://sikaile.net/guanlilunwen/ydhl/511174.html