天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁(yè) > 科技論文 > 軟件論文 >

作者身份識(shí)別中不規(guī)范文本特征選擇方法的研究

發(fā)布時(shí)間:2017-09-17 04:48

  本文關(guān)鍵詞:作者身份識(shí)別中不規(guī)范文本特征選擇方法的研究


  更多相關(guān)文章: 作者身份 不規(guī)范文本 網(wǎng)絡(luò)文本 文本相似度


【摘要】:【目的】從不規(guī)范文本中提取特征,識(shí)別網(wǎng)絡(luò)文本作者身份。【方法】提出兩種在不規(guī)范文本中提取特征的方法:利用在Jaccard系數(shù)的基礎(chǔ)上定義的不規(guī)范文本相似度M;利用不規(guī)范文本在文本中出現(xiàn)的次數(shù)�!窘Y(jié)果】?jī)煞N特征的識(shí)別正確率分別達(dá)到85.1%和80.2%,加入這兩種特征后,傳統(tǒng)的基于統(tǒng)計(jì)值特征的分類器識(shí)別正確率分別提高5.8%和4%�!揪窒蕖恐豢紤]到網(wǎng)絡(luò)文本在詞匯層面的不規(guī)范性,并沒(méi)有針對(duì)更高層面的特性進(jìn)行研究,如句法層面、結(jié)構(gòu)層面�!窘Y(jié)論】本文提出的特征提取方法,可以有效地提取不規(guī)范文本特征,有助于作者身份識(shí)別系統(tǒng)識(shí)別正確率的提升。
【作者單位】: 大連外國(guó)語(yǔ)大學(xué)軟件學(xué)院;
【關(guān)鍵詞】作者身份 不規(guī)范文本 網(wǎng)絡(luò)文本 文本相似度
【基金】:國(guó)家社會(huì)科學(xué)基金項(xiàng)目“典籍英譯國(guó)外讀者網(wǎng)上評(píng)論觀點(diǎn)挖掘研究”(項(xiàng)目編號(hào):15BYY028) 大連外國(guó)語(yǔ)大學(xué)科研項(xiàng)目“英文作者身份識(shí)別中書(shū)寫(xiě)不規(guī)范文本處理方法的研究”(項(xiàng)目編號(hào):2014XJQN15)的研究成果之一
【分類號(hào)】:TP391.1
【正文快照】: 1引言作者身份識(shí)別作為自然語(yǔ)言處理的一個(gè)重要方向,一直倍受關(guān)注。隨著微信、微博等社交網(wǎng)絡(luò)的興起與大數(shù)據(jù)時(shí)代的到來(lái),出于對(duì)道德與信息安全方面的考慮,人們對(duì)網(wǎng)絡(luò)文本作者身份正確認(rèn)證的需求變得更加迫切。如在輿情監(jiān)控中,一些惡意信息是否出于同一作者,又如垃圾郵件的作者,

本文編號(hào):867355

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/867355.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶422e6***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com