天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

中文微博命名體識(shí)別

發(fā)布時(shí)間:2017-12-20 19:00

  本文關(guān)鍵詞:中文微博命名體識(shí)別 出處:《四川大學(xué)學(xué)報(bào)(自然科學(xué)版)》2015年03期  論文類型:期刊論文


  更多相關(guān)文章: 微博 條件隨機(jī)場(chǎng) 命名實(shí)體 三級(jí)粒度特征 短文本


【摘要】:近年來(lái)微博的快速發(fā)展為命名體識(shí)別提供了新的載體,同時(shí)微博的特點(diǎn)也為命名體識(shí)別研究帶來(lái)了挑戰(zhàn).針對(duì)微博特點(diǎn),本文提出了基于拼音相似距離以及文本相似距離聚類算法對(duì)微博文本進(jìn)行規(guī)范化,消除了微博的語(yǔ)言表達(dá)不規(guī)范造成的干擾.同時(shí),本文還提出了篇章級(jí)、句子級(jí)以及詞匯級(jí)三級(jí)粒度的特征提取,使用條件隨機(jī)場(chǎng)模型進(jìn)行訓(xùn)練數(shù)據(jù),并識(shí)別命名體,采用由微博文本相似聚類獲得的實(shí)體關(guān)系類對(duì)命名體類型進(jìn)行修正.由于缺少大量的微博訓(xùn)練數(shù)據(jù),本文采用半監(jiān)督學(xué)習(xí)框架訓(xùn)練模型.通過(guò)對(duì)新浪微博數(shù)據(jù)的實(shí)驗(yàn)結(jié)果表明,本方法能夠有效地提高微博中命名體識(shí)別的效果.
【作者單位】: 四川民族學(xué)院計(jì)算機(jī)科學(xué)系;四川大學(xué)計(jì)算機(jī)學(xué)院;
【基金】:國(guó)家自然科技基金項(xiàng)目(61332066,81373239)
【分類號(hào)】:TP391.1;TP393.092
【正文快照】: 1引言隨著中國(guó)信息產(chǎn)業(yè)的快速發(fā)展,中文信息處理技術(shù)已然變得越來(lái)越重要.在語(yǔ)言文本中,命名實(shí)體是主要的信息載體,同時(shí)也是文本中的基本信息單位,因此,正確的識(shí)別命名體是理解文本的前提,也是人們理解自然語(yǔ)言的基礎(chǔ).目前,針對(duì)正式文本中的命名體識(shí)別研究[1-5]已經(jīng)較為成熟,而

【參考文獻(xiàn)】

中國(guó)期刊全文數(shù)據(jù)庫(kù) 前4條

1 朱敏;賈真;左玲;吳安峻;陳方正;柏玉;;中文微博實(shí)體鏈接研究[J];北京大學(xué)學(xué)報(bào)(自然科學(xué)版);2014年01期

2 邱泉清;苗奪謙;張志飛;;中文微博命名實(shí)體識(shí)別[J];計(jì)算機(jī)科學(xué);2013年06期

3 姜仁會(huì);王挺;唐晉韜;;面向微博文本的命名實(shí)體識(shí)別[J];計(jì)算機(jī)與數(shù)字工程;2014年04期

4 周昆;胡學(xué)鋼;;一種基于本體論和規(guī)則匹配的中文人名識(shí)別方法[J];微計(jì)算機(jī)信息;2010年31期

【共引文獻(xiàn)】

中國(guó)期刊全文數(shù)據(jù)庫(kù) 前5條

1 王鵬;李成城;;基于修辭結(jié)構(gòu)理論的文本結(jié)構(gòu)自動(dòng)分析[J];電子技術(shù)與軟件工程;2013年19期

2 舒佳根;惠浩添;錢龍華;朱巧明;;一個(gè)中文實(shí)體鏈接語(yǔ)料庫(kù)的建設(shè)[J];北京大學(xué)學(xué)報(bào)(自然科學(xué)版);2015年02期

3 吳沖沖;;基于集成學(xué)習(xí)的中文微博情感分類方法[J];科技傳播;2014年16期

4 周鵬;蔡淑琴;石雙元;袁乾;;微博危機(jī)事件損害性評(píng)價(jià)研究[J];情報(bào)雜志;2013年11期

5 汪泱;古麗拉·阿東別克;戶冰心;牛寧寧;;基于條件隨機(jī)場(chǎng)的哈薩克語(yǔ)基本短語(yǔ)自動(dòng)識(shí)別[J];計(jì)算機(jī)工程與設(shè)計(jì);2014年10期

中國(guó)博士學(xué)位論文全文數(shù)據(jù)庫(kù) 前3條

1 豆增發(fā);生物命名實(shí)體識(shí)別及生物文本分類[D];西安電子科技大學(xué);2013年

2 付瑞吉;開(kāi)放域命名實(shí)體識(shí)別及其層次化類別獲取[D];哈爾濱工業(yè)大學(xué);2014年

3 郭宇航;基于上下文的實(shí)體鏈指技術(shù)研究[D];哈爾濱工業(yè)大學(xué);2014年

中國(guó)碩士學(xué)位論文全文數(shù)據(jù)庫(kù) 前5條

1 戴思明;互聯(lián)網(wǎng)文本熱點(diǎn)信息實(shí)體識(shí)別研究及應(yīng)用[D];華南理工大學(xué);2012年

2 臧勇真;基于統(tǒng)計(jì)和規(guī)則的中文人名識(shí)別研究與實(shí)現(xiàn)[D];西南交通大學(xué);2013年

3 彭新茗;基于多層學(xué)習(xí)的病歷實(shí)體識(shí)別算法設(shè)計(jì)與實(shí)現(xiàn)[D];東北大學(xué);2013年

4 荀晶;面向微博數(shù)據(jù)的命名實(shí)體識(shí)別研究與實(shí)現(xiàn)[D];東北大學(xué);2013年

5 薛程元;面向列表型知識(shí)庫(kù)的組織機(jī)構(gòu)實(shí)體鏈接方法研究[D];華東理工大學(xué);2015年

【二級(jí)參考文獻(xiàn)】

中國(guó)期刊全文數(shù)據(jù)庫(kù) 前10條

1 鄧志鴻,唐世渭,張銘,楊冬青,陳捷;Ontology研究綜述[J];北京大學(xué)學(xué)報(bào)(自然科學(xué)版);2002年05期

2 周俊生;戴新宇;尹存燕;陳家駿;;基于層疊條件隨機(jī)場(chǎng)模型的中文機(jī)構(gòu)名自動(dòng)識(shí)別[J];電子學(xué)報(bào);2006年05期

3 劉群,張華平,俞鴻魁,程學(xué)旗;基于層疊隱馬模型的漢語(yǔ)詞法分析[J];計(jì)算機(jī)研究與發(fā)展;2004年08期

4 崔世起;劉群;孟遙;于浩;西野文人;;基于大規(guī)模語(yǔ)料庫(kù)的新詞檢測(cè)[J];計(jì)算機(jī)研究與發(fā)展;2006年05期

5 胡文博;都云程;呂學(xué)強(qiáng);施水才;;基于多層條件隨機(jī)場(chǎng)的中文命名實(shí)體識(shí)別[J];計(jì)算機(jī)工程與應(yīng)用;2009年01期

6 張曉艷;王挺;陳火旺;;命名實(shí)體識(shí)別研究[J];計(jì)算機(jī)科學(xué);2005年04期

7 繆建明;張全;;一種基于概念關(guān)聯(lián)式的詞義消岐方法[J];計(jì)算機(jī)科學(xué);2010年01期

8 鄭斐然;苗奪謙;張志飛;高燦;;一種中文微博新聞話題檢測(cè)的方法[J];計(jì)算機(jī)科學(xué);2012年01期

9 姜維;王曉龍;關(guān)毅;趙健;;基于多知識(shí)源的中文詞法分析系統(tǒng)[J];計(jì)算機(jī)學(xué)報(bào);2007年01期

10 王丹;樊興華;;面向短文本的命名實(shí)體識(shí)別[J];計(jì)算機(jī)應(yīng)用;2009年01期

中國(guó)碩士學(xué)位論文全文數(shù)據(jù)庫(kù) 前2條

1 楊華;基于最大熵模型的中文命名實(shí)體識(shí)別方法研究[D];哈爾濱工程大學(xué);2008年

2 周昆;基于規(guī)則的命名實(shí)體識(shí)別研究[D];合肥工業(yè)大學(xué);2010年



本文編號(hào):1313041

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/guanlilunwen/ydhl/1313041.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶c8f77***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com