基于詞向量和條件隨機場的領(lǐng)域術(shù)語識別方法
本文關(guān)鍵詞:基于詞向量和條件隨機場的領(lǐng)域術(shù)語識別方法
更多相關(guān)文章: 詞向量 條件隨機場 術(shù)語識別 相似度特征
【摘要】:針對基于統(tǒng)計特征的領(lǐng)域術(shù)語識別方法忽略了術(shù)語的語義和領(lǐng)域特性,從而影響識別結(jié)果這一問題,提出一種基于詞向量和條件隨機場(CRF)的領(lǐng)域術(shù)語識別方法。該方法利用詞向量具有較強的語義表達能力、詞語與領(lǐng)域術(shù)語之間的相似度具有較強的領(lǐng)域表達能力這一特點,在統(tǒng)計特征的基礎(chǔ)上,增加了詞語的詞向量與領(lǐng)域術(shù)語的詞向量之間的相似度特征,構(gòu)成基于詞向量的特征向量,并采用CRF方法綜合這些特征實現(xiàn)了領(lǐng)域術(shù)語識別。最后在領(lǐng)域語料庫和Sogou CA語料庫上進行實驗,識別結(jié)果的準確率、召回率和F測度分別達到了0.985 5、0.943 9和0.964 3,表明所提的領(lǐng)域術(shù)語識別方法取得了較好的效果。
【作者單位】: 大連海洋大學信息工程學院;遼寧省海洋信息技術(shù)重點實驗室(大連海洋大學);大連海洋大學經(jīng)濟管理學院;
【關(guān)鍵詞】: 詞向量 條件隨機場 術(shù)語識別 相似度特征
【分類號】:TP391.1
【正文快照】: 0引言領(lǐng)域術(shù)語識別是自然語言處理領(lǐng)域的關(guān)鍵任務(wù),對數(shù)據(jù)挖掘、信息檢索、機器翻譯等方面的研究和應(yīng)用有重要的意義,引起了國內(nèi)外學者們的關(guān)注[1]。吳海燕[2]利用互信息對旅游領(lǐng)域術(shù)語識別問題進行研究;李麗雙等[3]利用信息熵和詞頻變化對汽車領(lǐng)域的術(shù)語進行抽取。這類方法主
【相似文獻】
中國期刊全文數(shù)據(jù)庫 前10條
1 宗萍;施水才;王濤;呂學強;;基于條件隨機場的英文地理行政實體識別[J];現(xiàn)代圖書情報技術(shù);2009年02期
2 張開旭;夏云慶;宇航;;基于條件隨機場的古漢語自動斷句與標點方法[J];清華大學學報(自然科學版);2009年10期
3 成姣;蔡東風;季鐸;;基于條件隨機場的日語依存分析[J];沈陽航空工業(yè)學院學報;2010年05期
4 李玲玲;金泰松;李翠華;;基于局部特征和隱條件隨機場的場景分類方法[J];北京理工大學學報;2012年07期
5 寧偉;蔡東風;張桂平;季鐸;苗雪雷;;基于條件隨機場的冠詞選擇研究[J];中文信息學報;2008年06期
6 張玉芳;莫凌琳;熊忠陽;耿曉斐;;基于條件隨機場的科研論文信息分層抽取[J];計算機應(yīng)用研究;2009年10期
7 王昌厚;;基于條件隨機場的中文命名體識別[J];福建電腦;2012年02期
8 施水才;王鍇;韓艷鏵;呂學強;;基于條件隨機場的領(lǐng)域術(shù)語識別研究[J];計算機工程與應(yīng)用;2013年10期
9 王東波;陳小荷;年洪東;;基于條件隨機場的有標記聯(lián)合結(jié)構(gòu)自動識別[J];中文信息學報;2008年06期
10 方瑩;;基于條件隨機場的英文農(nóng)產(chǎn)品名識別[J];河南科學;2011年03期
中國重要會議論文全文數(shù)據(jù)庫 前5條
1 王東波;陳小荷;年洪東;;基于條件隨機場的有標記聯(lián)合結(jié)構(gòu)自動識別[A];第四屆全國學生計算語言學研討會會議論文集[C];2008年
2 張奇;翁富良;黃萱菁;吳立德;;英文口語中非流利區(qū)域的檢測[A];內(nèi)容計算的研究與應(yīng)用前沿——第九屆全國計算語言學學術(shù)會議論文集[C];2007年
3 魏瑋;杜金華;徐波;;基于分層語塊分析的統(tǒng)計翻譯研究[A];內(nèi)容計算的研究與應(yīng)用前沿——第九屆全國計算語言學學術(shù)會議論文集[C];2007年
4 王根;趙軍;;基于多重冗余標記CRF的句子情感分析研究[A];內(nèi)容計算的研究與應(yīng)用前沿——第九屆全國計算語言學學術(shù)會議論文集[C];2007年
5 寧偉;蔡東風;季鐸;;基于條件隨機場的冠詞選擇研究[A];第四屆全國學生計算語言學研討會會議論文集[C];2008年
中國博士學位論文全文數(shù)據(jù)庫 前1條
1 熊英;中文自然語言理解中基于條件隨機場理論的詞法分析研究[D];上海交通大學;2009年
中國碩士學位論文全文數(shù)據(jù)庫 前10條
1 趙九洋;圖像中行人檢測關(guān)鍵技術(shù)研究[D];南京大學;2015年
2 寧振;基于層疊條件隨機場的情感分析[D];南昌大學;2015年
3 楊獻祥;面向中文微博的產(chǎn)品名實體識別與規(guī)范化算法設(shè)計與實現(xiàn)[D];北京理工大學;2015年
4 肖s,
本文編號:861592
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/861592.html