天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁(yè) > 管理論文 > 科研管理論文 >

基于CRFs的冶金領(lǐng)域中文專利術(shù)語(yǔ)抽取研究

發(fā)布時(shí)間:2019-03-27 11:17
【摘要】:【目的】探討冶金領(lǐng)域中文專利術(shù)語(yǔ)抽取模型的最優(yōu)條件,用于有效地抽取冶金領(lǐng)域?qū)@g(shù)語(yǔ)。【方法】使用尚不完善的核心語(yǔ)料庫(kù),在無(wú)需人工標(biāo)引的情況下,采用條件隨機(jī)場(chǎng)(CRFs)構(gòu)建字角色標(biāo)注的冶金領(lǐng)域中文專利術(shù)語(yǔ)識(shí)別模型。詳細(xì)說(shuō)明模型的構(gòu)建過程,同時(shí)重點(diǎn)對(duì)比CFRs的各個(gè)因素(特征組合、字長(zhǎng)窗口等)對(duì)識(shí)別效果的影響!窘Y(jié)果】實(shí)驗(yàn)結(jié)果表明字序列、級(jí)別特征、領(lǐng)域特征、溫度特征的組合在字長(zhǎng)窗口為3,c等于1,f等于1時(shí),準(zhǔn)確率達(dá)到94.26%,召回率達(dá)到94.37%,F1值達(dá)到94.5%!揪窒蕖亢诵脑~典欠完善,使得部分詞語(yǔ)標(biāo)注不夠準(zhǔn)確;未與其他方法作詳細(xì)比較,未詳細(xì)說(shuō)明CRFs的可靠性!窘Y(jié)論】CRFs在適當(dāng)?shù)慕巧吞卣饕约疤卣髂0宓慕M合下能較好地識(shí)別出冶金領(lǐng)域的中文專利術(shù)語(yǔ)。
[Abstract]:[objective] to explore the optimal condition of Chinese patent term extraction model in metallurgical field, which can be used to effectively extract patent term in metallurgical field. [methods] the core corpus, which is not perfect, can be used without manual indexing. The conditional random field (CRFs) is used to construct the Chinese patent term recognition model of character tagging in metallurgical field. The construction process of the model is described in detail, and the influence of each factor of CFRs (feature combination, word length window, etc.) on the recognition effect is compared in detail. [results] the experimental results show that the word sequence, the level feature, the domain feature, and so on. The combination of temperature features at the word length window of 3, c equals 1, f equals 1, the accuracy rate reaches 94.26%, the recall rate reaches 94.37%, and the F1 value reaches 94.5%. Make part of the words not accurate tagging; The reliability of CRFs is not explained in detail compared with other methods. [conclusion] CRFs can identify the Chinese patent terms in metallurgical field well under the combination of appropriate roles and features and feature templates.
【作者單位】: 南京大學(xué)信息管理學(xué)院;江蘇省數(shù)據(jù)工程與知識(shí)服務(wù)重點(diǎn)實(shí)驗(yàn)室;
【基金】:江蘇省自然科學(xué)基金項(xiàng)目“面向?qū)@A(yù)警的中文本體學(xué)習(xí)研究”(項(xiàng)目編號(hào):BK20130587) 江蘇省“333”工程項(xiàng)目“面向知識(shí)服務(wù)的中文本體學(xué)習(xí)研究”(項(xiàng)目編號(hào):BRA2015401)的研究成果之一
【分類號(hào)】:TP391.1;G306

【參考文獻(xiàn)】

相關(guān)期刊論文 前10條

1 盧達(dá)威;宋柔;;基于最大熵模型的漢語(yǔ)標(biāo)點(diǎn)句缺失話題自動(dòng)識(shí)別初探[J];計(jì)算機(jī)工程與科學(xué);2015年12期

2 袁勁松;張小明;李舟軍;;術(shù)語(yǔ)自動(dòng)抽取方法研究綜述[J];計(jì)算機(jī)科學(xué);2015年08期

3 李洪政;晉耀紅;;基于條件隨機(jī)場(chǎng)方法的漢語(yǔ)專利文本介詞短語(yǔ)識(shí)別[J];現(xiàn)代語(yǔ)文(語(yǔ)言研究版);2015年07期

4 劉伙玉;王東波;蘇新寧;;多特征下的科研論文段落自動(dòng)劃分與構(gòu)成要素識(shí)別研究[J];情報(bào)學(xué)報(bào);2015年04期

5 李麗雙;王意文;黃德根;;基于信息熵和詞頻分布變化的術(shù)語(yǔ)抽取研究[J];中文信息學(xué)報(bào);2015年01期

6 劉輝;劉耀;;基于條件隨機(jī)場(chǎng)的專利術(shù)語(yǔ)抽取[J];數(shù)字圖書館論壇;2014年12期

7 張雷瀚;呂學(xué)強(qiáng);李卓;徐麗萍;;領(lǐng)域本體術(shù)語(yǔ)的抽取方法研究[J];情報(bào)學(xué)報(bào);2014年02期

8 湯青;呂學(xué)強(qiáng);李卓;施水才;;領(lǐng)域本體術(shù)語(yǔ)抽取研究[J];現(xiàn)代圖書情報(bào)技術(shù);2014年01期

9 化柏林;;針對(duì)中文學(xué)術(shù)文獻(xiàn)的情報(bào)方法術(shù)語(yǔ)抽取[J];現(xiàn)代圖書情報(bào)技術(shù);2013年06期

10 樂娟;趙璽;;基于HMM的京劇機(jī)構(gòu)命名實(shí)體識(shí)別算法[J];計(jì)算機(jī)工程;2013年06期

相關(guān)重要報(bào)紙文章 前1條

1 賀延芳;;專利文獻(xiàn)研究助力我國(guó)創(chuàng)新活動(dòng)[N];中國(guó)知識(shí)產(chǎn)權(quán)報(bào);2012年

【共引文獻(xiàn)】

相關(guān)期刊論文 前10條

1 王密平;王昊;鄧三鴻;吳志祥;;基于CRFs的冶金領(lǐng)域中文專利術(shù)語(yǔ)抽取研究[J];現(xiàn)代圖書情報(bào)技術(shù);2016年06期

2 李伊瀟;李宏偉;沈立煒;趙文耘;;基于啟發(fā)式規(guī)則的自動(dòng)化本體擴(kuò)充[J];計(jì)算機(jī)科學(xué);2016年03期

3 曾鎮(zhèn);呂學(xué)強(qiáng);李卓;;一種面向?qū)@念I(lǐng)域術(shù)語(yǔ)抽取方法[J];計(jì)算機(jī)應(yīng)用與軟件;2016年03期

4 劉彤;倪維健;柳梅;;面向搜索引擎查詢?nèi)罩镜念I(lǐng)域術(shù)語(yǔ)自動(dòng)識(shí)別方法[J];現(xiàn)代圖書情報(bào)技術(shù);2016年02期

5 鄭秋生;劉守喜;;基于CRF的互聯(lián)網(wǎng)文本命名實(shí)體識(shí)別研究[J];中原工學(xué)院學(xué)報(bào);2016年01期

6 蔣婷;孫建軍;;基于SVR模型的中文領(lǐng)域術(shù)語(yǔ)自動(dòng)抽取研究——面向圖書情報(bào)領(lǐng)域[J];情報(bào)理論與實(shí)踐;2016年01期

7 化柏林;;學(xué)術(shù)論文中方法知識(shí)元的類型與描述規(guī)則研究[J];中國(guó)圖書館學(xué)報(bào);2016年01期

8 劉寶菊;陶宏才;;基于隱馬爾可夫的商標(biāo)詞識(shí)別[J];成都信息工程學(xué)院學(xué)報(bào);2015年06期

9 袁勁松;張小明;李舟軍;;術(shù)語(yǔ)自動(dòng)抽取方法研究綜述[J];計(jì)算機(jī)科學(xué);2015年08期

10 張莉;劉昱顯;;基于語(yǔ)序位置特征的漢英術(shù)語(yǔ)對(duì)自動(dòng)抽取研究[J];南京大學(xué)學(xué)報(bào)(自然科學(xué));2015年04期

【二級(jí)參考文獻(xiàn)】

相關(guān)期刊論文 前10條

1 胡韌奮;;面向漢英專利機(jī)器翻譯的介詞短語(yǔ)自動(dòng)識(shí)別策略[J];語(yǔ)言文字應(yīng)用;2015年01期

2 栗偉;趙大哲;李博;彭新茗;劉積仁;;CRF與規(guī)則相結(jié)合的醫(yī)學(xué)病歷實(shí)體識(shí)別[J];計(jì)算機(jī)應(yīng)用研究;2015年04期

3 盧達(dá)威;宋柔;尚英;;從廣義話題結(jié)構(gòu)考察漢語(yǔ)篇章話題認(rèn)知復(fù)雜度[J];中文信息學(xué)報(bào);2014年05期

4 朱曉;金力;;條件隨機(jī)場(chǎng)圖模型在《明史》詞性標(biāo)注研究中的應(yīng)用效果探索[J];復(fù)旦學(xué)報(bào)(自然科學(xué)版);2014年03期

5 季翠;盧達(dá)威;宋柔;;動(dòng)詞引出新支話題的語(yǔ)用功能研究[J];中文信息學(xué)報(bào);2014年03期

6 蔣玉茹;宋柔;;基于細(xì)粒度特征的話題句識(shí)別方法[J];計(jì)算機(jī)應(yīng)用;2014年05期

7 吳秦;胡麗娟;梁久禎;;基于分塊重要度和二維條件隨機(jī)場(chǎng)的Web信息抽取[J];南京大學(xué)學(xué)報(bào)(自然科學(xué));2014年01期

8 湯青;呂學(xué)強(qiáng);李卓;施水才;;領(lǐng)域本體術(shù)語(yǔ)抽取研究[J];現(xiàn)代圖書情報(bào)技術(shù);2014年01期

9 蔣玉茹;宋柔;;話題句識(shí)別中候選話題句評(píng)估函數(shù)的優(yōu)化[J];北京工業(yè)大學(xué)學(xué)報(bào);2014年01期

10 宋柔;;漢語(yǔ)篇章廣義話題結(jié)構(gòu)的流水模型[J];中國(guó)語(yǔ)文;2013年06期

【相似文獻(xiàn)】

相關(guān)期刊論文 前1條

1 喬楊;;專利計(jì)量方法在技術(shù)預(yù)見中的應(yīng)用——以國(guó)內(nèi)冶金領(lǐng)域?yàn)槔齕J];情報(bào)雜志;2013年04期

相關(guān)會(huì)議論文 前2條

1 葛道才;郭雄軍;;陰陽(yáng)膜和雙極膜在冶金領(lǐng)域的應(yīng)用探討[A];第四屆全國(guó)膜分離技術(shù)在冶金工業(yè)中應(yīng)用研討會(huì)論文集[C];2014年

2 徐銅文;;我國(guó)分離膜發(fā)展的戰(zhàn)略淺議及在冶金領(lǐng)域中應(yīng)用前景展望[A];第四屆全國(guó)膜分離技術(shù)在冶金工業(yè)中應(yīng)用研討會(huì)論文集[C];2014年

相關(guān)重要報(bào)紙文章 前6條

1 通訊員 尹欣欣;華油工建承建工程首獲冶金領(lǐng)域優(yōu)質(zhì)獎(jiǎng)[N];中國(guó)石油報(bào);2009年

2 駐湖北記者 李文聰 通訊員 鄺冬林 張珂斌;武漢科爾輥破機(jī)進(jìn)軍冶金領(lǐng)域[N];中國(guó)建材報(bào);2007年

3 記者 徐剛;耐磨產(chǎn)品多項(xiàng)“扎根”冶金領(lǐng)域[N];中國(guó)冶金報(bào);2004年

4 夏杰生;電磁冶金領(lǐng)域的全能專家[N];中國(guó)冶金報(bào);2009年

5 記者 周炳文;微波技術(shù)新增產(chǎn)值近10億[N];云南政協(xié)報(bào);2011年

6 田慶華;高校冶金學(xué)院院長(zhǎng)學(xué)術(shù)論壇舉行[N];中國(guó)有色金屬報(bào);2007年



本文編號(hào):2448132

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/guanlilunwen/keyanlw/2448132.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶4e9de***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com