天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當前位置:主頁 > 教育論文 > 課堂教學論文 >

基于文本的本體學習方法研究

發(fā)布時間:2019-07-10 19:14
【摘要】:本文介紹了當前基于文本的本體學習主要方法,在種子概念的基礎上,設計了一種基于文本的本體學習方法,同時分析了術語獲取、概念分類、關系獲取等基于文本的本體學習關鍵技術。實驗表明,借助種子概念能夠從純文本中抽取概念,對概念進行分類,為本體開發(fā)提供基礎。
文內(nèi)圖片:知網(wǎng)中的概念
圖片說明:
a b c d e候選集中的概念773 382 833 921 836詞典中已有的概念15 0 5 1 3獲取的新概念78 62 58 60 37  Moldovan的方法實質上是一種有指導的學習,通過種子概念大大提高了概念獲取的效率和領域相關性,而且種子概念能夠作為概念分類的依據(jù)。例如對于(word,seed)類型的術語,可直接將其作為種子概念seed的下位詞。如mortgage_ interest_ rate和interest_ rate,可以得出如下的關系: is2a (mortgage interest rate, interestrate);表示mortgage_ interest_ rate是interest rate的一種。2·2 種子概念在本體學習中的作用從Moldovan的方法可以看出,通過種子概念可以獲取大量領域概念,并對概念進行分類,而概念和概念分類正是本體的核心,因此,可以將種子概念引入基于文本的本體學習方法,并有如下優(yōu)點:1)可以事先選取種子概念,并圍繞種子概念構建語料庫,降低語料選取偏差對本體學習結果的影響。
文內(nèi)圖片:基于文本的本體學習方法基本原理
圖片說明:
本方法的目標是以文本語料作為輸入,通過概念獲取、概念分類以及關系獲取,最終得到概念和概念的分類,以及概念之間的關系。本方法的基本原理見圖2。圖2基于文本的本體學習方法基本原理從圖2可以看出,本文設計的基于文本的本體學習方法的基本步驟包括:文本預處理;輸入種子概念;術語抽取;概念分類;關系抽取。3·2 文本預處理對語料庫中的文本進行切詞和詞性標注等淺加工,可以利用一些現(xiàn)有的工具,如中國科學院的詞法分析器IC2TCLAS等。3·3 輸入種子概念用戶可以根據(jù)領域知識和語料信息選取領域內(nèi)比較重要的詞作為種子概念。選定種子概念后,抽取出種子概念出現(xiàn)時的上下文。種子概念在語料庫中出現(xiàn)多少次,就對應有多少條語料片斷被抽出。例如用戶輸入的種子詞為“電視機”,語料庫中有句子:“反映了當前背投彩色電視機技術的最新發(fā)展水平”,則從中抽取出“電視機”的前后相鄰的詞
【作者單位】: 中國科學技術信息研究所 中國科學技術信息研究所
【分類號】:G420

【參考文獻】

相關期刊論文 前2條

1 劉柏嵩,高濟;面向知識網(wǎng)格的本體學習研究[J];計算機工程與應用;2005年20期

2 方衛(wèi)東,袁華,劉衛(wèi)紅;基于Web挖掘的領域本體自動學習[J];清華大學學報(自然科學版);2005年S1期

【共引文獻】

相關期刊論文 前10條

1 楊家寬;科技術語的規(guī)范和統(tǒng)一芻議[J];編輯學報;2001年01期

2 祝迎新;對應規(guī)范在法律術語翻譯中的應用[J];北京理工大學學報(社會科學版);2004年S1期

3 張艷宏;劉保延;郭玉峰;何麗云;胡鏡清;彭錦;;框架理論及其在中醫(yī)學研究領域的應用探討[J];中華中醫(yī)藥雜志;2008年08期

4 張晨;祁坤鈺;;基于Penn Treebank英語標注集對《圣經(jīng)》標注集的擴充研究[J];才智;2009年20期

5 夏曉云;;從兩岸三地的翻譯方式看英語術語漢譯的本土化和規(guī)范化[J];長沙大學學報;2009年06期

6 張春泉;;王國維的術語學思想[J];長沙理工大學學報(社會科學版);2010年02期

7 張春泉;;《公孫龍子》的術語學思想——兼析《荀子》與《公孫龍子》術語學思想的“共相”[J];長沙理工大學學報(社會科學版);2011年04期

8 黃忠廉;;我國外語界術語學研究綜述[J];辭書研究;2010年02期

9 靳偉;張月清;王芳;;基于本體的分類檢索系統(tǒng)的設計與實現(xiàn)[J];河北農(nóng)業(yè)大學學報;2010年02期

10 馮文杰;徐海靜;黃建軍;;從外文對應詞看《DA/T1-2000檔案工作基本術語》的修改[J];檔案學通訊;2011年02期

相關會議論文 前10條

1 于偉昌;;漢譯外來語言學術語標準化的必要性及其原則[A];中國辭書學會雙語詞典專業(yè)委員會第四屆年會暨學術研討會論文集[C];2001年

2 陳晶;;漢俄科技術語詞典中若干問題分析[A];中國辭書學會雙語詞典專業(yè)委員會第七屆年會論文集[C];2007年

3 張金忠;;對建構漢俄科技術語詞典編纂理論的思考[A];中國辭書學會雙語詞典專業(yè)委員會第七屆年會論文集[C];2007年

4 趙巍;;翻譯學術語規(guī)范化的實踐及效果反思[A];譯學辭典與翻譯研究——第四屆全國翻譯學辭典與翻譯理論研討會論文集[C];2007年

5 陳慧清;林世平;;基于知網(wǎng)和模式自舉的概念間分類關系獲取方法[A];2009通信理論與技術新發(fā)展——第十四屆全國青年通信學術會議論文集[C];2009年

6 王開揚;;中國語文現(xiàn)代化理論再認識[A];語文現(xiàn)代化論叢(第七輯)[C];2006年

7 唐勇;黃利強;;規(guī)范紙包裝結構術語的探討[A];第十三屆全國包裝工程學術會議論文集[C];2010年

8 鄒紅建;楊爾弘;;面向對外漢語報刊教學的文本難易度分類[A];第三屆學生計算語言學研討會論文集[C];2006年

9 金東日;;在朝漢機器翻譯上出現(xiàn)轉換的難點[A];民族語言文字信息技術研究——第十一屆全國民族語言文字信息學術研討會論文集[C];2007年

10 王強軍;張普;;面向術語定義識別的語料庫建設研究[A];內(nèi)容計算的研究與應用前沿——第九屆全國計算語言學學術會議論文集[C];2007年

相關博士學位論文 前10條

1 劉衛(wèi)紅;垃圾郵件檢測與過濾關鍵技術研究[D];華南理工大學;2010年

2 杜萍;基于本體的中國行政區(qū)劃地名識別與抽取研究[D];蘭州大學;2011年

3 孫興義;清代《詩經(jīng)》闡釋的詩學問題研究[D];云南大學;2011年

4 邸書靈;Agent聯(lián)盟和流形學習在中文問答系統(tǒng)中的應用研究[D];天津大學;2010年

5 葉其松;術語學核心術語研究[D];黑龍江大學;2010年

6 郭建文;基于知識網(wǎng)格的e-維護知識資源管理技術研究[D];湖南大學;2010年

7 裘禾敏;《孫子兵法》英譯研究[D];浙江大學;2011年

8 李蕓;信息科學和信息技術術語概念體系研究[D];北京語言文化大學;2003年

9 王強軍;基于動態(tài)流通語料庫(DCC)的信息技術領域新術語自動提取研究[D];北京語言文化大學;2003年

10 趙靜;司法判詞的表達與實踐——以古代判詞為中心[D];復旦大學;2004年

相關碩士學位論文 前10條

1 吳丹;語言學術語漢譯規(guī)范化研究[D];南昌航空大學;2010年

2 蔡宇虹;基于主題的元搜索引擎關鍵技術研究[D];哈爾濱工程大學;2010年

3 呂韶華;面向中文評論文本的情感傾向性研究[D];大連理工大學;2010年

4 孫靜;基于組合分類器的生物命名實體識別[D];大連理工大學;2010年

5 邢鑫巖;基于序列模型的情感分析研究[D];大連理工大學;2010年

6 徐濟成;面向農(nóng)業(yè)領域的本體學習建模研究[D];安徽農(nóng)業(yè)大學;2010年

7 林娜;高中生物學教學中學生專業(yè)術語表達能力培養(yǎng)的研究[D];華東師范大學;2010年

8 蘇俊峰;基于HMM的藏語語料庫詞性自動標注研究[D];西北民族大學;2010年

9 梁e,

本文編號:2512825


資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/jiaoyulunwen/ktjx/2512825.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權申明:資料由用戶22396***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com