天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 搜索引擎論文 >

用于雙語術(shù)語抽取的專業(yè)領(lǐng)域中英文可比語料庫構(gòu)建

發(fā)布時(shí)間:2018-02-17 04:54

  本文關(guān)鍵詞: 可比語料庫 語料庫構(gòu)建 雙語術(shù)語抽取 出處:《現(xiàn)代圖書情報(bào)技術(shù)》2012年02期  論文類型:期刊論文


【摘要】:面向雙語術(shù)語抽取這一應(yīng)用目標(biāo),提出專業(yè)領(lǐng)域可比語料庫的構(gòu)建方案并進(jìn)行實(shí)驗(yàn)論證。針對(duì)給定的主題領(lǐng)域分別進(jìn)行中英文專業(yè)語料的采集,從中分別獲取中英文關(guān)鍵詞,根據(jù)詞語共現(xiàn)統(tǒng)計(jì)獲取該主題領(lǐng)域的其他相關(guān)關(guān)鍵詞;以這些關(guān)鍵詞作為查詢?nèi)肟?通過學(xué)術(shù)搜索引擎從網(wǎng)絡(luò)獲取候選可比語料;對(duì)可比語料進(jìn)行定量評(píng)估,以剔除不符合要求的語料,最終得到特定主題領(lǐng)域的可比語料庫。
[Abstract]:For the purpose of bilingual terminology extraction, this paper puts forward the construction scheme of comparable corpus of professional domain and carries on the experimental demonstration, and carries on the collection of the Chinese and English professional corpus for the given subject field, and obtains the Chinese and English key words separately from the given subject field. According to cooccurrence statistics, other relevant keywords in the subject area are obtained; those keywords are used as query entry to obtain candidate comparable corpus from the network through academic search engine; the comparative corpus is evaluated quantitatively. Finally, a comparable corpus of a specific subject area can be obtained by eliminating the nonconforming data.
【作者單位】: 南昌大學(xué)圖書館;南京理工大學(xué)信息管理系;
【基金】:國家自然科學(xué)基金項(xiàng)目“基于可比語料的多語言文本聚類研究”(項(xiàng)目編號(hào):70903032) 南京理工大學(xué)自主科研專項(xiàng)計(jì)劃項(xiàng)目“多語言標(biāo)簽聚類研究”(項(xiàng)目編號(hào):2011ZDJH15)的研究成果之一
【分類號(hào)】:TP391.1

【參考文獻(xiàn)】

相關(guān)期刊論文 前2條

1 孫廣范;宋金平;袁琦;肖健;單玉秋;;中英可比語料庫中翻譯等價(jià)對(duì)抽取方法研究[J];計(jì)算機(jī)工程與應(yīng)用;2007年32期

2 祝清松;王惠臨;;中英文句法分析系統(tǒng)及驗(yàn)證平臺(tái)的設(shè)計(jì)與實(shí)現(xiàn)[J];現(xiàn)代圖書情報(bào)技術(shù);2010年02期

【共引文獻(xiàn)】

相關(guān)期刊論文 前2條

1 章成志;王惠臨;;多語言文本聚類研究綜述[J];現(xiàn)代圖書情報(bào)技術(shù);2009年06期

2 康小麗;章成志;王惠臨;;基于可比語料庫的雙語術(shù)語抽取研究述評(píng)[J];現(xiàn)代圖書情報(bào)技術(shù);2009年10期

相關(guān)碩士學(xué)位論文 前2條

1 房璐;英漢可比較語料庫的構(gòu)建與應(yīng)用研究[D];蘇州大學(xué);2011年

2 劉颯;專業(yè)領(lǐng)域可比語料的構(gòu)建與評(píng)價(jià)研究[D];南京理工大學(xué);2012年

【二級(jí)參考文獻(xiàn)】

相關(guān)期刊論文 前2條

1 陳道達(dá);曹冬林;李紹滋;;基于JGraph的變電站綜合自動(dòng)化圖形組態(tài)系統(tǒng)[J];計(jì)算機(jī)工程;2009年07期

2 劉海濤;趙懌怡;;基于樹庫的漢語依存句法分析[J];模式識(shí)別與人工智能;2009年01期

【相似文獻(xiàn)】

相關(guān)期刊論文 前10條

1 馮冠軍;禹龍;田生偉;;基于CRFs自動(dòng)構(gòu)建維吾爾語情感詞語料庫[J];現(xiàn)代圖書情報(bào)技術(shù);2011年03期

2 孫廣范;宋金平;袁琦;肖健;單玉秋;;中英可比語料庫中翻譯等價(jià)對(duì)抽取方法研究[J];計(jì)算機(jī)工程與應(yīng)用;2007年32期

3 韓先培;趙軍;;基于Wikipedia的語義元數(shù)據(jù)生成[J];中文信息學(xué)報(bào);2009年02期

4 章成志;王惠臨;;面向數(shù)字圖書館應(yīng)用的多語言領(lǐng)域本體學(xué)習(xí)研究[J];圖書情報(bào)工作;2011年02期

5 張秀梅;;論跨語言信息檢索[J];情報(bào)資料工作;2006年02期

6 ;[J];;年期

7 ;[J];;年期

8 ;[J];;年期

9 ;[J];;年期

10 ;[J];;年期

相關(guān)會(huì)議論文 前1條

1 韓先培;趙軍;;基于Wikipedia的語義元數(shù)據(jù)生成[A];第四屆全國信息檢索與內(nèi)容安全學(xué)術(shù)會(huì)議論文集(上)[C];2008年

相關(guān)碩士學(xué)位論文 前2條

1 林聲;可比語料中命名實(shí)體翻譯等價(jià)對(duì)抽取方法研究[D];大連理工大學(xué);2009年

2 高菲;漢語翻譯小說語言整齊化特征[D];西南交通大學(xué);2011年



本文編號(hào):1517263

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/1517263.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶45176***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com