基于SVR模型的中文領(lǐng)域術(shù)語自動抽取研究——面向圖書情報領(lǐng)域
本文關(guān)鍵詞:基于SVR模型的中文領(lǐng)域術(shù)語自動抽取研究——面向圖書情報領(lǐng)域
更多相關(guān)文章: 支持向量回歸機 本體構(gòu)建 本體學(xué)習(xí) 術(shù)語抽取
【摘要】:[目的/意義]術(shù)語是本體的重要組成部分,術(shù)語自動抽取是本體自動構(gòu)建的基礎(chǔ),文章采用回歸的方法對未登錄詞進行概率(某個數(shù)值(組合)對應(yīng)的候選詞集合中術(shù)語的概率)預(yù)測,獲得該詞可能為術(shù)語的概率。[方法/過程]文章結(jié)合語言學(xué)和統(tǒng)計方法,通過構(gòu)建術(shù)語庫提取術(shù)語抽取模板來抽取候選術(shù)語,此外,通過引入回歸的方法,將術(shù)語抽取問題轉(zhuǎn)化為對詞語成為術(shù)語的概率的預(yù)測問題。[結(jié)果/結(jié)論]提出的方法最后通過實驗驗證了其有效性。
【作者單位】: 南京大學(xué)信息管理學(xué)院;
【關(guān)鍵詞】: 支持向量回歸機 本體構(gòu)建 本體學(xué)習(xí) 術(shù)語抽取
【基金】:國家社會科學(xué)基金重大招標(biāo)項目“面向?qū)W科領(lǐng)域的網(wǎng)絡(luò)信息資源深度聚合與服務(wù)研究”的成果,項目編號:12&ZD221
【分類號】:TP391.1
【正文快照】: 術(shù)語是本體構(gòu)建的基本元素,術(shù)語抽取是本體學(xué)習(xí)中最基本也是至關(guān)重要的一步,在自然語言處理領(lǐng)域(機器翻譯、信息檢索等)也有著很高的價值。術(shù)語抽取是從領(lǐng)域文本中自動識別出與領(lǐng)域相關(guān)的有特殊意義的專業(yè)詞匯,術(shù)語主要存在以下兩個特點:1領(lǐng)域性,術(shù)語與某一特定領(lǐng)域相關(guān),表達
【相似文獻】
中國期刊全文數(shù)據(jù)庫 前10條
1 程斌;張水茂;;基于統(tǒng)計與規(guī)則的術(shù)語抽取[J];科技廣場;2009年09期
2 杜波,田懷鳳,王立,陸汝占;基于多策略的專業(yè)領(lǐng)域術(shù)語抽取器的設(shè)計[J];計算機工程;2005年14期
3 胡文敏;何婷婷;張勇;;基于卡方檢驗的漢語術(shù)語抽取[J];計算機應(yīng)用;2007年12期
4 周浪;馮沖;黃河燕;;一種面向術(shù)語抽取的短語過濾技術(shù)[J];計算機工程與應(yīng)用;2009年19期
5 康小麗;章成志;王惠臨;;基于可比語料庫的雙語術(shù)語抽取研究述評[J];現(xiàn)代圖書情報技術(shù);2009年10期
6 許德山;張智雄;王峰;邢美鳳;;上下文分析與統(tǒng)計特征相結(jié)合的英文術(shù)語抽取研究[J];現(xiàn)代圖書情報技術(shù);2010年12期
7 劉里;劉小明;;基于分隔符和上下文術(shù)語的領(lǐng)域現(xiàn)象術(shù)語抽取[J];華南理工大學(xué)學(xué)報(自然科學(xué)版);2011年07期
8 唐濤;周俏麗;張桂平;;統(tǒng)計與規(guī)則相結(jié)合的術(shù)語抽取[J];沈陽航空航天大學(xué)學(xué)報;2011年05期
9 鐘玉峰;;基于平行語料庫的文獻術(shù)語抽取研究[J];黑龍江工程學(xué)院學(xué)報(自然科學(xué)版);2011年04期
10 湯青;呂學(xué)強;李卓;施水才;;領(lǐng)域本體術(shù)語抽取研究[J];現(xiàn)代圖書情報技術(shù);2014年01期
中國重要會議論文全文數(shù)據(jù)庫 前2條
1 章成志;王惠臨;;基于專業(yè)領(lǐng)域平行語料的雙語核心術(shù)語抽取研究[A];中國計算機語言學(xué)研究前沿進展(2007-2009)[C];2009年
2 寧海燕;劉秉權(quán);張德園;劉遠超;王曉龍;;基于統(tǒng)計的中文領(lǐng)域術(shù)語自動抽取方法的比較研究[A];第五屆全國信息檢索學(xué)術(shù)會議論文集[C];2009年
中國博士學(xué)位論文全文數(shù)據(jù)庫 前2條
1 周浪;中文術(shù)語抽取若干問題研究[D];南京理工大學(xué);2010年
2 肖奕;地質(zhì)數(shù)據(jù)信息服務(wù)參考模型及關(guān)鍵技術(shù)研究[D];中國地質(zhì)大學(xué)(北京);2013年
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前8條
1 李丹;特定領(lǐng)域中文術(shù)語抽取[D];大連理工大學(xué);2011年
2 田俊瑋;軍事領(lǐng)域中文術(shù)語抽取的研究[D];大連理工大學(xué);2013年
3 趙欣;基于最大熵的中文術(shù)語抽取系統(tǒng)的設(shè)計與實現(xiàn)[D];西安電子科技大學(xué);2012年
4 段國成;基于CCD的術(shù)語抽取研究[D];鄭州大學(xué);2007年
5 唐濤;面向特定領(lǐng)域的中文分詞技術(shù)的研究[D];沈陽航空航天大學(xué);2012年
6 譚龍;領(lǐng)域文本術(shù)語抽取與語義概念圖構(gòu)建模型研究[D];華東交通大學(xué);2014年
7 姚賢明;領(lǐng)域概念自動抽取研究[D];昆明理工大學(xué);2010年
8 劉颯;專業(yè)領(lǐng)域可比語料的構(gòu)建與評價研究[D];南京理工大學(xué);2012年
,本文編號:593380
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/593380.html