挖掘?qū)@R(shí)實(shí)現(xiàn)關(guān)鍵詞自動(dòng)抽取
發(fā)布時(shí)間:2017-08-29 18:10
本文關(guān)鍵詞:挖掘?qū)@R(shí)實(shí)現(xiàn)關(guān)鍵詞自動(dòng)抽取
更多相關(guān)文章: 背景知識(shí) 關(guān)鍵詞抽取 專(zhuān)利數(shù)據(jù) 支持向量機(jī) 信息檢索
【摘要】:關(guān)鍵詞是人們快速判斷是否要詳細(xì)閱讀文件內(nèi)容的重要線(xiàn)索,關(guān)鍵詞自動(dòng)抽取在信息檢索、自然語(yǔ)言處理等研究領(lǐng)域均有重要應(yīng)用.設(shè)計(jì)了一種新的關(guān)鍵詞自動(dòng)抽取方法,使計(jì)算機(jī)能夠像人類(lèi)專(zhuān)家一樣,利用知識(shí)庫(kù)對(duì)目標(biāo)文本進(jìn)行學(xué)習(xí)和理解,最終自動(dòng)抽取出關(guān)鍵詞.專(zhuān)利數(shù)據(jù)因其數(shù)據(jù)量龐大、內(nèi)容豐富、表達(dá)準(zhǔn)確、專(zhuān)業(yè)權(quán)威而被選中作為知識(shí)庫(kù)來(lái)源.詳細(xì)討論了專(zhuān)利數(shù)據(jù)的特性,挖掘不同專(zhuān)利間的知識(shí)關(guān)聯(lián),針對(duì)某一知識(shí)領(lǐng)域構(gòu)造背景知識(shí)庫(kù),在此基礎(chǔ)上進(jìn)行目標(biāo)文本的關(guān)鍵詞自動(dòng)抽取.與目標(biāo)文本相關(guān)的專(zhuān)利文集中每個(gè)專(zhuān)利的專(zhuān)利發(fā)明人、權(quán)利人、專(zhuān)利引用和分類(lèi)信息都被用于在不同的專(zhuān)利文檔之間發(fā)現(xiàn)關(guān)聯(lián)性,利用關(guān)聯(lián)信息擴(kuò)充背景知識(shí)庫(kù),獲得目標(biāo)文檔在各個(gè)相關(guān)知識(shí)領(lǐng)域的背景知識(shí)庫(kù).基于背景知識(shí)庫(kù)設(shè)計(jì)了詞知識(shí)特征值,以反映詞在目標(biāo)文本背景知識(shí)中的重要程度.最后,把關(guān)鍵詞抽取問(wèn)題轉(zhuǎn)化為分類(lèi)問(wèn)題,利用支持向量機(jī)(support vector machine,SVM)抽取出目標(biāo)文本的關(guān)鍵詞.在專(zhuān)利數(shù)據(jù)集和開(kāi)放數(shù)據(jù)集的實(shí)驗(yàn)結(jié)果證明明顯優(yōu)于現(xiàn)有算法.
【作者單位】: 中山大學(xué)計(jì)算機(jī)科學(xué)系;廣東第二師范學(xué)院計(jì)算機(jī)科學(xué)系;暨南大學(xué)信息科學(xué)技術(shù)學(xué)院;珠海魅族科技有限公司;
【關(guān)鍵詞】: 背景知識(shí) 關(guān)鍵詞抽取 專(zhuān)利數(shù)據(jù) 支持向量機(jī) 信息檢索
【基金】:國(guó)家自然科學(xué)基金項(xiàng)目(61472453,U1401256,U1501252) 廣東省科技計(jì)劃基金項(xiàng)目(2012A010701013)~~
【分類(lèi)號(hào)】:TP391.1
【正文快照】:
【相似文獻(xiàn)】
中國(guó)碩士學(xué)位論文全文數(shù)據(jù)庫(kù) 前3條
1 李林;基于同義詞網(wǎng)絡(luò)的文本推薦方法研究[D];電子科技大學(xué);2014年
2 姜志遙;功能理論視閾下的《鋼穴》中譯本對(duì)比研究[D];安徽大學(xué);2014年
3 趙冠群;土木工程技術(shù)說(shuō)明的英譯報(bào)告[D];太原理工大學(xué);2014年
,本文編號(hào):754693
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/754693.html
最近更新
教材專(zhuān)著