面向?qū)@墓δ苄畔⒊槿》椒ǖ难芯?/H1>
發(fā)布時(shí)間:2017-10-05 12:44
本文關(guān)鍵詞:面向?qū)@墓δ苄畔⒊槿》椒ǖ难芯?/strong>
更多相關(guān)文章: 功能信息抽取 專利摘要 詞法分析 句法分析 最大熵 本體知識(shí)庫
【摘要】:專利文檔中包含產(chǎn)品的組成結(jié)構(gòu)、設(shè)計(jì)原理、組件功能等相關(guān)內(nèi)容,蘊(yùn)含了豐富的創(chuàng)新性技術(shù)信息,是領(lǐng)域內(nèi)創(chuàng)新性和實(shí)用性的解決方案,被看作是產(chǎn)品創(chuàng)新設(shè)計(jì)的重要知識(shí)來源。功能的創(chuàng)新是產(chǎn)品創(chuàng)新的基礎(chǔ),從專利中獲取其功能信息成為研究的熱點(diǎn)。然而由于自然語言對知識(shí)表述的隨意性,給這項(xiàng)研究帶來一定的難度和挑戰(zhàn)性。 本文經(jīng)過大量的專利文獻(xiàn)的閱讀,分析了專利文檔的組成結(jié)構(gòu)和知識(shí)分布,,確定了專利摘要文本為功能信息抽取對象,通過分析當(dāng)前功能本體對于知識(shí)的表達(dá)方式,本文采用動(dòng)賓短語來表達(dá)專利中的功能信息。 在自然語言處理方法的基礎(chǔ)上,提出了一種基于詞法分析、語法分析、最大熵分類模型的專利功能信息抽取方法。詞法分析采用中科院的開源ICTCLAS組件得到中文語句的分詞結(jié)果,在此基礎(chǔ)上的句法分析采用Stanford大學(xué)的Stanford Parser組件得到語句的句法樹,然后運(yùn)用最大熵分類模型進(jìn)行基于句法樹特征向量的語義角色標(biāo)注,并結(jié)合本文提出的文本預(yù)處理和句法樹的特征屬性值自動(dòng)提取算法,設(shè)計(jì)了一個(gè)專利功能信息抽取系統(tǒng)模型,基本實(shí)現(xiàn)了中文專利摘要的功能信息抽取。同時(shí)本文構(gòu)建了專利功能本體模型,提出了專利功能信息與功能本體的映射方法,為功能本體知識(shí)庫的構(gòu)建與自動(dòng)填充提供了基礎(chǔ)。通過對洗衣機(jī)發(fā)明專利文獻(xiàn)的分析及功能信息抽取實(shí)驗(yàn)表明,該方法具有一定的正確性和有效性。
【關(guān)鍵詞】:功能信息抽取 專利摘要 詞法分析 句法分析 最大熵 本體知識(shí)庫
【學(xué)位授予單位】:河北工業(yè)大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2013
【分類號(hào)】:G306;TP391.1
【目錄】: - 摘要4-5
- ABSTRACT5-8
- 第一章 緒論8-11
- §1-1 課題研究背景和意義8
- §1-2 課題研究現(xiàn)狀8-9
- §1-3 課題的研究目標(biāo)和主要工作9-10
- §1-4 論文的組織結(jié)構(gòu)10-11
- 第二章 信息抽取原理及應(yīng)用11-17
- §2-1 信息抽取理論概述11-13
- 2-1-1 信息抽取的概念11
- 2-1-2 信息抽取的研究對象11-12
- 2-1-3 信息抽取的流程12-13
- §2-2 信息抽取方法分類13-15
- 2-2-1 基于自然語言處理的信息抽取13
- 2-2-2 基于本體的信息抽取13-14
- 2-2-3 基于規(guī)則的信息抽取14
- 2-2-4 基于統(tǒng)計(jì)模型的信息抽取14-15
- 2-2-5 基于 XML 結(jié)構(gòu)的信息抽取15
- §2-3 信息抽取技術(shù)的應(yīng)用15-16
- §2-4 本章小結(jié)16-17
- 第三章 專利功能信息表達(dá)17-24
- §3-1 專利文檔結(jié)構(gòu)和知識(shí)分布17-18
- 3-1-1 專利文檔結(jié)構(gòu)分析17
- 3-1-2 專利文檔知識(shí)分布17-18
- §3-2 功能本體概述18-22
- 3-2-1 功能的定義18-19
- 3-2-2 功能本體的概念19
- 3-2-3 功能的表達(dá)方式19-20
- 3-2-4 專利知識(shí)本體庫模型20-22
- §3-3 功能信息抽取和功能本體的關(guān)系22-23
- 3-3-1 專利功能信息分類22
- 3-3-2 專利功能信息在功能本體中的映射22-23
- §3-4 本章小結(jié)23-24
- 第四章 專利功能信息抽取模型的建立24-38
- §4-1 功能信息抽取流程設(shè)計(jì)24-25
- §4-2 專利摘要預(yù)處理25-26
- §4-3 詞法分析處理26-29
- 4-3-1 詞法分析概述26-27
- 4-3-2 ICTCLAS 流程分析27-28
- 4-3-3 ICTCLAS 組件的應(yīng)用方法28-29
- §4-4 句法分析處理29-34
- 4-4-1 句法分析概述29
- 4-4-2 Stanford Parser 組件的應(yīng)用29-33
- 4-4-3 句法樹的剪枝算法和遍歷算法33-34
- §4-5 最大熵模型分類34-37
- 4-5-1 最大熵模型的形式化描述34-35
- 4-5-2 最大熵模型的特征選擇35-36
- 4-5-3 最大熵模型的標(biāo)注步驟36-37
- §4-6 本章小結(jié)37-38
- 第五章 系統(tǒng)實(shí)現(xiàn)和實(shí)例驗(yàn)證38-46
- §5-1 系統(tǒng)實(shí)現(xiàn)38-41
- 5-1-1 系統(tǒng)概要設(shè)計(jì)38-39
- 5-1-2 系統(tǒng)開發(fā)環(huán)境39
- 5-1-3 系統(tǒng)界面展示39-41
- §5-2 實(shí)例驗(yàn)證41-44
- 5-2-1 數(shù)據(jù)準(zhǔn)備41-42
- 5-2-2 專利功能信息抽取實(shí)例驗(yàn)證42-44
- §5-3 結(jié)果分析44-45
- §5-4 本章小結(jié)45-46
- 第六章 總結(jié)和展望46-47
- §6-1 論文總結(jié)46
- §6-2 論文展望46-47
- 參考文獻(xiàn)47-49
- 致謝49
【參考文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前10條
1 周俊生;戴新宇;尹存燕;陳家駿;;基于層疊條件隨機(jī)場模型的中文機(jī)構(gòu)名自動(dòng)識(shí)別[J];電子學(xué)報(bào);2006年05期
2 占向輝,李彥,賈愛軍,孫玉帥;面向創(chuàng)新設(shè)計(jì)的科學(xué)效應(yīng)庫研究[J];工程設(shè)計(jì)學(xué)報(bào);2005年01期
3 劉群,張華平,俞鴻魁,程學(xué)旗;基于層疊隱馬模型的漢語詞法分析[J];計(jì)算機(jī)研究與發(fā)展;2004年08期
4 劉克彬;李芳;劉磊;韓穎;;基于核函數(shù)中文關(guān)系自動(dòng)抽取系統(tǒng)的實(shí)現(xiàn)[J];計(jì)算機(jī)研究與發(fā)展;2007年08期
5 張德政;莊洪波;;基于領(lǐng)域本體網(wǎng)絡(luò)模型的知識(shí)獲取技術(shù)[J];計(jì)算機(jī)工程;2007年07期
6 徐靖;李軍輝;朱巧明;李培峰;;中文名詞性謂詞語義角色標(biāo)注的特征研究[J];計(jì)算機(jī)應(yīng)用;2011年06期
7 陳佳;胡燕;軒艷艷;;一種基于XML的Web信息抽取方法[J];計(jì)算機(jī)與數(shù)字工程;2007年06期
8 劉遷;焦慧;賈惠波;;信息抽取技術(shù)的發(fā)展現(xiàn)狀及構(gòu)建方法的研究[J];計(jì)算機(jī)應(yīng)用研究;2007年07期
9 王朝霞;邱清盈;馮培恩;謝雙喜;;機(jī)械產(chǎn)品專利技術(shù)方案信息抽取方法[J];機(jī)械工程學(xué)報(bào);2009年10期
10 劉克強(qiáng);;2009共享版ICTCLAS的分析與使用[J];科教文匯(上旬刊);2009年08期
中國博士學(xué)位論文全文數(shù)據(jù)庫 前1條
1 車萬翔;基于核方法的語義角色標(biāo)注研究[D];哈爾濱工業(yè)大學(xué);2008年
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前7條
1 徐榮華;基于功能本體的產(chǎn)品結(jié)構(gòu)功能映射分析與再創(chuàng)新設(shè)計(jì)研究[D];南京航空航天大學(xué);2010年
2 楊浩博;基于功能本體的創(chuàng)新知識(shí)表達(dá)及檢索方法研究與實(shí)現(xiàn)[D];河北工業(yè)大學(xué);2011年
3 孟令謙;基于ontology的中文信息抽取系統(tǒng)的研究與實(shí)現(xiàn)[D];電子科技大學(xué);2004年
4 李颯;基于GATE的中文信息抽取系統(tǒng)的開發(fā)和實(shí)現(xiàn)[D];中國科學(xué)院研究生院(文獻(xiàn)情報(bào)中心);2006年
5 馬騰;基于ontology的信息抽取系統(tǒng)的研究與實(shí)現(xiàn)[D];電子科技大學(xué);2006年
6 張曉歡;基于本體的產(chǎn)品信息抽取系統(tǒng)的研究[D];天津理工大學(xué);2009年
7 毋菲;數(shù)值信息的抽取方法研究[D];山西大學(xué);2010年
本文編號(hào):976891
本文鏈接:http://sikaile.net/guanlilunwen/keyanlw/976891.html
本文關(guān)鍵詞:面向?qū)@墓δ苄畔⒊槿》椒ǖ难芯?/strong>
更多相關(guān)文章: 功能信息抽取 專利摘要 詞法分析 句法分析 最大熵 本體知識(shí)庫
【摘要】:專利文檔中包含產(chǎn)品的組成結(jié)構(gòu)、設(shè)計(jì)原理、組件功能等相關(guān)內(nèi)容,蘊(yùn)含了豐富的創(chuàng)新性技術(shù)信息,是領(lǐng)域內(nèi)創(chuàng)新性和實(shí)用性的解決方案,被看作是產(chǎn)品創(chuàng)新設(shè)計(jì)的重要知識(shí)來源。功能的創(chuàng)新是產(chǎn)品創(chuàng)新的基礎(chǔ),從專利中獲取其功能信息成為研究的熱點(diǎn)。然而由于自然語言對知識(shí)表述的隨意性,給這項(xiàng)研究帶來一定的難度和挑戰(zhàn)性。 本文經(jīng)過大量的專利文獻(xiàn)的閱讀,分析了專利文檔的組成結(jié)構(gòu)和知識(shí)分布,,確定了專利摘要文本為功能信息抽取對象,通過分析當(dāng)前功能本體對于知識(shí)的表達(dá)方式,本文采用動(dòng)賓短語來表達(dá)專利中的功能信息。 在自然語言處理方法的基礎(chǔ)上,提出了一種基于詞法分析、語法分析、最大熵分類模型的專利功能信息抽取方法。詞法分析采用中科院的開源ICTCLAS組件得到中文語句的分詞結(jié)果,在此基礎(chǔ)上的句法分析采用Stanford大學(xué)的Stanford Parser組件得到語句的句法樹,然后運(yùn)用最大熵分類模型進(jìn)行基于句法樹特征向量的語義角色標(biāo)注,并結(jié)合本文提出的文本預(yù)處理和句法樹的特征屬性值自動(dòng)提取算法,設(shè)計(jì)了一個(gè)專利功能信息抽取系統(tǒng)模型,基本實(shí)現(xiàn)了中文專利摘要的功能信息抽取。同時(shí)本文構(gòu)建了專利功能本體模型,提出了專利功能信息與功能本體的映射方法,為功能本體知識(shí)庫的構(gòu)建與自動(dòng)填充提供了基礎(chǔ)。通過對洗衣機(jī)發(fā)明專利文獻(xiàn)的分析及功能信息抽取實(shí)驗(yàn)表明,該方法具有一定的正確性和有效性。
【關(guān)鍵詞】:功能信息抽取 專利摘要 詞法分析 句法分析 最大熵 本體知識(shí)庫
【學(xué)位授予單位】:河北工業(yè)大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2013
【分類號(hào)】:G306;TP391.1
【目錄】:
- 摘要4-5
- ABSTRACT5-8
- 第一章 緒論8-11
- §1-1 課題研究背景和意義8
- §1-2 課題研究現(xiàn)狀8-9
- §1-3 課題的研究目標(biāo)和主要工作9-10
- §1-4 論文的組織結(jié)構(gòu)10-11
- 第二章 信息抽取原理及應(yīng)用11-17
- §2-1 信息抽取理論概述11-13
- 2-1-1 信息抽取的概念11
- 2-1-2 信息抽取的研究對象11-12
- 2-1-3 信息抽取的流程12-13
- §2-2 信息抽取方法分類13-15
- 2-2-1 基于自然語言處理的信息抽取13
- 2-2-2 基于本體的信息抽取13-14
- 2-2-3 基于規(guī)則的信息抽取14
- 2-2-4 基于統(tǒng)計(jì)模型的信息抽取14-15
- 2-2-5 基于 XML 結(jié)構(gòu)的信息抽取15
- §2-3 信息抽取技術(shù)的應(yīng)用15-16
- §2-4 本章小結(jié)16-17
- 第三章 專利功能信息表達(dá)17-24
- §3-1 專利文檔結(jié)構(gòu)和知識(shí)分布17-18
- 3-1-1 專利文檔結(jié)構(gòu)分析17
- 3-1-2 專利文檔知識(shí)分布17-18
- §3-2 功能本體概述18-22
- 3-2-1 功能的定義18-19
- 3-2-2 功能本體的概念19
- 3-2-3 功能的表達(dá)方式19-20
- 3-2-4 專利知識(shí)本體庫模型20-22
- §3-3 功能信息抽取和功能本體的關(guān)系22-23
- 3-3-1 專利功能信息分類22
- 3-3-2 專利功能信息在功能本體中的映射22-23
- §3-4 本章小結(jié)23-24
- 第四章 專利功能信息抽取模型的建立24-38
- §4-1 功能信息抽取流程設(shè)計(jì)24-25
- §4-2 專利摘要預(yù)處理25-26
- §4-3 詞法分析處理26-29
- 4-3-1 詞法分析概述26-27
- 4-3-2 ICTCLAS 流程分析27-28
- 4-3-3 ICTCLAS 組件的應(yīng)用方法28-29
- §4-4 句法分析處理29-34
- 4-4-1 句法分析概述29
- 4-4-2 Stanford Parser 組件的應(yīng)用29-33
- 4-4-3 句法樹的剪枝算法和遍歷算法33-34
- §4-5 最大熵模型分類34-37
- 4-5-1 最大熵模型的形式化描述34-35
- 4-5-2 最大熵模型的特征選擇35-36
- 4-5-3 最大熵模型的標(biāo)注步驟36-37
- §4-6 本章小結(jié)37-38
- 第五章 系統(tǒng)實(shí)現(xiàn)和實(shí)例驗(yàn)證38-46
- §5-1 系統(tǒng)實(shí)現(xiàn)38-41
- 5-1-1 系統(tǒng)概要設(shè)計(jì)38-39
- 5-1-2 系統(tǒng)開發(fā)環(huán)境39
- 5-1-3 系統(tǒng)界面展示39-41
- §5-2 實(shí)例驗(yàn)證41-44
- 5-2-1 數(shù)據(jù)準(zhǔn)備41-42
- 5-2-2 專利功能信息抽取實(shí)例驗(yàn)證42-44
- §5-3 結(jié)果分析44-45
- §5-4 本章小結(jié)45-46
- 第六章 總結(jié)和展望46-47
- §6-1 論文總結(jié)46
- §6-2 論文展望46-47
- 參考文獻(xiàn)47-49
- 致謝49
【參考文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前10條
1 周俊生;戴新宇;尹存燕;陳家駿;;基于層疊條件隨機(jī)場模型的中文機(jī)構(gòu)名自動(dòng)識(shí)別[J];電子學(xué)報(bào);2006年05期
2 占向輝,李彥,賈愛軍,孫玉帥;面向創(chuàng)新設(shè)計(jì)的科學(xué)效應(yīng)庫研究[J];工程設(shè)計(jì)學(xué)報(bào);2005年01期
3 劉群,張華平,俞鴻魁,程學(xué)旗;基于層疊隱馬模型的漢語詞法分析[J];計(jì)算機(jī)研究與發(fā)展;2004年08期
4 劉克彬;李芳;劉磊;韓穎;;基于核函數(shù)中文關(guān)系自動(dòng)抽取系統(tǒng)的實(shí)現(xiàn)[J];計(jì)算機(jī)研究與發(fā)展;2007年08期
5 張德政;莊洪波;;基于領(lǐng)域本體網(wǎng)絡(luò)模型的知識(shí)獲取技術(shù)[J];計(jì)算機(jī)工程;2007年07期
6 徐靖;李軍輝;朱巧明;李培峰;;中文名詞性謂詞語義角色標(biāo)注的特征研究[J];計(jì)算機(jī)應(yīng)用;2011年06期
7 陳佳;胡燕;軒艷艷;;一種基于XML的Web信息抽取方法[J];計(jì)算機(jī)與數(shù)字工程;2007年06期
8 劉遷;焦慧;賈惠波;;信息抽取技術(shù)的發(fā)展現(xiàn)狀及構(gòu)建方法的研究[J];計(jì)算機(jī)應(yīng)用研究;2007年07期
9 王朝霞;邱清盈;馮培恩;謝雙喜;;機(jī)械產(chǎn)品專利技術(shù)方案信息抽取方法[J];機(jī)械工程學(xué)報(bào);2009年10期
10 劉克強(qiáng);;2009共享版ICTCLAS的分析與使用[J];科教文匯(上旬刊);2009年08期
中國博士學(xué)位論文全文數(shù)據(jù)庫 前1條
1 車萬翔;基于核方法的語義角色標(biāo)注研究[D];哈爾濱工業(yè)大學(xué);2008年
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前7條
1 徐榮華;基于功能本體的產(chǎn)品結(jié)構(gòu)功能映射分析與再創(chuàng)新設(shè)計(jì)研究[D];南京航空航天大學(xué);2010年
2 楊浩博;基于功能本體的創(chuàng)新知識(shí)表達(dá)及檢索方法研究與實(shí)現(xiàn)[D];河北工業(yè)大學(xué);2011年
3 孟令謙;基于ontology的中文信息抽取系統(tǒng)的研究與實(shí)現(xiàn)[D];電子科技大學(xué);2004年
4 李颯;基于GATE的中文信息抽取系統(tǒng)的開發(fā)和實(shí)現(xiàn)[D];中國科學(xué)院研究生院(文獻(xiàn)情報(bào)中心);2006年
5 馬騰;基于ontology的信息抽取系統(tǒng)的研究與實(shí)現(xiàn)[D];電子科技大學(xué);2006年
6 張曉歡;基于本體的產(chǎn)品信息抽取系統(tǒng)的研究[D];天津理工大學(xué);2009年
7 毋菲;數(shù)值信息的抽取方法研究[D];山西大學(xué);2010年
本文編號(hào):976891
本文鏈接:http://sikaile.net/guanlilunwen/keyanlw/976891.html