天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于深度學(xué)習(xí)理論與方法的中文專利文本自動分類研究

發(fā)布時間:2017-04-07 20:13

  本文關(guān)鍵詞:基于深度學(xué)習(xí)理論與方法的中文專利文本自動分類研究,,由筆耕文化傳播整理發(fā)布。


【摘要】:在當(dāng)前經(jīng)濟全球化的時代,科技成為第一生產(chǎn)力。國家和企業(yè)的進步,越來越多地依賴于科技的創(chuàng)新。作為科技載體的專利的數(shù)量和質(zhì)量已經(jīng)成為衡量國家和企業(yè)創(chuàng)新能力的重要指標(biāo),因而專利申請的數(shù)量大大增加。世界知識產(chǎn)權(quán)組織的統(tǒng)計結(jié)果表明,專利文本中蘊含了全世界90%-95%的發(fā)明創(chuàng)造,表征著世界科技的發(fā)展水平。如何從這些專利文本中獲取和利用科技信息,為國家和企業(yè)的發(fā)展提供戰(zhàn)略支持,是國內(nèi)外相關(guān)學(xué)者和專家研究的重點。而專利文本的分類作為最基礎(chǔ)的步驟,制約著專利文本信息的獲取和利用。目前,專利文本的分類主要以人工方式為主,自動分類方式已經(jīng)開始作為輔助手段,但大規(guī)模的專利文本自動分類尚未實現(xiàn),因此研究專利文本的自動分類具有重要的現(xiàn)實意義;趯@谋镜恼Z義特征,借助自動分類技術(shù),專利工作人員能夠?qū)Υ罅康膶@谋具M行自動且高效地分類,提高工作效率的同時,能夠更好地對專利文本中蘊含的豐富的科技信息進行分析和利用。因此,本文在對專利文本自動分類的基本框架和基本原理進行系統(tǒng)梳理的基礎(chǔ)上,設(shè)計了一個基于深度學(xué)習(xí)理論的中文專利自動文本分類方法,方法的主要內(nèi)容如下:首先對專利文本進行預(yù)處理和特征選擇,得到專利文本的形式化表示;然后基于深度學(xué)習(xí)理論,用降噪自動編碼器構(gòu)建深度學(xué)習(xí)網(wǎng)絡(luò),自動學(xué)習(xí)得到專利文本的低維特征編碼,并在網(wǎng)絡(luò)的最頂層采用支持向量機算法對其進行分類,根據(jù)分類的結(jié)果不斷調(diào)整網(wǎng)絡(luò)中的各層參數(shù)得到分類器;最后采用已知類別的專利文本測試集對分類器進行分類測試,得到測試分類的準(zhǔn)確率、召回率和F值以驗證本文設(shè)計的方法的可行性。另外,為了驗證本論文設(shè)計方法的有效性和優(yōu)越性,本文借鑒其他學(xué)者的方法,將得到的分類測試結(jié)果分別與K近鄰算法、支持向量機算法和反向傳播神經(jīng)網(wǎng)絡(luò)算法等經(jīng)典算法得到的分類測試結(jié)果進行比較。本文設(shè)計的專利文本自動分類方法在測試集上平均得到了95%以上的分類準(zhǔn)確率和94%以上的分類召回率,優(yōu)于經(jīng)典算法,表明本文設(shè)計的方法是有效而且優(yōu)越的。
【關(guān)鍵詞】:專利文本分類 深度學(xué)習(xí)理論 支持向量機 降噪自動編碼器
【學(xué)位授予單位】:江蘇大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2016
【分類號】:TP391.1
【目錄】:
  • 摘要4-5
  • Abstract5-10
  • 1 緒論10-22
  • 1.1 研究背景及意義10-14
  • 1.1.1 研究背景10-11
  • 1.1.2 研究意義11-14
  • 1.2 專利文本自動分類的國內(nèi)外研究現(xiàn)狀14-18
  • 1.2.1 國外研究現(xiàn)狀14-15
  • 1.2.2 國內(nèi)研究現(xiàn)狀15
  • 1.2.3 述評15-18
  • 1.3 研究方法18-20
  • 1.4 研究內(nèi)容與框架20-21
  • 1.5 本章小結(jié)21-22
  • 2 專利文本自動分類理論基礎(chǔ)22-36
  • 2.1 專利文本自動分類定義22-23
  • 2.2 專利文本自動分類框架23-35
  • 2.2.1 專利文本預(yù)處理24
  • 2.2.2 專利文本特征提取24-27
  • 2.2.3 專利文本表示27-29
  • 2.2.4 專利文本自動分類算法29-34
  • 2.2.5 專利分類效果評價34-35
  • 2.3 本章小結(jié)35-36
  • 3 深度學(xué)習(xí)理論基礎(chǔ)36-46
  • 3.1 深度學(xué)習(xí)理論概述36-38
  • 3.2 深度學(xué)習(xí)算法38-44
  • 3.2.1 自動編碼器38-39
  • 3.2.2 稀疏編碼39-40
  • 3.2.3 限制玻爾茲曼機40-41
  • 3.2.4 深度置信網(wǎng)絡(luò)41-42
  • 3.2.5 卷積神經(jīng)網(wǎng)絡(luò)42-44
  • 3.3 深度學(xué)習(xí)理論算法在文本處理中的應(yīng)用44-45
  • 3.3.1 AE在文本處理中的應(yīng)用44
  • 3.3.2 深度學(xué)習(xí)其它算法在文本處理中的應(yīng)用44-45
  • 3.3.3 深度學(xué)習(xí)算法的選擇45
  • 3.4 本章小結(jié)45-46
  • 4 基于深度學(xué)習(xí)理論的專利文本自動分類方法的提出46-52
  • 4.1 基于DAE的專利文本特征降維46-49
  • 4.2 基于SVM的專利文本自動分類49-50
  • 4.3 基于深度學(xué)習(xí)理論的專利文本自動分類流程50-51
  • 4.4 本章小結(jié)51-52
  • 5 基于深度學(xué)習(xí)理論的專利文本自動分類實驗設(shè)計與實現(xiàn)52-74
  • 5.1 專利文本自動分類系統(tǒng)集成框架52-55
  • 5.2 實驗語料的選擇55-57
  • 5.3 專利文本分詞57-63
  • 5.4 專利文本特征選擇63-65
  • 5.5 專利文本形式化表示65-67
  • 5.6 專利文本自動分類器的構(gòu)建67-72
  • 5.6.1 專利文本自動分類經(jīng)典實驗67-68
  • 5.6.2 專利文本自動分類優(yōu)化實驗68-72
  • 5.7 專利文本自動分類評測72
  • 5.8 分類實驗具體步驟72-73
  • 5.9 本章小結(jié)73-74
  • 6 專利文本自動分類實驗結(jié)果分析74-82
  • 6.1 基于深度學(xué)習(xí)理論的分類方法的實驗結(jié)果分析74-77
  • 6.2 與經(jīng)典算法實驗的比較分析77-81
  • 6.3 本章小結(jié)81-82
  • 7 論文總結(jié)與展望82-86
  • 7.1 論文總結(jié)82-84
  • 7.2 未來展望84-86
  • 參考文獻86-91
  • 致謝91-92
  • 攻讀碩士學(xué)位期間發(fā)表的論文和參與的課題92

【相似文獻】

中國期刊全文數(shù)據(jù)庫 前10條

1 李淑文;試論文本自動分類[J];現(xiàn)代計算機(專業(yè)版);2004年07期

2 王明文,付雪峰,左家莉;網(wǎng)頁與文本自動分類綜述[J];南昌工程學(xué)院學(xué)報;2005年03期

3 徐建斌,施亞東;基于概念的文本自動分類研究的綜述[J];福建電腦;2005年02期

4 包劍,冀常鵬,李義杰;基于矢量空間模型的文本自動分類系統(tǒng)研究[J];計算機系統(tǒng)應(yīng)用;2005年03期

5 楊應(yīng)全;網(wǎng)絡(luò)環(huán)境下文本自動分類分析[J];現(xiàn)代情報;2005年03期

6 楊應(yīng)全;文汝;;網(wǎng)絡(luò)環(huán)境下文本自動分類分析[J];科技文獻信息管理;2005年01期

7 盛秋艷;;文本自動分類技術(shù)的研究[J];交通科技與經(jīng)濟;2006年03期

8 張雪英;Jürgen Krause;劉鳳玉;;文本自動分類中的動態(tài)類別擴展研究[J];計算機應(yīng)用研究;2007年05期

9 耿煥同;李杰;;范例推理在文本自動分類中的應(yīng)用研究[J];情報理論與實踐;2007年06期

10 王濤;;文本自動分類研究[J];圖書館學(xué)研究;2007年12期

中國重要會議論文全文數(shù)據(jù)庫 前5條

1 盧朋;曾雋芳;楊一平;;基于背景知識的文本自動分類[A];第三屆學(xué)生計算語言學(xué)研討會論文集[C];2006年

2 王小華;陸蓓;張國煊;;文本自動分類的模糊方法[A];自然語言理解與機器翻譯——全國第六屆計算語言學(xué)聯(lián)合學(xué)術(shù)會議論文集[C];2001年

3 匡海波;陳小荷;;唐詩文本自動分類的算法研究[A];第五屆全國青年計算語言學(xué)研討會論文集[C];2010年

4 周欽強;孫炳達;;貝葉斯文本自動分類器的研究與實現(xiàn)[A];04'中國企業(yè)自動化和信息化建設(shè)論壇暨中南六省區(qū)自動化學(xué)會學(xué)術(shù)年會專輯[C];2004年

5 翟偉斌;許榕生;;基于Internet的CIS研究[A];第十三屆全國核電子學(xué)與核探測技術(shù)學(xué)術(shù)年會論文集(下冊)[C];2006年

中國博士學(xué)位論文全文數(shù)據(jù)庫 前3條

1 張雪英;基于粗糙集理論的文本自動分類研究[D];南京理工大學(xué);2005年

2 郝立柱;漢語文本自動分類[D];吉林大學(xué);2008年

3 薛德軍;中文文本自動分類中的關(guān)鍵問題研究[D];清華大學(xué);2004年

中國碩士學(xué)位論文全文數(shù)據(jù)庫 前10條

1 王恒;基于云計算的文本自動分類系統(tǒng)的設(shè)計與實現(xiàn)[D];電子科技大學(xué);2014年

2 劉Z

本文編號:291231


資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/falvlunwen/zhishichanquanfa/291231.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶a9765***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com