基于深度學習的專利分類方法研究
發(fā)布時間:2021-10-20 16:46
作為科技載體的專利文本中蘊含了豐富的背景、技術、功能、效應等知識。采用功能-效應-專利的檢索方式,就可以借鑒不同領域?qū)@械脑砗头椒?從而打破思維慣性,為產(chǎn)品設計者提供類似的專利進行參考。目前挖掘?qū)@c效應對應關系的方法以概念圖匹配為主,存在匹配容錯性差、實用性差的問題。近兩年來,用深度學習模型解決文本分類問題變得很受關注,它被證明在特征提取和文本表示方面有著很大的優(yōu)勢。目前基于循環(huán)神經(jīng)網(wǎng)絡的分類方法存在梯度消失和語義信息丟失的問題,而注意力機制能夠給文本中的關鍵部分分配更多的注意力,突出其重要性。本文提出一種包含多個基于注意力機制的雙向LSTM模型(BiLSTMATT)的專利效應分類算法。通過分析效應在專利中的位置,本文算法將專利文本的摘要、權利要求說明書、發(fā)明內(nèi)容、具體實施方式四部分內(nèi)容分別作為BiLSTMATT的原始輸入,學習得到的四部分特征以不同的權重融合作為專利文本特征。將功能作為LSTM模型的原始輸入,訓練得到功能特征。然后,將專利文本特征與功能特征進行融合作為專利效應分類的總體特征,...
【文章來源】:河北工業(yè)大學天津市 211工程院校
【文章頁數(shù)】:56 頁
【學位級別】:碩士
【部分圖文】:
word2vec訓練后得到的詞典
河北工業(yè)大學碩士學位論文-31-0.15,0.35,0.3,0.05]]。在其它參數(shù)保持不變的情況下,隱藏層的節(jié)點個數(shù)n約為120的時候準確率最佳。除迭代次數(shù)epoch之外的參數(shù)保持初始值的情況下,隨著迭代次數(shù)的增加,準確率也隨之增大,但是迭代次數(shù)為20時,準確率達到最佳。同理得到學習率的最佳取值為0.1。如圖5.1所示,在d3的概率分布下,效果最佳,即摘要、權利要求說明書、發(fā)明內(nèi)容、具體實施方式、功能按照0.15,0.1,0.35,0.3,0.1的概率分布時效果最佳。圖5.1交叉驗證調(diào)參結(jié)果圖5.1.3實驗具體設計為了檢驗本文設計的模型對于專利效應分類的效果,本文主要設計了3類實驗:(1)基于機器學習的分類實驗本文采用經(jīng)典的分類訓練算法LR和SVM進行實驗。這里通過sklearn庫調(diào)用svm包中的SVC和linear_model包中LogisticRegression分別實現(xiàn)SVM算法和LR算法。這是因為Sklearn庫提供了很多的默認參數(shù),對LR和SVM涉及的參數(shù)調(diào)節(jié)相對較少,并且調(diào)節(jié)起來也方便,適合于進行分類方面的研究。其中SVC表示通過實現(xiàn)二分類的方法進行多分類[49]。若n_class是類別的數(shù)量,就必須建立n*n/2個分類器,而desision_function_shape參數(shù)則允許集成二分類器對樣本進行多分類的操作。
河北工業(yè)大學碩士學位論文-35-5.3.2應用展示在此采用頁面展示的方式說明以上案例的使用和新專利文本的分析。本文采用Django框架和MySQL數(shù)據(jù)庫實現(xiàn)算法部分、后臺數(shù)據(jù)庫部分與前臺的交互。(1)新專利文本的分析頁面如圖5.2所示,輸入的信息包含專利原名稱、專利號、摘要、權利要求說明書、發(fā)明內(nèi)容、具體實施方式以及專利的功能等內(nèi)容。圖5.2效應分析界面輸入需要輸入的文本內(nèi)容,點擊“分析”按鈕,摘要、權利要求說明書、發(fā)明內(nèi)容、具體實施方式、專利功能這五部分的文本,就會調(diào)用后臺算法自動分析出該專利
【參考文獻】:
期刊論文
[1]中文文本特征選擇方法研究綜述[J]. 徐泓洋,楊國為. 工業(yè)控制計算機. 2017(11)
[2]基于卷積神經(jīng)網(wǎng)絡和KNN的短文本分類算法研究[J]. 殷亞博,楊文忠,楊慧婷,許超英. 計算機工程. 2018(07)
[3]基于word embedding的短文本特征擴展與分類[J]. 孟欣,左萬利. 小型微型計算機系統(tǒng). 2017(08)
[4]基于加權word2vec的微博情感分析[J]. 李銳,張謙,劉嘉勇. 通信技術. 2017(03)
[5]基于遞歸神經(jīng)網(wǎng)絡的文本分類研究[J]. 黃磊,杜昌順. 北京化工大學學報(自然科學版). 2017(01)
[6]基于主題擴展的領域問題分類方法[J]. 張青,呂釗. 計算機工程. 2016(09)
[7]基于功能基的專利信息挖掘與自動分類實驗研究[J]. 劉龍繁,李彥,侯超異,李文強. 四川大學學報(工程科學版). 2016(05)
[8]基于摘要文本的專利快速自動分類方法[J]. 繆建明,賈廣威,張運良. 情報理論與實踐. 2016(08)
[9]國際專利分類表中設計知識的提取和利用[J]. 冀瑜,邱清盈,馮培恩,黃浩. 浙江大學學報(工學版). 2016(03)
[10]基于知識粒度的TRIZ在創(chuàng)新設計中的應用[J]. 劉龍繁,李彥,馬金龍,杜曉嬌,劉紅圍. 機械工程學報. 2016(05)
博士論文
[1]專利知識獲取及其支持概念創(chuàng)新設計的方法研究[D]. 王朝霞.浙江大學 2009
碩士論文
[1]文本表示模型和特征選擇算法研究[D]. 陳磊.中國科學技術大學 2017
[2]基于詞分布的文本表示研究[D]. 陳志鵬.蘇州大學 2017
[3]基于深度神經(jīng)網(wǎng)絡模型的句子級文本情感分類研究[D]. 徐瑩瑩.深圳大學 2016
[4]基于深度學習理論與方法的中文專利文本自動分類研究[D]. 馬雙剛.江蘇大學 2016
[5]基于Attention-Based LSTM模型的文本分類技術的研究[D]. 張沖.南京大學 2016
本文編號:3447259
【文章來源】:河北工業(yè)大學天津市 211工程院校
【文章頁數(shù)】:56 頁
【學位級別】:碩士
【部分圖文】:
word2vec訓練后得到的詞典
河北工業(yè)大學碩士學位論文-31-0.15,0.35,0.3,0.05]]。在其它參數(shù)保持不變的情況下,隱藏層的節(jié)點個數(shù)n約為120的時候準確率最佳。除迭代次數(shù)epoch之外的參數(shù)保持初始值的情況下,隨著迭代次數(shù)的增加,準確率也隨之增大,但是迭代次數(shù)為20時,準確率達到最佳。同理得到學習率的最佳取值為0.1。如圖5.1所示,在d3的概率分布下,效果最佳,即摘要、權利要求說明書、發(fā)明內(nèi)容、具體實施方式、功能按照0.15,0.1,0.35,0.3,0.1的概率分布時效果最佳。圖5.1交叉驗證調(diào)參結(jié)果圖5.1.3實驗具體設計為了檢驗本文設計的模型對于專利效應分類的效果,本文主要設計了3類實驗:(1)基于機器學習的分類實驗本文采用經(jīng)典的分類訓練算法LR和SVM進行實驗。這里通過sklearn庫調(diào)用svm包中的SVC和linear_model包中LogisticRegression分別實現(xiàn)SVM算法和LR算法。這是因為Sklearn庫提供了很多的默認參數(shù),對LR和SVM涉及的參數(shù)調(diào)節(jié)相對較少,并且調(diào)節(jié)起來也方便,適合于進行分類方面的研究。其中SVC表示通過實現(xiàn)二分類的方法進行多分類[49]。若n_class是類別的數(shù)量,就必須建立n*n/2個分類器,而desision_function_shape參數(shù)則允許集成二分類器對樣本進行多分類的操作。
河北工業(yè)大學碩士學位論文-35-5.3.2應用展示在此采用頁面展示的方式說明以上案例的使用和新專利文本的分析。本文采用Django框架和MySQL數(shù)據(jù)庫實現(xiàn)算法部分、后臺數(shù)據(jù)庫部分與前臺的交互。(1)新專利文本的分析頁面如圖5.2所示,輸入的信息包含專利原名稱、專利號、摘要、權利要求說明書、發(fā)明內(nèi)容、具體實施方式以及專利的功能等內(nèi)容。圖5.2效應分析界面輸入需要輸入的文本內(nèi)容,點擊“分析”按鈕,摘要、權利要求說明書、發(fā)明內(nèi)容、具體實施方式、專利功能這五部分的文本,就會調(diào)用后臺算法自動分析出該專利
【參考文獻】:
期刊論文
[1]中文文本特征選擇方法研究綜述[J]. 徐泓洋,楊國為. 工業(yè)控制計算機. 2017(11)
[2]基于卷積神經(jīng)網(wǎng)絡和KNN的短文本分類算法研究[J]. 殷亞博,楊文忠,楊慧婷,許超英. 計算機工程. 2018(07)
[3]基于word embedding的短文本特征擴展與分類[J]. 孟欣,左萬利. 小型微型計算機系統(tǒng). 2017(08)
[4]基于加權word2vec的微博情感分析[J]. 李銳,張謙,劉嘉勇. 通信技術. 2017(03)
[5]基于遞歸神經(jīng)網(wǎng)絡的文本分類研究[J]. 黃磊,杜昌順. 北京化工大學學報(自然科學版). 2017(01)
[6]基于主題擴展的領域問題分類方法[J]. 張青,呂釗. 計算機工程. 2016(09)
[7]基于功能基的專利信息挖掘與自動分類實驗研究[J]. 劉龍繁,李彥,侯超異,李文強. 四川大學學報(工程科學版). 2016(05)
[8]基于摘要文本的專利快速自動分類方法[J]. 繆建明,賈廣威,張運良. 情報理論與實踐. 2016(08)
[9]國際專利分類表中設計知識的提取和利用[J]. 冀瑜,邱清盈,馮培恩,黃浩. 浙江大學學報(工學版). 2016(03)
[10]基于知識粒度的TRIZ在創(chuàng)新設計中的應用[J]. 劉龍繁,李彥,馬金龍,杜曉嬌,劉紅圍. 機械工程學報. 2016(05)
博士論文
[1]專利知識獲取及其支持概念創(chuàng)新設計的方法研究[D]. 王朝霞.浙江大學 2009
碩士論文
[1]文本表示模型和特征選擇算法研究[D]. 陳磊.中國科學技術大學 2017
[2]基于詞分布的文本表示研究[D]. 陳志鵬.蘇州大學 2017
[3]基于深度神經(jīng)網(wǎng)絡模型的句子級文本情感分類研究[D]. 徐瑩瑩.深圳大學 2016
[4]基于深度學習理論與方法的中文專利文本自動分類研究[D]. 馬雙剛.江蘇大學 2016
[5]基于Attention-Based LSTM模型的文本分類技術的研究[D]. 張沖.南京大學 2016
本文編號:3447259
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/3447259.html
最近更新
教材專著