基于深度學(xué)習(xí)的專利文本分析方法研究
發(fā)布時(shí)間:2021-03-12 01:17
隨著現(xiàn)代科學(xué)技術(shù)和信息技術(shù)的發(fā)展,專利分析(Patent Analysis)在衡量技術(shù)競(jìng)爭(zhēng)力,預(yù)測(cè)技術(shù)趨勢(shì)等方面發(fā)揮著不可替代的作用,在工業(yè)、商業(yè)、法律、學(xué)術(shù)界等多個(gè)領(lǐng)域得到廣泛的應(yīng)用。在專利分析領(lǐng)域,高效提取專利特征,度量相似專利是一項(xiàng)具有挑戰(zhàn)性的任務(wù)。鑒于深度學(xué)習(xí)(Deeplearning,DL)方法在文本分類、情感分析等自然語(yǔ)言處理(Natural language processing,NLP)領(lǐng)域表現(xiàn)出來(lái)的優(yōu)勢(shì),本文提出了一種基于深度學(xué)習(xí)的專利文本挖掘方法,旨在挖掘、提取和量化專利文本特征,為專利檢索、相似專利度量等專利分析任務(wù)提供高質(zhì)量的專利特征數(shù)據(jù)。本文提出了一套較為系統(tǒng)的專利文本特征提取方法。首先,結(jié)合專利文本結(jié)構(gòu)特點(diǎn)和專利文本外表特征,構(gòu)造出一種用于本方法的專利文本結(jié)構(gòu)化數(shù)據(jù)集;然后,利用概率統(tǒng)計(jì)模型——主題模型(Topic model)對(duì)專利文本潛在的語(yǔ)義結(jié)構(gòu)進(jìn)行提取、降維和聚類,并依據(jù)聚類結(jié)果構(gòu)造用于深度學(xué)習(xí)的訓(xùn)練集;接著,構(gòu)建卷積神經(jīng)網(wǎng)絡(luò)(Convolutional neural network,CNN)模型,通過(guò)有監(jiān)督學(xué)習(xí)的方式,提取和組合專利文本不同維度的關(guān)...
【文章來(lái)源】:北京郵電大學(xué)北京市 211工程院校 教育部直屬院校
【文章頁(yè)數(shù)】:99 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
圖1-2RNN模型架構(gòu)圖|19I??為了解決RNN的偏倚問(wèn)題,CNN將一個(gè)無(wú)偏倚問(wèn)題的模型引入到文本處理??
圖1?-4?Recurrent-CNN模型架構(gòu)圖間??對(duì)四種神經(jīng)網(wǎng)絡(luò)模型優(yōu)缺點(diǎn)總結(jié)如表1-1所示
圖2-1?USPTO的XML格式專利文本結(jié)構(gòu)(部分)??2.1.2專利文本相似度度量方法??,
本文編號(hào):3077429
【文章來(lái)源】:北京郵電大學(xué)北京市 211工程院校 教育部直屬院校
【文章頁(yè)數(shù)】:99 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
圖1-2RNN模型架構(gòu)圖|19I??為了解決RNN的偏倚問(wèn)題,CNN將一個(gè)無(wú)偏倚問(wèn)題的模型引入到文本處理??
圖1?-4?Recurrent-CNN模型架構(gòu)圖間??對(duì)四種神經(jīng)網(wǎng)絡(luò)模型優(yōu)缺點(diǎn)總結(jié)如表1-1所示
圖2-1?USPTO的XML格式專利文本結(jié)構(gòu)(部分)??2.1.2專利文本相似度度量方法??,
本文編號(hào):3077429
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/3077429.html
最近更新
教材專著