基于深度語義學(xué)習(xí)的專利挖掘方法及應(yīng)用
發(fā)布時間:2025-05-11 00:21
當(dāng)下社會進(jìn)入了前所未有的高速發(fā)展期,科技創(chuàng)新活動呈井噴趨勢增長,成為推動國家經(jīng)濟增長和提升國家競爭力的第一動力。專利文獻(xiàn)由于囊括了全球每年90%~95%的最新科技成果,是蘊含技術(shù)創(chuàng)新方案的重要知識載體,因此基于專利數(shù)據(jù)從海量的信息中挖掘出與技術(shù)相關(guān)的情報信息,可以為企業(yè)和國家制定創(chuàng)新發(fā)展戰(zhàn)略提供幫助。傳統(tǒng)的專利分析研究多使用計量統(tǒng)計的方法,忽略了文本中隱藏的重要信息,而近些年興起的專利文本挖掘研究中,則存在專利文本特征提取不完整、未充分考慮文本中語義關(guān)聯(lián)等問題,不能對專利文獻(xiàn)進(jìn)行深度的分析。基于以上原因,本文以專利文本為挖掘?qū)ο?考慮了專利的語義和文本特征,分別從特征提取和專利文本向量表示兩個方面,提出了適用于專利領(lǐng)域的文本挖掘方法。其中,在特征提取上,本文選擇SAO-C(Subject,Action,Object,Complement)結(jié)構(gòu)作為專利的技術(shù)特征,并針對專利文本特有的語言特點,以及現(xiàn)有方法在提取專利領(lǐng)域SAO-C結(jié)構(gòu)上的不足,提出了基于深度學(xué)習(xí)的SAO-C結(jié)構(gòu)提取模型:Ro BERTa+BiLSTM+MLP,并充分利用大型公開數(shù)據(jù)集和部分標(biāo)注的專利數(shù)據(jù)作為訓(xùn)練集,提高了模型...
【文章頁數(shù)】:133 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
Abstract
第一章 緒論
1.1 研究背景及意義
1.1.1 研究背景
1.1.2 研究意義
1.2 國內(nèi)外研究綜述
1.2.1 專利挖掘方法
1.2.2 SAO結(jié)構(gòu)提取方法
1.2.3 深度學(xué)習(xí)及在專利領(lǐng)域的應(yīng)用
1.2.4 研究現(xiàn)狀的總結(jié)與評述
1.3 研究內(nèi)容及框架
1.3.1 研究內(nèi)容
1.3.2 研究方法
1.3.3 主要創(chuàng)新點
1.3.4 論文框架
第二章 基于深度學(xué)習(xí)的SAO-C結(jié)構(gòu)提取方法構(gòu)建
2.1 專利數(shù)據(jù)及其獲取
2.1.1 專利數(shù)據(jù)描述
2.1.2 專利數(shù)據(jù)獲取
2.2 使用深度學(xué)習(xí)提取SAO-C的方法構(gòu)建
2.2.1 模型整體框架
2.2.2 詞嵌入模型
2.2.3 Bi-LSTM
2.2.4 序列標(biāo)注
2.3 實驗分析
2.3.1 實驗數(shù)據(jù)
2.3.2 對比模型
2.3.3 超參數(shù)設(shè)置
2.3.4 評估標(biāo)準(zhǔn)
2.3.5 實驗結(jié)果分析
2.4 本章小結(jié)
第三章 基于Doc-SAO模型的專利挖掘方法構(gòu)建
3.1 專利挖掘方法構(gòu)建流程
3.2 基于Doc2Vec和 SAO-C的專利相似度度量
3.2.1 整體流程
3.2.2 專利文本向量的生成與相似度計算
3.3 實驗分析
3.3.1 實驗說明
3.3.2 權(quán)重因子值的設(shè)置
3.3.3 實驗結(jié)果對比
3.3.4 小樣本專利直觀分析
3.4 基于專利相似度的知識圖譜構(gòu)建
3.4.1 專利網(wǎng)絡(luò)
3.4.2 專利地圖構(gòu)建
3.5 本章小結(jié)
第四章 實證研究:人工智能領(lǐng)域的專利情報挖掘
4.1 人工智能領(lǐng)域概述
4.2 專利數(shù)據(jù)的獲取
4.3 人工智能技術(shù)發(fā)展的計量分析
4.3.1 技術(shù)發(fā)展階段分析
4.3.2 專利生效國與技術(shù)市場分析
4.3.3 專利權(quán)人分析
4.3.4 技術(shù)領(lǐng)域分布初步分析
4.4 基于本專利挖掘方法的人工智能實證研究
4.4.1 實驗環(huán)境配置
4.4.2 各階段專利相似度計算
4.4.3 專利知識圖譜分析
4.4.4 對策與建議
4.5 本章小結(jié)
結(jié)論
總結(jié)與啟示
不足與展望
參考文獻(xiàn)
附錄
附錄1 核心專利及其相關(guān)信息表
附錄2 SAO-C結(jié)構(gòu)提取部分代碼
附錄3 專利相似度度量部分代碼
攻讀博士/碩士學(xué)位期間取得的研究成果
致謝
附件
本文編號:4044555
【文章頁數(shù)】:133 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
Abstract
第一章 緒論
1.1 研究背景及意義
1.1.1 研究背景
1.1.2 研究意義
1.2 國內(nèi)外研究綜述
1.2.1 專利挖掘方法
1.2.2 SAO結(jié)構(gòu)提取方法
1.2.3 深度學(xué)習(xí)及在專利領(lǐng)域的應(yīng)用
1.2.4 研究現(xiàn)狀的總結(jié)與評述
1.3 研究內(nèi)容及框架
1.3.1 研究內(nèi)容
1.3.2 研究方法
1.3.3 主要創(chuàng)新點
1.3.4 論文框架
第二章 基于深度學(xué)習(xí)的SAO-C結(jié)構(gòu)提取方法構(gòu)建
2.1 專利數(shù)據(jù)及其獲取
2.1.1 專利數(shù)據(jù)描述
2.1.2 專利數(shù)據(jù)獲取
2.2 使用深度學(xué)習(xí)提取SAO-C的方法構(gòu)建
2.2.1 模型整體框架
2.2.2 詞嵌入模型
2.2.3 Bi-LSTM
2.2.4 序列標(biāo)注
2.3 實驗分析
2.3.1 實驗數(shù)據(jù)
2.3.2 對比模型
2.3.3 超參數(shù)設(shè)置
2.3.4 評估標(biāo)準(zhǔn)
2.3.5 實驗結(jié)果分析
2.4 本章小結(jié)
第三章 基于Doc-SAO模型的專利挖掘方法構(gòu)建
3.1 專利挖掘方法構(gòu)建流程
3.2 基于Doc2Vec和 SAO-C的專利相似度度量
3.2.1 整體流程
3.2.2 專利文本向量的生成與相似度計算
3.3 實驗分析
3.3.1 實驗說明
3.3.2 權(quán)重因子值的設(shè)置
3.3.3 實驗結(jié)果對比
3.3.4 小樣本專利直觀分析
3.4 基于專利相似度的知識圖譜構(gòu)建
3.4.1 專利網(wǎng)絡(luò)
3.4.2 專利地圖構(gòu)建
3.5 本章小結(jié)
第四章 實證研究:人工智能領(lǐng)域的專利情報挖掘
4.1 人工智能領(lǐng)域概述
4.2 專利數(shù)據(jù)的獲取
4.3 人工智能技術(shù)發(fā)展的計量分析
4.3.1 技術(shù)發(fā)展階段分析
4.3.2 專利生效國與技術(shù)市場分析
4.3.3 專利權(quán)人分析
4.3.4 技術(shù)領(lǐng)域分布初步分析
4.4 基于本專利挖掘方法的人工智能實證研究
4.4.1 實驗環(huán)境配置
4.4.2 各階段專利相似度計算
4.4.3 專利知識圖譜分析
4.4.4 對策與建議
4.5 本章小結(jié)
結(jié)論
總結(jié)與啟示
不足與展望
參考文獻(xiàn)
附錄
附錄1 核心專利及其相關(guān)信息表
附錄2 SAO-C結(jié)構(gòu)提取部分代碼
附錄3 專利相似度度量部分代碼
攻讀博士/碩士學(xué)位期間取得的研究成果
致謝
附件
本文編號:4044555
本文鏈接:http://sikaile.net/tushudanganlunwen/4044555.html
教材專著