基于文本數(shù)據(jù)挖掘的核心專利識別方法研究
發(fā)布時間:2023-11-16 20:18
核心專利一般是指某個技術領域的某種產(chǎn)品的關鍵核心技術所對應的專利[1],對某行業(yè)的核心專利進行識別是挖掘該行業(yè)關鍵核心技術信息的有效途徑,進而可以為行業(yè)企業(yè)提供技術研發(fā)指導。為了更全面的對核心專利進行識別,本文提出了一種基于文本數(shù)據(jù)挖掘的核心專利識別方法,該方法首先通過文本挖掘相關智能算法對專利進行領域細分,然后在細分領域的基礎上使用改進型PageRank算法對專利進行評分以識別該領域下的核心專利。本文的核心專利識別任務中包含三個子任務:分類子任務、聚類子任務和核心專利識別子任務,本文主要對三個子任務中使用的智能算法進行了深入研究,并使用本文方法對電力系統(tǒng)與設備領域的專利進行了實例分析。主要研究內(nèi)容如下:(1)提出了一種基于BERT-A-BiLSTM的多特征專利文本分類算法專利分類子任務中,為了依據(jù)專利所屬技術領域?qū)ζ溥M行劃分,本文提出了一種基于BERT-A-BiLSTM的多特征專利文本分類算法。目前專利文本分類算法大都采用靜態(tài)預訓練技術生成的詞向量進行文本向量化表示,無法解決詞語一詞多義的問題。基于此,本文使用動態(tài)預訓練模型BERT模型產(chǎn)生的可以根據(jù)語境變化的動...
【文章頁數(shù)】:71 頁
【學位級別】:碩士
【文章目錄】:
摘要
abstract
1 緒論
1.1 背景及意義
1.2 國內(nèi)外研究現(xiàn)狀
1.2.1 基于評價指標的核心專利識別方法研究現(xiàn)狀
1.2.2 基于引用的核心專利識別方法研究現(xiàn)狀
1.3 主要研究內(nèi)容
1.4 論文結構安排
2 相關研究思路及基礎
2.1 研究思路
2.2 核心專利概述
2.3 文本分類研究基礎
2.3.1 BERT模型
2.3.2 雙向長短時記憶神經(jīng)網(wǎng)絡
2.4 文本聚類研究基礎
2.4.1 Word2vec模型
2.4.2 K-means算法基本原理
2.5 引文網(wǎng)絡及其節(jié)點重要性排序技術概述
2.5.1 引文網(wǎng)絡及其度中心性
2.5.2 PageRank算法
3 基于BERT-A-BiLSTM的多特征專利文本分類算法研究
3.1 專利文本分類相關研究及分析
3.2 算法設計與實現(xiàn)
3.2.1 文本向量化表示層
3.2.2 文本特征提取層
3.2.3 輸出層
3.3 實驗設計與對比分析
3.3.1 實驗環(huán)境
3.3.2 實驗數(shù)據(jù)
3.3.3 實驗參數(shù)
3.3.4 對比實驗
3.3.5 評價指標
3.3.6 實驗結果與分析
3.4 本章小結
4 基于改進型K-means算法的專利文本聚類方法研究
4.1 專利文本聚類處理流程
4.2 文本向量化表示
4.3 基于初始中心點優(yōu)化的K-means改進算法
4.3.1 改進的K-means算法設計
4.3.2 實驗分析
4.4 實證分析
4.5 本章小結
5 基于改進型PageRank算法的核心專利識別方法研究
5.1 PageRank及其改進算法在核心專利識別方面的不足
5.2 基于權重分配優(yōu)化的PageRank改進算法
5.2.1 算法設計
5.2.2 改進算法的收斂性分析
5.3 實驗設計與對比分析
5.3.1 實驗環(huán)境配置
5.3.2 數(shù)據(jù)采集與處理
5.3.3 實驗結果及對比分析
5.4 本章小結
6 核心專利識別實例分析
7 總結與展望
7.1 總結
7.2 展望
參考文獻
作者簡歷
致謝
本文編號:3864508
【文章頁數(shù)】:71 頁
【學位級別】:碩士
【文章目錄】:
摘要
abstract
1 緒論
1.1 背景及意義
1.2 國內(nèi)外研究現(xiàn)狀
1.2.1 基于評價指標的核心專利識別方法研究現(xiàn)狀
1.2.2 基于引用的核心專利識別方法研究現(xiàn)狀
1.3 主要研究內(nèi)容
1.4 論文結構安排
2 相關研究思路及基礎
2.1 研究思路
2.2 核心專利概述
2.3 文本分類研究基礎
2.3.1 BERT模型
2.3.2 雙向長短時記憶神經(jīng)網(wǎng)絡
2.4 文本聚類研究基礎
2.4.1 Word2vec模型
2.4.2 K-means算法基本原理
2.5 引文網(wǎng)絡及其節(jié)點重要性排序技術概述
2.5.1 引文網(wǎng)絡及其度中心性
2.5.2 PageRank算法
3 基于BERT-A-BiLSTM的多特征專利文本分類算法研究
3.1 專利文本分類相關研究及分析
3.2 算法設計與實現(xiàn)
3.2.1 文本向量化表示層
3.2.2 文本特征提取層
3.2.3 輸出層
3.3 實驗設計與對比分析
3.3.1 實驗環(huán)境
3.3.2 實驗數(shù)據(jù)
3.3.3 實驗參數(shù)
3.3.4 對比實驗
3.3.5 評價指標
3.3.6 實驗結果與分析
3.4 本章小結
4 基于改進型K-means算法的專利文本聚類方法研究
4.1 專利文本聚類處理流程
4.2 文本向量化表示
4.3 基于初始中心點優(yōu)化的K-means改進算法
4.3.1 改進的K-means算法設計
4.3.2 實驗分析
4.4 實證分析
4.5 本章小結
5 基于改進型PageRank算法的核心專利識別方法研究
5.1 PageRank及其改進算法在核心專利識別方面的不足
5.2 基于權重分配優(yōu)化的PageRank改進算法
5.2.1 算法設計
5.2.2 改進算法的收斂性分析
5.3 實驗設計與對比分析
5.3.1 實驗環(huán)境配置
5.3.2 數(shù)據(jù)采集與處理
5.3.3 實驗結果及對比分析
5.4 本章小結
6 核心專利識別實例分析
7 總結與展望
7.1 總結
7.2 展望
參考文獻
作者簡歷
致謝
本文編號:3864508
本文鏈接:http://sikaile.net/tushudanganlunwen/3864508.html