基于神經(jīng)網(wǎng)絡的專利智能侵權檢索研究
發(fā)布時間:2017-08-14 21:23
本文關鍵詞:基于神經(jīng)網(wǎng)絡的專利智能侵權檢索研究
更多相關文章: 侵權檢索 中文專利 SOM 模糊聚類 知識產(chǎn)權
【摘要】:專利作為知識產(chǎn)權中至關重要的一部分,已經(jīng)受到了各社會經(jīng)濟體的普遍關注,日益健全的專利保護機制一方面極大推動了專利申請量和授權量的增加,另一方面也在很大程度上導致了專利侵權情況的頻繁出現(xiàn)。面對專利侵權案件的發(fā)生,原告與被告可能面臨長時間的法律訴訟以及高額的賠償,對于涉及專利侵權的任何企業(yè)和個人,這都意味著沉重的負擔和巨大的成本。因此,為了有效規(guī)避上述風險,,并為相關利益人提供權益保護,合理而高效的專利侵權檢索方法顯得尤為重要。 本文在研究專利侵權檢索研究現(xiàn)狀的基礎上,以專利文獻的文本數(shù)據(jù)為基礎,采用文本挖掘技術,提出一種基于自組織映射(SOM)神經(jīng)網(wǎng)絡算法的中文專利侵權檢索模型,主要內(nèi)容包括中文專利文本數(shù)據(jù)的采集、文本信息的加工和優(yōu)化、中文專利侵權檢索模型的構建及其主要功能模塊的實現(xiàn)。本文選取專利說明書中的權項要求作為數(shù)據(jù)源。在文本預處理部分,首先采用語料庫編制技術領域詞表和停用詞表,并對專利數(shù)據(jù)集進行專利篩選;其次,在復旦大學自然語言處理系統(tǒng)的基礎上,提出一種適合于中文專利權利要求書的分詞算法——TextRank算法,對實驗數(shù)據(jù)進行分詞處理;最后,通過對專利權項要求的關鍵詞進行提取,并計算關鍵詞在專利中所占的權重大小,得到專利-關鍵詞共現(xiàn)矩陣。在中文專利侵權檢索模型構建部分,本文采用SOM神經(jīng)網(wǎng)絡學習算法,以Matlab軟件為平臺,實現(xiàn)被檢專利的聚類分析,并通過進一步歸類處理,檢索出待檢專利的疑似侵權專利組,最后,通過聚類結果的評價及專利權項要求書的比對分析,證明該方法具有可行性。另外,本文完成了上述模型的基本功能模塊的實現(xiàn)。 面對海量的專利文本信息,本文提出的方法旨在幫助可能涉及專利侵權的利益相關者快速方便地進行中文專利的侵權檢索,一方面為企業(yè)的研發(fā)人員或?qū)@暾堈咛峁蚀_、全面的侵權檢索結果,避免新產(chǎn)品侵權或申請專利失敗,另一方面為專利審查人員提供快速、精確的專利審查方法,提高專利審查的時效性和準確率。實驗結果表明,該方法能夠在一定程度上精簡檢索過程、提高檢索準確度。
【關鍵詞】:侵權檢索 中文專利 SOM 模糊聚類 知識產(chǎn)權
【學位授予單位】:北京工業(yè)大學
【學位級別】:碩士
【學位授予年份】:2014
【分類號】:G306;G252.7
【目錄】:
- 摘要4-5
- Abstract5-9
- 第1章 緒論9-19
- 1.1 研究背景及意義9-11
- 1.1.1 問題提出10
- 1.1.2 研究意義10-11
- 1.2 國內(nèi)外研究現(xiàn)狀11-15
- 1.2.1 國外研究現(xiàn)狀11-12
- 1.2.2 國內(nèi)研究現(xiàn)狀12-14
- 1.2.3 研究現(xiàn)狀評述14-15
- 1.3 本文主要研究工作15-19
- 1.3.1 研究內(nèi)容和研究路線15-17
- 1.3.2 論文組織結構17-19
- 第2章 相關理論背景19-33
- 2.1 專利侵權檢索概述19-22
- 2.1.1 專利檢索的類型19-20
- 2.1.2 專利侵權檢索20-22
- 2.2 SOM 神經(jīng)網(wǎng)絡理論22-26
- 2.2.1 SOM 神經(jīng)網(wǎng)絡模型23-24
- 2.2.2 SOM 神經(jīng)網(wǎng)絡學習算法24-26
- 2.3 專利信息的文本挖掘理論26-29
- 2.3.1 專利文本挖掘概念26-27
- 2.3.2 TextRank 算法27
- 2.3.3 語料庫理論27-28
- 2.3.4 專利文本挖掘流程28-29
- 2.4 系統(tǒng)開發(fā)環(huán)境介紹29-31
- 2.4.1 Visual Studio 2010 介紹29-31
- 2.4.2 Microsoft SQL Server 介紹31
- 2.5 本章小結31-33
- 第3章 專利數(shù)據(jù)采集及文本預處理33-53
- 3.1 中文專利數(shù)據(jù)來源及特征33-35
- 3.1.1 中文專利數(shù)據(jù)來源33
- 3.1.2 中文專利權項要求書的內(nèi)容及結構特點33-35
- 3.2 專利數(shù)據(jù)的文本預處理35-51
- 3.2.1 專利領域語料庫的構建35-37
- 3.2.2 專利領域的語料預處理37-47
- 3.2.3 專利領域的語料特征選擇和抽取47-51
- 3.3 本章小節(jié)51-53
- 第4章 中文專利侵權檢索模型構建53-65
- 4.1 中文專利的侵權檢索簡介53
- 4.2 中文專利侵權檢索模型的總體框架53-54
- 4.3 SOM 神經(jīng)網(wǎng)絡算法設計54-56
- 4.3.1 基于 SOM 算法的模糊聚類54-55
- 4.3.2 SOM 聚類結果的評價55-56
- 4.4 專利侵權檢索實驗結果及分析56-63
- 4.4.1 實驗假設56-57
- 4.4.2 數(shù)據(jù)獲取與處理57-59
- 4.4.3 SOM 網(wǎng)絡設計59-60
- 4.4.4 實驗結果及分析60-63
- 4.5 本章小結63-65
- 第5章 中文專利侵權檢索原型系統(tǒng)實現(xiàn)65-83
- 5.1 系統(tǒng)架構及數(shù)據(jù)流程圖65-68
- 5.2 原型系統(tǒng)主要功能模塊展示68-75
- 5.3 原型系統(tǒng)實現(xiàn)的主要算法及語法75-82
- 5.4 本章小結82-83
- 結論83-85
- 參考文獻85-89
- 攻讀碩士學位期間所發(fā)表的學術論文89-91
- 致謝91
【參考文獻】
中國期刊全文數(shù)據(jù)庫 前1條
1 郭煒強,文軍,文貴華;基于貝葉斯模型的專利分類[J];計算機工程與設計;2005年08期
本文編號:674774
本文鏈接:http://sikaile.net/guanlilunwen/keyanlw/674774.html
最近更新
教材專著