天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當前位置:主頁 > 管理論文 > 科研管理論文 >

基于突發(fā)詞檢測的中文專利預警系統(tǒng)

發(fā)布時間:2017-08-21 06:06

  本文關鍵詞:基于突發(fā)詞檢測的中文專利預警系統(tǒng)


  更多相關文章: 專利數(shù)據(jù) 文本挖掘 自然語言處理 突發(fā)詞檢測 專利預警


【摘要】:專利信息是重要的競爭情報資源之一,它蘊含了巨大的技術信息和知識量。充分挖掘和利用專利信息,可以了解技術發(fā)展趨勢,發(fā)現(xiàn)新的技術領域和技術方向。通過建立專利預警機制,一方面可以使企業(yè)在市場競爭中占據(jù)有利地位,保護自身知識產(chǎn)權,規(guī)避專利侵權行為,從容應對競爭對手在專利技術領域的挑戰(zhàn);另一方面也可以使企業(yè)及時發(fā)現(xiàn)行業(yè)中的技術熱點和新興技術,了解行業(yè)發(fā)展趨勢,進而為企業(yè)發(fā)展提供戰(zhàn)略參考。本論文以新能源汽車領域的專利數(shù)據(jù)作為研究對象,將文本挖掘與信息抽取技術應用于專利信息抽取,并在此基礎上實現(xiàn)了專利突發(fā)詞的發(fā)現(xiàn)和重要專利的預警工作。本文同時構建了適合大規(guī)模數(shù)據(jù)采集的分布式專利信息采集系統(tǒng),最終實現(xiàn)了包含上述工作的基于突發(fā)詞檢測的中文專利預警系統(tǒng)。該系統(tǒng)在工程方面借鑒了國內(nèi)外互聯(lián)網(wǎng)企業(yè)先進的工程經(jīng)驗,在架構設計上充分考慮了高可用、高并發(fā)、大數(shù)據(jù)處理等實際問題。該系統(tǒng)主要分為4個部分,即專利信息采集子系統(tǒng)、突發(fā)詞抽取子系統(tǒng)、重要專利預警子系統(tǒng)和競爭對手分析子系統(tǒng)。(1)專利信息采集子系統(tǒng)定時從指定信息源抓取最新的專利數(shù)據(jù),對數(shù)據(jù)進行結構化解析、信息抽取等操作,再將數(shù)據(jù)傳送到主系統(tǒng)中的專利知識庫。該子系統(tǒng)在工程方面進行了較大改進,通過分布式部署、HTTP代理集群,使之更加適應海量數(shù)據(jù)處理的需要。(2)突發(fā)詞抽取子系統(tǒng)應用本文提出的突發(fā)詞抽取算法,實現(xiàn)了專利數(shù)據(jù)中突發(fā)詞的抽取和展示。(3)重要專利預警子系統(tǒng)是在突發(fā)詞抽取的基礎上,根據(jù)用戶指定突發(fā)詞,為其推薦和該突發(fā)詞所代表的技術領域關系最密切的專利數(shù)據(jù)。(4)競爭對手分析子系統(tǒng)實現(xiàn)了對競爭對手在中文專利申請方面的綜合競爭力、發(fā)明人合作關系、專利數(shù)量變化趨勢的分析工作。通過在真實數(shù)據(jù)集上的實驗證明,本文提出的基于突發(fā)詞檢測的中文專利預警方案能夠極大地減少人力成本的浪費,提高了專利信息挖掘的效率。
【關鍵詞】:專利數(shù)據(jù) 文本挖掘 自然語言處理 突發(fā)詞檢測 專利預警
【學位授予單位】:北京工業(yè)大學
【學位級別】:碩士
【學位授予年份】:2016
【分類號】:G306;TP391.1
【目錄】:
  • 摘要4-5
  • Abstract5-10
  • 第1章 緒論10-16
  • 1.1 研究背景及意義10
  • 1.2 國內(nèi)外研究現(xiàn)狀10-11
  • 1.3 主要研究內(nèi)容11-13
  • 1.4 可行性分析13
  • 1.5 本文的組織結構13-16
  • 第2章 相關技術16-22
  • 2.1 專利信息采集16-17
  • 2.1.1 多Agent系統(tǒng)16
  • 2.1.2 負載均衡機制16
  • 2.1.3 Web信息抽取技術16-17
  • 2.2 文本挖掘17-18
  • 2.2.1 文本挖掘概論17-18
  • 2.2.2 文本聚類18
  • 2.3 共詞分析18-19
  • 2.4 系統(tǒng)開發(fā)技術19
  • 2.5 本章小結19-22
  • 第3章 專利信息采集與預處理22-30
  • 3.1 專利信息采集22-25
  • 3.1.1 專利信息采集概述22-23
  • 3.1.2 專利列表頁的抓取23-24
  • 3.1.3 專利內(nèi)容頁的抓取24-25
  • 3.1.4 負載均衡與訪問代理25
  • 3.2 專利信息抽取25-26
  • 3.3 專利信息預處理26-27
  • 3.4 實驗及結果分析27-28
  • 3.4.1 專利信息采集結果27
  • 3.4.2 專利信息抽取結果27-28
  • 3.5 本章小結28-30
  • 第4章 專利突發(fā)詞抽取30-42
  • 4.1 專業(yè)術語識別30-31
  • 4.2 同義詞歸并31-32
  • 4.3 突發(fā)詞判定條件32-34
  • 4.3.1 重要性評價32-34
  • 4.3.2 熱點性評價34
  • 4.3.3 突發(fā)性評價34
  • 4.4 基礎詞匯過濾34-36
  • 4.5 專利突發(fā)詞判定算法36-37
  • 4.6 實驗及結果分析37-40
  • 4.6.1 數(shù)據(jù)集37
  • 4.6.2 同義詞歸并結果37-38
  • 4.6.3 突發(fā)詞判定結果38-39
  • 4.6.4 基礎詞匯過濾結果39-40
  • 4.6.5 突發(fā)詞抽取結果40
  • 4.7 本章小結40-42
  • 第5章 重要專利預警42-54
  • 5.1 突發(fā)詞聚類42-44
  • 5.1.1 突發(fā)詞相似性判定42-43
  • 5.1.2 突發(fā)詞聚類算法43-44
  • 5.2 查詢預處理44-46
  • 5.2.1 查詢條件分解44-45
  • 5.2.2 查詢條件擴展45-46
  • 5.3 專利分值加權46-49
  • 5.3.1 水平加權47-48
  • 5.3.2 垂直加權48
  • 5.3.3 混合加權48-49
  • 5.4 專利分值計算49
  • 5.5 重要專利推薦算法49-50
  • 5.6 實驗及結果分析50-51
  • 5.6.1 突發(fā)詞聚類實驗結果50
  • 5.6.2 查詢條件分解實驗結果50-51
  • 5.6.3 重要專利推薦實驗結果51
  • 5.7 本章小結51-54
  • 第6章 系統(tǒng)設計與實現(xiàn)54-68
  • 6.1 系統(tǒng)設計54-58
  • 6.1.1 基礎開發(fā)環(huán)境54
  • 6.1.2 系統(tǒng)特色54-55
  • 6.1.3 系統(tǒng)總體框架55-56
  • 6.1.4 分層架構設計56-58
  • 6.2 專利信息采集子系統(tǒng)58-62
  • 6.2.1 系統(tǒng)結構設計58-59
  • 6.2.2 系統(tǒng)基本功能59-62
  • 6.3 突發(fā)詞抽取子系統(tǒng)62-64
  • 6.3.1 系統(tǒng)結構設計62-63
  • 6.3.2 系統(tǒng)基本功能63-64
  • 6.4 重要專利預警子系統(tǒng)64-65
  • 6.4.1 系統(tǒng)結構設計64
  • 6.4.2 系統(tǒng)基本功能64-65
  • 6.5 競爭對手分析子系統(tǒng)65-67
  • 6.5.1 系統(tǒng)結構設計65
  • 6.5.2 系統(tǒng)基本功能65-67
  • 6.6 本章小結67-68
  • 結論68-70
  • 參考文獻70-74
  • 攻讀碩士學位期間所取得的研究成果74-76
  • 致謝76


本文編號:711214

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/guanlilunwen/keyanlw/711214.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權申明:資料由用戶3c788***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com