天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于知識圖譜的專利領域文本分類算法研究與應用

發(fā)布時間:2021-11-01 13:14
  在創(chuàng)新驅動的第四次工業(yè)革命背景下,我國正加快腳步推動創(chuàng)新型國家的建設,積極鼓勵大眾和企業(yè)在各自領域內創(chuàng)新。大眾在創(chuàng)新的同時需要借閱大量相關領域研究的知識和技術。掌握相關領域當前技術的發(fā)展狀況和創(chuàng)新是把握當下熱點的前提。如果想在本領域獲得創(chuàng)新,那么通過專利了解前沿技術十分重要。專利既是科學技術先進成果的風向標,同時又是前沿知識的載體,促使企業(yè)、高校等技術創(chuàng)新者不斷提高自身能力,完善技術體系。隨著國家積極提倡大眾創(chuàng)新、創(chuàng)新驅動發(fā)展的影響,我國每年的專利數量也在迅速增長。面對如此龐雜的信息來源,企業(yè)和創(chuàng)新人才如何有效的獲得相關知識成為值得我們思考的問題。在海量的數據中,有效的將專利領域的信息分類可以使得企業(yè)和高校的創(chuàng)新人才準確地從大量文本數據中獲得自己想要的信息。因此,高效準確的信息分類可以大大減少大眾科學技術信息搜索時間,提高檢索效率。專利是代表科學技術發(fā)展進程的標簽,我國當前積極鼓勵各企業(yè)和高校科研人員積極創(chuàng)新。如何在眾多種類的專利中高效的搜索到有利的專利信息是當前面臨的主要問題。本文構建面向專利領域的知識圖譜,通過不同專利的關聯關系網中的結構化關系,找到相同類別專利之間的聯系。將專利分... 

【文章來源】:吉林大學吉林省 211工程院校 985工程院校 教育部直屬院校

【文章頁數】:75 頁

【學位級別】:碩士

【部分圖文】:

基于知識圖譜的專利領域文本分類算法研究與應用


CBOW模型圖

知識圖


第2章相關技術綜述9摘要做預處理,與作者、申請人等專利的關鍵信息構建知識圖譜,使得相同類別的專利有更加緊密的語義上的聯系,然后將構建好的專利知識圖譜向量化有助于提高文本分類的準確率和召回率。2.2.1知識圖譜的應用價值1.輔助搜索互聯網的最終形式是世界上所有事物通過網絡相互連接在一起,而搜索的最終目標是對世界上所有事物的直接搜索。像谷歌、百度等傳統的搜索引擎依靠網頁之間的超鏈接實現事物的檢索,而語義搜索是直接對事物進行檢索,例如具體的人物、地點和機構等。這些事物可能來自文本、圖片、動畫、互聯的硬件設備等各種傳遞信息的資源。而知識圖譜和語義技術提供了關于實體的特性和關系進行描述,促使搜索引擎可以直接對實體事物進行索引和檢索。語義搜索將搜索引擎的工作不再拘泥于用戶所輸入請求語句字面本身,而是透過現象看本質,準確的捕捉用戶輸入語句后面的真正意圖,并以此來進行搜索,從而能準確的向用戶返回最符合其需求的搜索結果。目前國內外很多公司利用知識圖譜提高搜索引擎的能力,其中典型代表有谷歌的Freebase、百度的“知心”、搜狗的“知立方”等。圖2.2展示了谷歌檢索中知識圖譜輔助搜索的一個實例,本文以“姚明”作為搜索詞進行信息資源檢索時,google不僅返回了百科網頁文字圖片和視頻,同時還生成了一個對姚明這個具體人物實體的結構化摘要信息,這其中包括了以姚明為中心的人物關系,配偶、子女、隊友等關系實體。圖2.2知識圖譜在輔助搜索中的應用1

首頁,知識圖


第2章相關技術綜述12含人、地點、音樂、電影、組織機構、事物、地點等類的定義。DBpedia采用RDF定義數據模型,統計包含30億個RDF三元組[15]。4.OpenKG是一個面向中文域開放知識圖譜的社區(qū)項目,主要目的是促進中文領域知識圖譜數據的開放與互聯。OpenKG聚集了大量開放的中文知識圖譜數據、工具及貢獻,如圖2.3是OpenKG首頁,包括百科類的Zhishi.me(狗尾草科技、東南大學)、CN-DBpedia(復旦大學)、XLore(清華大學)、Belief-Engine(中科院自動化所),OpenKG通過融合和鏈接計算對數據進行整合并提供開放的API。此外,OpenKG還對一些重要的知識圖譜開源工具進行了收集和整理,包括知識建模工具Protege、知識融合工具Limes、知識問答工具YodaQA、知識抽取工具DeepDive等。圖2.3OpenKG首頁25.領域知識圖譜:本文之前提到的DBpedia、百度和谷歌等都是通用知識圖譜。另外還有一種知識圖譜是領域知識圖譜,又叫做垂直領域的知識圖譜,它是專門面向某個領域的知識圖譜,如電商、金融、安全、農業(yè)等各種不同的分支領域[16-17]。領域知識圖譜相比于通用知識圖譜有很多不同之處。如圖2.4所示,從多個方面對兩種知識圖譜進行對比分析。2http://www.openkg.cn/圖2.4通用知識圖譜和領域知識圖譜分析

【參考文獻】:
期刊論文
[1]中文文本分類方法綜述[J]. 于游,付鈺,吳曉平.  網絡與信息安全學報. 2019(05)
[2]卷積神經網絡CNN算法在文本分類上的應用研究[J]. 侯小培,高迎.  科技與創(chuàng)新. 2019(04)
[3]基于知識圖譜擴展的短文本分類方法[J]. 丁連紅,孫斌,張宏偉.  情報工程. 2018(05)
[4]一種基于Neo4j圖數據庫的模糊查詢研究與實現[J]. 李雪.  計算機技術與發(fā)展. 2018(11)
[5]專利信息系統分析與研究[J]. 康婧,謝怡,宋佳穎,趙正青,張慶國,康懷志.  情報工程. 2017(05)
[6]知識圖譜研究進展[J]. 漆桂林,高桓,吳天星.  情報工程. 2017(01)
[7]垂直知識圖譜的構建與應用研究[J]. 阮彤,王夢婕,王昊奮,胡芳槐.  知識管理論壇. 2016(03)
[8]知識圖譜構建技術綜述[J]. 劉嶠,李楊,段宏,劉瑤,秦志光.  計算機研究與發(fā)展. 2016(03)
[9]知識表示學習研究進展[J]. 劉知遠,孫茂松,林衍凱,謝若冰.  計算機研究與發(fā)展. 2016(02)
[10]融合LDA與TextRank的關鍵詞抽取研究[J]. 顧益軍,夏天.  現代圖書情報技術. 2014(Z1)

碩士論文
[1]基于Web的領域知識圖譜構建平臺的研究與實現[D]. 王寧.北京郵電大學 2019
[2]面向特定領域的知識圖譜構建技術研究與應用[D]. 邢立棟.北京化工大學 2018
[3]基于決策樹的分類方法研究[D]. 戴南.南京師范大學 2003



本文編號:3470177

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3470177.html


Copyright(c)文論論文網All Rights Reserved | 網站地圖 |

版權申明:資料由用戶a6637***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com