天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

面向經(jīng)濟(jì)知識(shí)圖譜構(gòu)建中文關(guān)系抽取算法的研究與應(yīng)用

發(fā)布時(shí)間:2021-02-04 16:18
  隨著信息化時(shí)代的高速發(fā)展,近些年來(lái)互聯(lián)網(wǎng)技術(shù)得到了爆炸式的飛速發(fā)展,同時(shí)互聯(lián)網(wǎng)在各行各業(yè)廣泛普及應(yīng)用,互聯(lián)網(wǎng)上文本數(shù)據(jù)呈爆炸式增長(zhǎng)。雖然互聯(lián)網(wǎng)上海量的、多樣的數(shù)據(jù)讓人們獲取知識(shí)變得更加容易,但是其中大量的無(wú)用的數(shù)據(jù)同樣讓人們高效準(zhǔn)確地獲取知識(shí)變得更加困難。人們迫切希望一種技術(shù)能夠從海量的數(shù)據(jù)中抽取有用的知識(shí),當(dāng)人們需要某種知識(shí)時(shí)可以直接準(zhǔn)確獲取,而不需要人工篩選。知識(shí)圖譜正是在這種情況下誕生的,知識(shí)圖譜就是覆蓋在海量數(shù)據(jù)上的知識(shí)網(wǎng)絡(luò)結(jié)構(gòu),它從海量的數(shù)據(jù)中抽取有用的知識(shí),以實(shí)體關(guān)系三元組的形式結(jié)構(gòu)化呈現(xiàn)給用戶,讓人們可以快速準(zhǔn)確地獲取需要的知識(shí),而實(shí)體關(guān)系抽取則是構(gòu)建知識(shí)圖譜的核心技術(shù)。因而,知識(shí)圖譜和實(shí)體關(guān)系抽取從提出至今一直是熱門研究方向,面向領(lǐng)域知識(shí)圖譜研究實(shí)體關(guān)系抽取算法在學(xué)術(shù)上和工程上都有極大的價(jià)值和意義。本文首先介紹了知識(shí)圖譜和實(shí)體關(guān)系抽取算法在國(guó)內(nèi)外的發(fā)展歷程和研究現(xiàn)狀,然后分析了知識(shí)圖譜和實(shí)體關(guān)系抽取的相關(guān)技術(shù),接著在此基礎(chǔ)上面向經(jīng)濟(jì)領(lǐng)域知識(shí)圖譜深入研究實(shí)體關(guān)系抽取算法,并在已有的經(jīng)典算法模型基礎(chǔ)上進(jìn)行優(yōu)化改進(jìn),提出了本文改進(jìn)的基于遠(yuǎn)程監(jiān)督的實(shí)體關(guān)系抽取算法,最后將本文改... 

【文章來(lái)源】:電子科技大學(xué)四川省 211工程院校 985工程院校 教育部直屬院校

【文章頁(yè)數(shù)】:103 頁(yè)

【學(xué)位級(jí)別】:碩士

【部分圖文】:

面向經(jīng)濟(jì)知識(shí)圖譜構(gòu)建中文關(guān)系抽取算法的研究與應(yīng)用


百度智能搜索結(jié)果

自然語(yǔ)言,工具,例子,卷積


電子科技大學(xué)碩士學(xué)位論文202.4.2自然語(yǔ)言處理工具語(yǔ)言技術(shù)平臺(tái)(LTP)[57]是由哈工大社會(huì)計(jì)算與信息檢索研究中心研發(fā)和推廣的,是目前國(guó)內(nèi)外最具影響力和最全面的中文自然語(yǔ)言處理平臺(tái),目前實(shí)現(xiàn)的功能主要包括分詞、詞性標(biāo)注、命名實(shí)體識(shí)別、依存句法分析、語(yǔ)義角色標(biāo)注和語(yǔ)義依存分析。例如,對(duì)句子“華為技術(shù)有限公司成立于1987年,總部位于中國(guó)廣東省深圳市龍崗區(qū)!边M(jìn)行LTP自然語(yǔ)言處理的全部操作,可視化結(jié)果如圖所示。圖2-5自然語(yǔ)言處理工具LTP使用例子2.5深度學(xué)習(xí)相關(guān)技術(shù)研究最早的神經(jīng)網(wǎng)絡(luò)其思想起源于1943年的MCP人工神經(jīng)元模型[58],深度學(xué)習(xí)的概念也源于人工神經(jīng)網(wǎng)絡(luò)的研究。從1943年至今的研究中,神經(jīng)網(wǎng)絡(luò)的研究發(fā)展有過(guò)停滯不前的研究低谷,也有飛速發(fā)展的研究熱潮。如今,隨著硬件的提升,各種深度學(xué)習(xí)相關(guān)算法在醫(yī)療、金融、藝術(shù)以及無(wú)人駕駛等眾多領(lǐng)域均取得了顯著的成果,深度學(xué)習(xí)技術(shù)正處于新的研究熱潮中。在自然語(yǔ)言處理領(lǐng)域,除了以往的CNN、RNN、LSTM等深度學(xué)習(xí)技術(shù),還有最新的Attention機(jī)制以及Transformer框架。本文主要談?wù)劸矸e神經(jīng)網(wǎng)絡(luò)和Attention機(jī)制。2.5.1卷積神經(jīng)網(wǎng)絡(luò)卷積神經(jīng)網(wǎng)絡(luò)(CNN)最開(kāi)始是應(yīng)用于計(jì)算機(jī)視覺(jué)中[59],但是隨著研究者們?cè)谧匀徽Z(yǔ)言處理的各種任務(wù)中引入卷積神經(jīng)網(wǎng)絡(luò),發(fā)現(xiàn)相較于傳統(tǒng)方法,卷積神

詞條,頁(yè)面,有限公司,技術(shù)


電子科技大學(xué)碩士學(xué)位論文30圖3-2華為技術(shù)有限公司百度百科詞條頁(yè)面的信息盒部分(2)工商信息部分工商信息部分是經(jīng)濟(jì)領(lǐng)域部分企業(yè)所特有的模塊,是對(duì)詞條所屬知識(shí)的工商信息的列表展示,和信息盒一樣,其固定格式為<關(guān)系,實(shí)體>,如圖3-3所示為華為技術(shù)有限公司百度百科詞條頁(yè)面的工商信息部分。本文同樣采用統(tǒng)一的格式模板對(duì)工商信息部分進(jìn)行抽取,得到<詞條,關(guān)系,實(shí)體>這樣的實(shí)體關(guān)系三元組,例如<華為技術(shù)有限公司,法定代表人,趙明路>,工商信息部分為本文構(gòu)建知識(shí)庫(kù)的補(bǔ)充數(shù)據(jù)來(lái)源;圖3-3華為技術(shù)有限公司百度百科詞條頁(yè)面的工商信息部分3.2.2經(jīng)濟(jì)領(lǐng)域知識(shí)庫(kù)構(gòu)建截至2019年8月,百度百科總共收錄了一千六百萬(wàn)條詞條,覆蓋了現(xiàn)實(shí)世界中的各行各業(yè),當(dāng)然也包括了本文研究的經(jīng)濟(jì)領(lǐng)域。本文構(gòu)建經(jīng)濟(jì)領(lǐng)域知識(shí)庫(kù)的數(shù)據(jù)來(lái)源主要就是百度百科詞條頁(yè)面的信息盒與工商信息部分,由于本文經(jīng)濟(jì)領(lǐng)域主要是針對(duì)于企業(yè)和人物,同時(shí)為了保證采集數(shù)據(jù)的質(zhì)量,本文采用人工構(gòu)建了經(jīng)濟(jì)領(lǐng)域企業(yè)列表、人物列表以及對(duì)應(yīng)的企業(yè)列表擴(kuò)展詞列表。最后,根據(jù)企業(yè)列表和人物列表,依次對(duì)列表中的企業(yè)詞條和列表中的人物詞條的百度百科詞條頁(yè)面進(jìn)行網(wǎng)絡(luò)爬蟲(chóng),采集人物和企業(yè)相關(guān)的實(shí)體關(guān)系三元組,初步構(gòu)建經(jīng)濟(jì)領(lǐng)

【參考文獻(xiàn)】:
期刊論文
[1]CNNIC發(fā)布第44次《中國(guó)互聯(lián)網(wǎng)絡(luò)發(fā)展?fàn)顩r統(tǒng)計(jì)報(bào)告》[J]. 于朝暉.  網(wǎng)信軍民融合. 2019(09)
[2]融合多特征的基于遠(yuǎn)程監(jiān)督的中文領(lǐng)域?qū)嶓w關(guān)系抽取[J]. 王斌,郭劍毅,線巖團(tuán),王紅斌,余正濤.  模式識(shí)別與人工智能. 2019(02)
[3]中文實(shí)體關(guān)系抽取研究綜述[J]. 武文雅,陳鈺楓,徐金安,張玉潔.  計(jì)算機(jī)與現(xiàn)代化. 2018(08)
[4]遠(yuǎn)程監(jiān)督人物關(guān)系抽取中的去噪研究[J]. 黃蓓靜,賀樑,楊靜.  計(jì)算機(jī)應(yīng)用與軟件. 2017(07)
[5]基于依存句法的實(shí)體關(guān)系抽取[J]. 周亮俊.  電子技術(shù)與軟件工程. 2016(24)
[6]知識(shí)圖譜技術(shù)綜述[J]. 徐增林,盛泳潘,賀麗榮,王雅芳.  電子科技大學(xué)學(xué)報(bào). 2016(04)
[7]基于依存分析的開(kāi)放式中文實(shí)體關(guān)系抽取方法[J]. 李明耀,楊靜.  計(jì)算機(jī)工程. 2016(06)
[8]知識(shí)圖譜構(gòu)建技術(shù)綜述[J]. 劉嶠,李楊,段宏,劉瑤,秦志光.  計(jì)算機(jī)研究與發(fā)展. 2016(03)
[9]知識(shí)圖譜的技術(shù)實(shí)現(xiàn)流程及相關(guān)應(yīng)用[J]. 曹倩,趙一鳴.  情報(bào)理論與實(shí)踐. 2015(12)
[10]基于開(kāi)放網(wǎng)絡(luò)知識(shí)的信息檢索與數(shù)據(jù)挖掘[J]. 王元卓,賈巖濤,劉大偉,靳小龍,程學(xué)旗.  計(jì)算機(jī)研究與發(fā)展. 2015(02)

碩士論文
[1]基于文本挖掘的領(lǐng)域知識(shí)圖譜構(gòu)建方法的研究與實(shí)現(xiàn)[D]. 劉霄陽(yáng).北京交通大學(xué) 2019
[2]基于co-training與核函數(shù)的關(guān)系抽取技術(shù)研究[D]. 張一昌.北京郵電大學(xué) 2015
[3]開(kāi)放領(lǐng)域的中文實(shí)體無(wú)監(jiān)督關(guān)系抽取[D]. 孫勇亮.華東師范大學(xué) 2014
[4]實(shí)體關(guān)系自動(dòng)抽取技術(shù)的比較研究[D]. 寧海燕.哈爾濱工業(yè)大學(xué) 2010
[5]基于圖的半監(jiān)督學(xué)習(xí)模型研究與分類器設(shè)計(jì)[D]. 郝建柏.中國(guó)科學(xué)技術(shù)大學(xué) 2009



本文編號(hào):3018591

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3018591.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶5495e***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com