天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

微博話題人物關(guān)系知識圖譜構(gòu)建研究

發(fā)布時(shí)間:2022-02-05 04:38
  微博數(shù)據(jù)中含有大量的人物關(guān)系(例如,朋友關(guān)系,夫妻關(guān)系),然而微博數(shù)據(jù)量大、冗余數(shù)據(jù)多的特點(diǎn)使得人們難以了解這些復(fù)雜的人物關(guān)系。為了解決這個(gè)問題,本文提出了一種微博話題人物關(guān)系知識圖譜的構(gòu)建方法,幫助人們了解微博環(huán)境下的人物關(guān)系。首先從微博話題提取相關(guān)的人名,然后利用微博平臺中關(guān)于這些人名的冗余信息,抽取人物關(guān)系三元組,最后構(gòu)建該微博話題下的人物關(guān)系知識圖譜。本文的主要研究內(nèi)容如以下幾個(gè)方面:(1)關(guān)系特征詞的提取。為了盡可能全面的提取關(guān)系特征詞,本文從三個(gè)方面對關(guān)系特征詞進(jìn)行提取:基于依存句法的關(guān)系特征詞提取,基于相對位置信息的關(guān)系特征詞提取,以及基于主題的關(guān)系特征詞提取,最后對這些關(guān)系特征詞整合去重,構(gòu)建關(guān)系特征詞組。(2)關(guān)系特征詞組的優(yōu)化和知識圖譜的構(gòu)建。為了提高人物關(guān)系抽取的效果,本文對關(guān)系特征詞組進(jìn)行了優(yōu)化,首先建立滑動(dòng)窗口,通過頻繁項(xiàng)集挖掘算法對關(guān)系特征詞組進(jìn)行擴(kuò)展,然后不斷移動(dòng)滑動(dòng)窗口,比較前后兩個(gè)滑動(dòng)窗口下關(guān)系特征詞組的總特征權(quán)重,完成關(guān)系特征詞組的優(yōu)化。本文研究了微博話題人物關(guān)系知識圖譜的構(gòu)建方法,先從微博話題中獲取待抽取人物關(guān)系的人名對,再通過微博平臺獲取該人名對... 

【文章來源】:安徽理工大學(xué)安徽省

【文章頁數(shù)】:59 頁

【學(xué)位級別】:碩士

【部分圖文】:

微博話題人物關(guān)系知識圖譜構(gòu)建研究


圖2知識圖譜構(gòu)建過程??Figure?2?The?process?of?Knowledge?Graph?Constructing??

實(shí)例圖,分詞系統(tǒng),實(shí)例


習(xí)方法相結(jié)合的方式。本文主要使用的是Hanlp中文分詞系統(tǒng),該系統(tǒng)的核心字??典來自于人民日報(bào)2014年語料庫,采用條件隨機(jī)場和隱馬爾科夫模型,分詞效果??如圖3所示。??^函”?_?_?祖,呈-_?_,圈?.???k國&充特朗普會見國務(wù)院副總理劉鶴??圖3?Hanlp分詞系統(tǒng)實(shí)例??Figure?3?The?example?of?Hanlp?word?segmentation?system??3.2.3人名識別??人名識別屬于命名實(shí)體識別的一部分,命名實(shí)體識別的目的是識別文本中的人??名、地名、機(jī)構(gòu)名、時(shí)間名等含有一定意義的專有名詞。命名實(shí)體識別作為信息??抽取中的一個(gè)基礎(chǔ)工作,其識別效果對于后續(xù)的關(guān)系特征詞的提取有很大影響。??現(xiàn)有的命名實(shí)體識別[51]有以下兩種方法:??(1)

句法分析,示例,總理,有向弧


點(diǎn)和節(jié)點(diǎn)之間用一個(gè)有向弧連接,有向弧的弧頭和弧尾表示關(guān)系。??特朗普會見印度總理莫迪”,對應(yīng)的依存句法樹如圖4所示見”是根節(jié)點(diǎn)作為核心詞,SBV表示“特朗普”和“會見”是主迪”和“會見”是動(dòng)賓關(guān)系,ATT表示“總理”和“印度”是定中

【參考文獻(xiàn)】:
期刊論文
[1]AceMap學(xué)術(shù)地圖與AceKG學(xué)術(shù)知識圖譜——學(xué)術(shù)數(shù)據(jù)可視化[J]. 張曄,賈雨葶,傅洛伊,王新兵.  上海交通大學(xué)學(xué)報(bào). 2018(10)
[2]一種改進(jìn)的實(shí)體關(guān)系抽取算法——OptMultiR[J]. 延浩然,靳小龍,賈巖濤,程學(xué)旗.  中文信息學(xué)報(bào). 2018(09)
[3]基于遠(yuǎn)程監(jiān)督的多因子人物關(guān)系抽取模型[J]. 黃楊琛,賈焰,甘亮,徐菁,黃九鳴,赫中翮.  通信學(xué)報(bào). 2018(07)
[4]語義社交網(wǎng)絡(luò)中用戶信息提取與影響力分析[J]. 邱望,潘善亮.  小型微型計(jì)算機(jī)系統(tǒng). 2018(07)
[5]海量法律文書中基于CNN的實(shí)體關(guān)系抽取技術(shù)[J]. 高丹,彭敦陸,劉叢.  小型微型計(jì)算機(jī)系統(tǒng). 2018(05)
[6]命名實(shí)體識別研究綜述[J]. 劉瀏,王東波.  情報(bào)學(xué)報(bào). 2018(03)
[7]融合最近距離和人名窗口信息的人物關(guān)系抽取[J]. 劉赟,張小明,李舟軍.  山西大學(xué)學(xué)報(bào)(自然科學(xué)版). 2018(01)
[8]基于深度學(xué)習(xí)的中文實(shí)體關(guān)系抽取方法[J]. 孫紫陽,顧君忠,楊靜.  計(jì)算機(jī)工程. 2018(09)
[9]基于弱監(jiān)督和半自動(dòng)方法的中文關(guān)系抽取數(shù)據(jù)集構(gòu)建[J]. 馬超義,徐蔚然.  中文信息學(xué)報(bào). 2017(05)
[10]基于半監(jiān)督CRF的跨領(lǐng)域中文分詞[J]. 鄧麗萍,羅智勇.  中文信息學(xué)報(bào). 2017(04)

博士論文
[1]基于社交網(wǎng)絡(luò)的知識圖譜構(gòu)建技術(shù)研究[D]. 馬江濤.戰(zhàn)略支援部隊(duì)信息工程大學(xué) 2018

碩士論文
[1]旅游領(lǐng)域知識圖譜構(gòu)建方法的研究和實(shí)現(xiàn)[D]. 徐溥.北京理工大學(xué) 2016
[2]中文企業(yè)知識圖譜構(gòu)建與分析[D]. 程文亮.華東師范大學(xué) 2016
[3]基于詞向量模型特征空間優(yōu)化的同義詞擴(kuò)展研究與應(yīng)用[D]. 張為泰.北京郵電大學(xué) 2015
[4]開放領(lǐng)域的中文實(shí)體無監(jiān)督關(guān)系抽取[D]. 孫勇亮.華東師范大學(xué) 2014



本文編號:3614574

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/guanlilunwen/ydhl/3614574.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶003c5***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請E-mail郵箱bigeng88@qq.com