基于深度學(xué)習(xí)和關(guān)系路徑的微博人物關(guān)系提取研究
發(fā)布時(shí)間:2021-02-20 03:14
隨著計(jì)算機(jī)及網(wǎng)絡(luò)通信技術(shù)的發(fā)展,互聯(lián)網(wǎng)技術(shù)的飛速發(fā)展和Web3.0模式的迭代更新,各類社交媒體平臺(tái)的出現(xiàn)使得人們能更加方便快捷的獲取信息,例如國(guó)內(nèi)的新浪微博、騰訊微博,國(guó)外的Facebook、Twitter等,這些社交媒體平臺(tái)每天都會(huì)產(chǎn)生大量的網(wǎng)絡(luò)文本產(chǎn)生,大量的信息都蘊(yùn)藏在這些文本中。信息提取就是能自動(dòng)的從這些非結(jié)構(gòu)文本中提取結(jié)構(gòu)化信息的自然語言處理任務(wù)之一,其中提取的結(jié)構(gòu)化信息如“(馬云,創(chuàng)始人,阿里巴巴)”的實(shí)體三元組能作為構(gòu)建大規(guī)模知識(shí)庫的知識(shí)來源。目前,作為知識(shí)主體的人物關(guān)系對(duì)信息的產(chǎn)生與傳播具有重要的影響,研究者們逐漸開始關(guān)注人物資源對(duì)知識(shí)庫構(gòu)建產(chǎn)生的作用,故挖掘人物之間的關(guān)系成為一個(gè)研究熱點(diǎn)。然而,傳統(tǒng)的關(guān)系提取方法往往依賴大量的特征工程和自然語言處理工具,這樣就會(huì)伴隨著錯(cuò)誤傳播等問題。深度學(xué)習(xí)以其強(qiáng)大的計(jì)算和上下文語義捕捉能力可自動(dòng)挖掘文本特征,已經(jīng)成功應(yīng)用于自然語言處理領(lǐng)域,很好的解決了傳統(tǒng)方法中存在的問題。因此,本文基于深度學(xué)習(xí)研究了微博人物關(guān)系提取,主要工作包括以下幾個(gè)方面:首先,本文構(gòu)建了一個(gè)微博人物關(guān)系提取模型。該模型在卷積神經(jīng)網(wǎng)絡(luò)(CNN)的基礎(chǔ)之上加入一個(gè)...
【文章來源】:西華大學(xué)四川省
【文章頁數(shù)】:69 頁
【學(xué)位級(jí)別】:碩士
【部分圖文】:
近幾年中國(guó)網(wǎng)民變化趨勢(shì)圖
容限制在 140 個(gè)字符,可以發(fā)布圖片和視頻等信息。這一優(yōu)勢(shì)使信息交流的平臺(tái)。根據(jù)微博 2018 年 12 月的財(cái)務(wù)報(bào)告數(shù)據(jù),截月活躍用戶總數(shù)為 4.62 億,比 2017 年同期增長(zhǎng) 37%,移動(dòng)終端 2 億[2],如圖 1.2 所示近幾年微博的月用戶活躍量與日用戶活躍
間的知識(shí)圖譜成為一個(gè)研究熱點(diǎn)。因此基于知識(shí)圖譜的搜索逐漸運(yùn)用在搜索圖 1.3 為搜狗人物知識(shí)圖譜搜索。關(guān)系提取任務(wù)的分支中,人物關(guān)系提取是一較強(qiáng)的關(guān)系提取子任務(wù),是構(gòu)建人物知識(shí)圖譜的關(guān)鍵技術(shù),對(duì)社會(huì)關(guān)系網(wǎng)絡(luò)的非常重要的意義。
【參考文獻(xiàn)】:
期刊論文
[1]家庭服務(wù)機(jī)器人知識(shí)庫的構(gòu)建[J]. 楊玉,王政博. 電子世界. 2019(06)
[2]中文實(shí)體關(guān)系抽取研究綜述[J]. 武文雅,陳鈺楓,徐金安,張玉潔. 計(jì)算機(jī)與現(xiàn)代化. 2018(08)
[3]實(shí)體關(guān)系抽取研究綜述[J]. 劉紹毓,李弼程,郭志剛,王波,陳剛. 信息工程大學(xué)學(xué)報(bào). 2016(05)
[4]知識(shí)表示學(xué)習(xí)研究進(jìn)展[J]. 劉知遠(yuǎn),孫茂松,林衍凱,謝若冰. 計(jì)算機(jī)研究與發(fā)展. 2016(02)
碩士論文
[1]基于主題微博的人物實(shí)體關(guān)系提取研究[D]. 刁云瀾.西華大學(xué) 2018
本文編號(hào):3042134
【文章來源】:西華大學(xué)四川省
【文章頁數(shù)】:69 頁
【學(xué)位級(jí)別】:碩士
【部分圖文】:
近幾年中國(guó)網(wǎng)民變化趨勢(shì)圖
容限制在 140 個(gè)字符,可以發(fā)布圖片和視頻等信息。這一優(yōu)勢(shì)使信息交流的平臺(tái)。根據(jù)微博 2018 年 12 月的財(cái)務(wù)報(bào)告數(shù)據(jù),截月活躍用戶總數(shù)為 4.62 億,比 2017 年同期增長(zhǎng) 37%,移動(dòng)終端 2 億[2],如圖 1.2 所示近幾年微博的月用戶活躍量與日用戶活躍
間的知識(shí)圖譜成為一個(gè)研究熱點(diǎn)。因此基于知識(shí)圖譜的搜索逐漸運(yùn)用在搜索圖 1.3 為搜狗人物知識(shí)圖譜搜索。關(guān)系提取任務(wù)的分支中,人物關(guān)系提取是一較強(qiáng)的關(guān)系提取子任務(wù),是構(gòu)建人物知識(shí)圖譜的關(guān)鍵技術(shù),對(duì)社會(huì)關(guān)系網(wǎng)絡(luò)的非常重要的意義。
【參考文獻(xiàn)】:
期刊論文
[1]家庭服務(wù)機(jī)器人知識(shí)庫的構(gòu)建[J]. 楊玉,王政博. 電子世界. 2019(06)
[2]中文實(shí)體關(guān)系抽取研究綜述[J]. 武文雅,陳鈺楓,徐金安,張玉潔. 計(jì)算機(jī)與現(xiàn)代化. 2018(08)
[3]實(shí)體關(guān)系抽取研究綜述[J]. 劉紹毓,李弼程,郭志剛,王波,陳剛. 信息工程大學(xué)學(xué)報(bào). 2016(05)
[4]知識(shí)表示學(xué)習(xí)研究進(jìn)展[J]. 劉知遠(yuǎn),孫茂松,林衍凱,謝若冰. 計(jì)算機(jī)研究與發(fā)展. 2016(02)
碩士論文
[1]基于主題微博的人物實(shí)體關(guān)系提取研究[D]. 刁云瀾.西華大學(xué) 2018
本文編號(hào):3042134
本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3042134.html
最近更新
教材專著