天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于詞分布和深度殘差網(wǎng)絡(luò)的關(guān)系抽取方法研究

發(fā)布時(shí)間:2021-06-25 02:02
  隨著大數(shù)據(jù)時(shí)代的到來(lái),海量的信息以半結(jié)構(gòu)或者原始文本的形式存在于網(wǎng)絡(luò)中,如何將其中的信息以結(jié)構(gòu)化的形式儲(chǔ)存是當(dāng)前亟待解決的問(wèn)題。知識(shí)圖譜作為結(jié)構(gòu)化的語(yǔ)義網(wǎng)絡(luò)被廣泛用于自然語(yǔ)言處理中,關(guān)系抽取可用于文本中實(shí)體對(duì)之間語(yǔ)義關(guān)系的識(shí)別,在文本的語(yǔ)義理解和知識(shí)圖譜的構(gòu)建及完善中發(fā)揮著重要作用。基于神經(jīng)網(wǎng)絡(luò)的關(guān)系抽取方法是當(dāng)前關(guān)系抽取的主流方法之一,它可降低傳統(tǒng)自然語(yǔ)言處理中特征工程的復(fù)雜性,減少錯(cuò)誤傳播,在實(shí)際應(yīng)用中取得了較強(qiáng)的效果與泛化性。結(jié)合詞分布的向量表示和深度殘差網(wǎng)絡(luò),本文開(kāi)展了關(guān)系抽取方法的研究工作,本文的主要工作如下:1.提出了一種融合詞語(yǔ)義信息與詞位置信息的詞分布模型。首先,結(jié)合二維高斯分布擬合單詞的位置集合,用于文本的相似度計(jì)算,在此基礎(chǔ)上,給出了融合詞語(yǔ)義信息與詞位置信息的詞分布模型;其次,通過(guò)計(jì)算各個(gè)類(lèi)簇間的高頻詞與類(lèi)簇間的相似度,提出了句子級(jí)的詞分布向量表示方法;最后,通過(guò)計(jì)算單詞與各個(gè)類(lèi)簇間的相似度,并結(jié)合關(guān)系文本聚類(lèi),提出了單詞級(jí)的詞分布向量表示方法。實(shí)驗(yàn)結(jié)果表明:在遠(yuǎn)程監(jiān)督數(shù)據(jù)Wiki和NYT上,本文提出的結(jié)合詞分布模型的單詞級(jí)向量方法比文獻(xiàn)中的方法具有更好的效果。2... 

【文章來(lái)源】:重慶郵電大學(xué)重慶市

【文章頁(yè)數(shù)】:69 頁(yè)

【學(xué)位級(jí)別】:碩士

【部分圖文】:

基于詞分布和深度殘差網(wǎng)絡(luò)的關(guān)系抽取方法研究


關(guān)系抽取示意圖

模型圖,模型,文本,聚類(lèi)


重慶郵電大學(xué)碩士學(xué)位論文第2章相關(guān)技術(shù)介紹10圖2.1CBOW模型圖2.2Skip-Gram模型2.2關(guān)系文本聚類(lèi)在文本信息結(jié)構(gòu)化的研究中,首先面對(duì)的任務(wù)就是對(duì)文本信息的梳理,從原本雜亂無(wú)章的文本中獲取相對(duì)條理化的信息文本。如何快速、準(zhǔn)確、全面獲取信息以及快速高效地進(jìn)行信息的梳理,進(jìn)而找到用戶所需,是當(dāng)前的急切需要。聚類(lèi)技術(shù)是完成文本信息結(jié)構(gòu)化這一過(guò)程的重要技術(shù)之一。聚類(lèi)的概念是在無(wú)監(jiān)督的情況下,將物理或抽象樣本的集合劃分為相似樣本的過(guò)程。一般來(lái)講,同一類(lèi)別內(nèi)的樣本會(huì)具有較高的相似度,而不同類(lèi)別中的樣本則相似度較低。文本聚類(lèi)是將聚類(lèi)技術(shù)用于自然語(yǔ)言處理領(lǐng)域的研究方法,其具體的方法是在缺少類(lèi)別標(biāo)簽的定義和標(biāo)注文本的情況下,通過(guò)無(wú)監(jiān)督學(xué)習(xí)的方法,自動(dòng)產(chǎn)生文本的類(lèi)別標(biāo)簽,并將文本劃分到相應(yīng)類(lèi)別的過(guò)程。文本聚類(lèi)技術(shù)是文本信息處理研究

模型圖,模型,文本,聚類(lèi)


重慶郵電大學(xué)碩士學(xué)位論文第2章相關(guān)技術(shù)介紹10圖2.1CBOW模型圖2.2Skip-Gram模型2.2關(guān)系文本聚類(lèi)在文本信息結(jié)構(gòu)化的研究中,首先面對(duì)的任務(wù)就是對(duì)文本信息的梳理,從原本雜亂無(wú)章的文本中獲取相對(duì)條理化的信息文本。如何快速、準(zhǔn)確、全面獲取信息以及快速高效地進(jìn)行信息的梳理,進(jìn)而找到用戶所需,是當(dāng)前的急切需要。聚類(lèi)技術(shù)是完成文本信息結(jié)構(gòu)化這一過(guò)程的重要技術(shù)之一。聚類(lèi)的概念是在無(wú)監(jiān)督的情況下,將物理或抽象樣本的集合劃分為相似樣本的過(guò)程。一般來(lái)講,同一類(lèi)別內(nèi)的樣本會(huì)具有較高的相似度,而不同類(lèi)別中的樣本則相似度較低。文本聚類(lèi)是將聚類(lèi)技術(shù)用于自然語(yǔ)言處理領(lǐng)域的研究方法,其具體的方法是在缺少類(lèi)別標(biāo)簽的定義和標(biāo)注文本的情況下,通過(guò)無(wú)監(jiān)督學(xué)習(xí)的方法,自動(dòng)產(chǎn)生文本的類(lèi)別標(biāo)簽,并將文本劃分到相應(yīng)類(lèi)別的過(guò)程。文本聚類(lèi)技術(shù)是文本信息處理研究

【參考文獻(xiàn)】:
期刊論文
[1]基于Deep Belief Nets的中文名實(shí)體關(guān)系抽取[J]. 陳宇,鄭德權(quán),趙鐵軍.  軟件學(xué)報(bào). 2012(10)
[2]實(shí)體關(guān)系抽取的技術(shù)方法綜述[J]. 徐健,張智雄,吳振新.  現(xiàn)代圖書(shū)情報(bào)技術(shù). 2008(08)
[3]中文事件抽取技術(shù)研究[J]. 趙妍妍,秦兵,車(chē)萬(wàn)翔,劉挺.  中文信息學(xué)報(bào). 2008(01)
[4]自然語(yǔ)言處理及其應(yīng)用前景的研究[J]. 王挺,麥范金,劉忠.  桂林航天工業(yè)高等專(zhuān)科學(xué)校學(xué)報(bào). 2006(04)
[5]實(shí)體關(guān)系自動(dòng)抽取[J]. 車(chē)萬(wàn)翔,劉挺,李生.  中文信息學(xué)報(bào). 2005(02)
[6]基于聚類(lèi)的文本過(guò)濾模型[J]. 林鴻飛,馬雅彬.  大連理工大學(xué)學(xué)報(bào). 2002(02)

博士論文
[1]綠色通信網(wǎng)絡(luò)的節(jié)能方法研究[D]. 郭秉義.華南理工大學(xué) 2014

碩士論文
[1]下一代接入網(wǎng)節(jié)能技術(shù)研究[D]. 郭曉達(dá).北京郵電大學(xué) 2013



本文編號(hào):3248269

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3248269.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶5c748***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com