天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 自動(dòng)化論文 >

基于神經(jīng)網(wǎng)絡(luò)的中文命名實(shí)體識(shí)別技術(shù)研究與實(shí)現(xiàn)

發(fā)布時(shí)間:2021-01-07 17:21
  隨著網(wǎng)絡(luò)時(shí)代的來臨,互聯(lián)網(wǎng)已成為最重要的信息載體。網(wǎng)絡(luò)社交媒體中的文本信息量每日劇增,自然語言處理的一個(gè)重要目標(biāo)就是在這些大規(guī)模數(shù)據(jù)中挖掘和理解有價(jià)值的信息。在一系列相關(guān)應(yīng)用中(比如機(jī)器翻譯、知識(shí)圖譜、人物關(guān)系圖譜),命名實(shí)體識(shí)別、實(shí)體鏈接等基礎(chǔ)技術(shù)都是關(guān)鍵的底層技術(shù)。在文檔中,命名實(shí)體(如人名、地名、公司名,地點(diǎn)等)是基本的信息元素,往往指示了文章的主要內(nèi)容。命名實(shí)體識(shí)別的任務(wù)就是定位這些有意義的信息,并正確的標(biāo)識(shí)出信息的類別屬性。得到實(shí)體和實(shí)體類別后將結(jié)果傳遞給后續(xù)的實(shí)體消歧、實(shí)體鏈接工作。因此,命名實(shí)體識(shí)別是知識(shí)圖譜構(gòu)建、信息抽取等領(lǐng)域的基礎(chǔ)技術(shù)鏈上最重要的關(guān)鍵環(huán)節(jié)之一。另外,對(duì)于文摘生成,機(jī)器翻譯等很多自然語言處理任務(wù),命名實(shí)體對(duì)于文本也有特殊地位。在文摘生成中,填充內(nèi)容大多是對(duì)“誰“、“干什么”、“什么時(shí)候”、“在哪里”等問題的回答,其中一些問題剛好對(duì)應(yīng)了人名、地名、時(shí)間等實(shí)體類別;在在機(jī)器翻譯中,專有名詞(通常為命名實(shí)體)往往由于音譯(比如人名唐納德特朗普)、歷史文化等的原因更難翻譯。中文命名實(shí)體識(shí)別任務(wù)總體和英文是相似的,但因?yàn)橹形恼Z言本身的特點(diǎn)(詞匯大、需要分詞、沒有大... 

【文章來源】:國防科技大學(xué)湖南省 211工程院校 985工程院校

【文章頁數(shù)】:62 頁

【學(xué)位級(jí)別】:碩士

【部分圖文】:

基于神經(jīng)網(wǎng)絡(luò)的中文命名實(shí)體識(shí)別技術(shù)研究與實(shí)現(xiàn)


論文組織結(jié)構(gòu)圖

隨機(jī)序列,隱馬爾可夫模型,示例,實(shí)體


圖2.1命名實(shí)體識(shí)別分界分類示例2.6.1 隱馬爾可夫模型隱馬爾可夫模型(Hidden Markov Model,簡稱HMM)是基于統(tǒng)計(jì)學(xué)的標(biāo)注問題分類器模型,由隱藏的馬爾可夫鏈隨機(jī)生成不可觀測(cè)的狀態(tài)隨機(jī)序列,再由各個(gè)狀態(tài)量生成觀測(cè)量構(gòu)成觀測(cè)序列[23]。隱馬爾可夫模型由三個(gè)關(guān)鍵要素:初始概率分布、狀態(tài)轉(zhuǎn)移分布、觀測(cè)概率分布確定。圖2.2隱馬爾可夫模型圖如圖2.2,定義Q = q1, q2, . . . , qN為所有可能的隱藏狀態(tài)集合,V = v1, v2, . . . , vM為所有可能的觀測(cè)狀態(tài)集合;H = (h1, h2, . . . , hT)為隱藏狀態(tài)序列,O =

隱馬爾可夫模型


圖2.1命名實(shí)體識(shí)別分界分類示例.1 隱馬爾可夫模型爾可夫模型(Hidden Markov Model,簡稱HMM)是基于統(tǒng)計(jì)器模型,由隱藏的馬爾可夫鏈隨機(jī)生成不可觀測(cè)的狀態(tài)隨機(jī)序量生成觀測(cè)量構(gòu)成觀測(cè)序列[23]。隱馬爾可夫模型由三個(gè)關(guān)鍵布、狀態(tài)轉(zhuǎn)移分布、觀測(cè)概率分布確定。


本文編號(hào):2962939

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/2962939.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶79966***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com