基于神經(jīng)網(wǎng)絡(luò)的中文命名實體識別技術(shù)研究與實現(xiàn)
發(fā)布時間:2021-01-07 17:21
隨著網(wǎng)絡(luò)時代的來臨,互聯(lián)網(wǎng)已成為最重要的信息載體。網(wǎng)絡(luò)社交媒體中的文本信息量每日劇增,自然語言處理的一個重要目標(biāo)就是在這些大規(guī)模數(shù)據(jù)中挖掘和理解有價值的信息。在一系列相關(guān)應(yīng)用中(比如機(jī)器翻譯、知識圖譜、人物關(guān)系圖譜),命名實體識別、實體鏈接等基礎(chǔ)技術(shù)都是關(guān)鍵的底層技術(shù)。在文檔中,命名實體(如人名、地名、公司名,地點等)是基本的信息元素,往往指示了文章的主要內(nèi)容。命名實體識別的任務(wù)就是定位這些有意義的信息,并正確的標(biāo)識出信息的類別屬性。得到實體和實體類別后將結(jié)果傳遞給后續(xù)的實體消歧、實體鏈接工作。因此,命名實體識別是知識圖譜構(gòu)建、信息抽取等領(lǐng)域的基礎(chǔ)技術(shù)鏈上最重要的關(guān)鍵環(huán)節(jié)之一。另外,對于文摘生成,機(jī)器翻譯等很多自然語言處理任務(wù),命名實體對于文本也有特殊地位。在文摘生成中,填充內(nèi)容大多是對“誰“、“干什么”、“什么時候”、“在哪里”等問題的回答,其中一些問題剛好對應(yīng)了人名、地名、時間等實體類別;在在機(jī)器翻譯中,專有名詞(通常為命名實體)往往由于音譯(比如人名唐納德特朗普)、歷史文化等的原因更難翻譯。中文命名實體識別任務(wù)總體和英文是相似的,但因為中文語言本身的特點(詞匯大、需要分詞、沒有大...
【文章來源】:國防科技大學(xué)湖南省 211工程院校 985工程院校
【文章頁數(shù)】:62 頁
【學(xué)位級別】:碩士
【部分圖文】:
論文組織結(jié)構(gòu)圖
圖2.1命名實體識別分界分類示例2.6.1 隱馬爾可夫模型隱馬爾可夫模型(Hidden Markov Model,簡稱HMM)是基于統(tǒng)計學(xué)的標(biāo)注問題分類器模型,由隱藏的馬爾可夫鏈隨機(jī)生成不可觀測的狀態(tài)隨機(jī)序列,再由各個狀態(tài)量生成觀測量構(gòu)成觀測序列[23]。隱馬爾可夫模型由三個關(guān)鍵要素:初始概率分布、狀態(tài)轉(zhuǎn)移分布、觀測概率分布確定。圖2.2隱馬爾可夫模型圖如圖2.2,定義Q = q1, q2, . . . , qN為所有可能的隱藏狀態(tài)集合,V = v1, v2, . . . , vM為所有可能的觀測狀態(tài)集合;H = (h1, h2, . . . , hT)為隱藏狀態(tài)序列,O =
圖2.1命名實體識別分界分類示例.1 隱馬爾可夫模型爾可夫模型(Hidden Markov Model,簡稱HMM)是基于統(tǒng)計器模型,由隱藏的馬爾可夫鏈隨機(jī)生成不可觀測的狀態(tài)隨機(jī)序量生成觀測量構(gòu)成觀測序列[23]。隱馬爾可夫模型由三個關(guān)鍵布、狀態(tài)轉(zhuǎn)移分布、觀測概率分布確定。
本文編號:2962939
【文章來源】:國防科技大學(xué)湖南省 211工程院校 985工程院校
【文章頁數(shù)】:62 頁
【學(xué)位級別】:碩士
【部分圖文】:
論文組織結(jié)構(gòu)圖
圖2.1命名實體識別分界分類示例2.6.1 隱馬爾可夫模型隱馬爾可夫模型(Hidden Markov Model,簡稱HMM)是基于統(tǒng)計學(xué)的標(biāo)注問題分類器模型,由隱藏的馬爾可夫鏈隨機(jī)生成不可觀測的狀態(tài)隨機(jī)序列,再由各個狀態(tài)量生成觀測量構(gòu)成觀測序列[23]。隱馬爾可夫模型由三個關(guān)鍵要素:初始概率分布、狀態(tài)轉(zhuǎn)移分布、觀測概率分布確定。圖2.2隱馬爾可夫模型圖如圖2.2,定義Q = q1, q2, . . . , qN為所有可能的隱藏狀態(tài)集合,V = v1, v2, . . . , vM為所有可能的觀測狀態(tài)集合;H = (h1, h2, . . . , hT)為隱藏狀態(tài)序列,O =
圖2.1命名實體識別分界分類示例.1 隱馬爾可夫模型爾可夫模型(Hidden Markov Model,簡稱HMM)是基于統(tǒng)計器模型,由隱藏的馬爾可夫鏈隨機(jī)生成不可觀測的狀態(tài)隨機(jī)序量生成觀測量構(gòu)成觀測序列[23]。隱馬爾可夫模型由三個關(guān)鍵布、狀態(tài)轉(zhuǎn)移分布、觀測概率分布確定。
本文編號:2962939
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/2962939.html
最近更新
教材專著