否定信息識別研究
發(fā)布時間:2021-03-06 07:42
否定是存在于所有語言中一種復雜的語言現(xiàn)象,能對句子或詞語包含的語義信息進行反轉(zhuǎn)。越來越多的自然語言處理任務(wù)需要從文本信息中挖掘出有價值的信息,否定的存在將會導致挖掘到無用甚至完全相反含義的信息,對任務(wù)的性能產(chǎn)生消極影響。因此,需要對否定信息進行識別,將文本信息中肯定信息與否定信息分離,并進一步識別出否定的作用范圍,從而獲得句子表達的正確含義,同時也能提升情感分析、信息檢索、信息抽取等任務(wù)的性能。本文主要圍繞漢語和英語的否定觸發(fā)詞識別任務(wù)、否定覆蓋域識別展開了以下工作:1)使用雙向長短期記憶網(wǎng)絡(luò)結(jié)合條件隨機場為模型對漢語和英語分別進行否定觸發(fā)詞識別和否定覆蓋域識別。該模型能夠克服條件隨機場嚴重依賴人工提取特征的缺點和雙向長短期記憶網(wǎng)絡(luò)沒有從全局考慮標簽序列的缺點,僅以預(yù)訓練的詞向量作為輸入進行否定觸發(fā)詞識別,在此基礎(chǔ)上添加標準觸發(fā)詞特征進行否定覆蓋域識別。實驗證明:在漢語和英語語料上,基于該模型的否定觸發(fā)詞識別和否定覆蓋域識別都獲得了較好的實驗結(jié)果,并且該模型在英語語料的生物醫(yī)學領(lǐng)域不同文本之間具有較強的泛化能力。2)融合自注意力機制進行否定覆蓋域識別。針對否定覆蓋域較長時難以識別完整的...
【文章來源】:重慶大學重慶市 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:64 頁
【學位級別】:碩士
【部分圖文】:
圖2.1條件隨機場模型
重慶大學碩士學位論文2理論基礎(chǔ)9圖2.2鏈式條件隨機場模型Fig2.2LinearChainConditionalRandomFieldsmodel鏈式CRF模型在處理序列標注問題時,對相鄰標簽之間建立了聯(lián)系,它在輸出Y序列時,考慮了整個Y序列在X條件下的概率,并將概率最大的Y序列作為輸出的預(yù)測序列,因此鏈式CRF不僅能學習到輸入的特征,還能從標簽之間學習到隱藏的關(guān)系,提高模型對序列標注問題的識別能力。但是和所有統(tǒng)計機器學習模型一樣,它需要的輸入是特征,特征提取的數(shù)目和質(zhì)量將會極大的影響到模型的效果,并且特征的提取耗費時間和人力且人力上要求需要具備相關(guān)知識。2.1.2標準RNN模型循環(huán)神經(jīng)網(wǎng)絡(luò)(RecurrentNeuralNetwork,RNN)模型和普通網(wǎng)絡(luò)相比具有“記憶”的能力,是專門用于處理具有時序性數(shù)據(jù)問題的深度學習模型。RNN的基本形式如圖2.3所示。圖2.3循環(huán)神經(jīng)網(wǎng)絡(luò)按時間步展開Fig2.3RNNexpandsbytimestep
重慶大學碩士學位論文2理論基礎(chǔ)9圖2.2鏈式條件隨機場模型Fig2.2LinearChainConditionalRandomFieldsmodel鏈式CRF模型在處理序列標注問題時,對相鄰標簽之間建立了聯(lián)系,它在輸出Y序列時,考慮了整個Y序列在X條件下的概率,并將概率最大的Y序列作為輸出的預(yù)測序列,因此鏈式CRF不僅能學習到輸入的特征,還能從標簽之間學習到隱藏的關(guān)系,提高模型對序列標注問題的識別能力。但是和所有統(tǒng)計機器學習模型一樣,它需要的輸入是特征,特征提取的數(shù)目和質(zhì)量將會極大的影響到模型的效果,并且特征的提取耗費時間和人力且人力上要求需要具備相關(guān)知識。2.1.2標準RNN模型循環(huán)神經(jīng)網(wǎng)絡(luò)(RecurrentNeuralNetwork,RNN)模型和普通網(wǎng)絡(luò)相比具有“記憶”的能力,是專門用于處理具有時序性數(shù)據(jù)問題的深度學習模型。RNN的基本形式如圖2.3所示。圖2.3循環(huán)神經(jīng)網(wǎng)絡(luò)按時間步展開Fig2.3RNNexpandsbytimestep
【參考文獻】:
期刊論文
[1]基于雙向LSTM網(wǎng)絡(luò)的不確定和否定作用范圍識別[J]. 錢忠,李培峰,周國棟,朱巧明. 軟件學報. 2018(08)
[2]否定信息識別研究綜述[J]. 唐凡,伍星. 計算機工程與應(yīng)用. 2017(12)
[3]面向自然語言文本的否定性與不確定性信息抽取[J]. 鄒博偉,錢忠,陳站成,朱巧明,周國棟. 軟件學報. 2016(02)
[4]否定句的情感不確定性度量及分類[J]. 張志飛,苗奪謙,聶建云,岳曉冬. 計算機研究與發(fā)展. 2015(08)
[5]否定與不確定信息抽取研究綜述[J]. 鄒博偉,周國棟,朱巧明. 中文信息學報. 2015(04)
碩士論文
[1]基于深度學習的漢語否定信息識別研究[D]. 唐凡.重慶大學 2017
[2]漢語否定與不確定信息識別研究[D]. 陳站成.蘇州大學 2014
本文編號:3066700
【文章來源】:重慶大學重慶市 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:64 頁
【學位級別】:碩士
【部分圖文】:
圖2.1條件隨機場模型
重慶大學碩士學位論文2理論基礎(chǔ)9圖2.2鏈式條件隨機場模型Fig2.2LinearChainConditionalRandomFieldsmodel鏈式CRF模型在處理序列標注問題時,對相鄰標簽之間建立了聯(lián)系,它在輸出Y序列時,考慮了整個Y序列在X條件下的概率,并將概率最大的Y序列作為輸出的預(yù)測序列,因此鏈式CRF不僅能學習到輸入的特征,還能從標簽之間學習到隱藏的關(guān)系,提高模型對序列標注問題的識別能力。但是和所有統(tǒng)計機器學習模型一樣,它需要的輸入是特征,特征提取的數(shù)目和質(zhì)量將會極大的影響到模型的效果,并且特征的提取耗費時間和人力且人力上要求需要具備相關(guān)知識。2.1.2標準RNN模型循環(huán)神經(jīng)網(wǎng)絡(luò)(RecurrentNeuralNetwork,RNN)模型和普通網(wǎng)絡(luò)相比具有“記憶”的能力,是專門用于處理具有時序性數(shù)據(jù)問題的深度學習模型。RNN的基本形式如圖2.3所示。圖2.3循環(huán)神經(jīng)網(wǎng)絡(luò)按時間步展開Fig2.3RNNexpandsbytimestep
重慶大學碩士學位論文2理論基礎(chǔ)9圖2.2鏈式條件隨機場模型Fig2.2LinearChainConditionalRandomFieldsmodel鏈式CRF模型在處理序列標注問題時,對相鄰標簽之間建立了聯(lián)系,它在輸出Y序列時,考慮了整個Y序列在X條件下的概率,并將概率最大的Y序列作為輸出的預(yù)測序列,因此鏈式CRF不僅能學習到輸入的特征,還能從標簽之間學習到隱藏的關(guān)系,提高模型對序列標注問題的識別能力。但是和所有統(tǒng)計機器學習模型一樣,它需要的輸入是特征,特征提取的數(shù)目和質(zhì)量將會極大的影響到模型的效果,并且特征的提取耗費時間和人力且人力上要求需要具備相關(guān)知識。2.1.2標準RNN模型循環(huán)神經(jīng)網(wǎng)絡(luò)(RecurrentNeuralNetwork,RNN)模型和普通網(wǎng)絡(luò)相比具有“記憶”的能力,是專門用于處理具有時序性數(shù)據(jù)問題的深度學習模型。RNN的基本形式如圖2.3所示。圖2.3循環(huán)神經(jīng)網(wǎng)絡(luò)按時間步展開Fig2.3RNNexpandsbytimestep
【參考文獻】:
期刊論文
[1]基于雙向LSTM網(wǎng)絡(luò)的不確定和否定作用范圍識別[J]. 錢忠,李培峰,周國棟,朱巧明. 軟件學報. 2018(08)
[2]否定信息識別研究綜述[J]. 唐凡,伍星. 計算機工程與應(yīng)用. 2017(12)
[3]面向自然語言文本的否定性與不確定性信息抽取[J]. 鄒博偉,錢忠,陳站成,朱巧明,周國棟. 軟件學報. 2016(02)
[4]否定句的情感不確定性度量及分類[J]. 張志飛,苗奪謙,聶建云,岳曉冬. 計算機研究與發(fā)展. 2015(08)
[5]否定與不確定信息抽取研究綜述[J]. 鄒博偉,周國棟,朱巧明. 中文信息學報. 2015(04)
碩士論文
[1]基于深度學習的漢語否定信息識別研究[D]. 唐凡.重慶大學 2017
[2]漢語否定與不確定信息識別研究[D]. 陳站成.蘇州大學 2014
本文編號:3066700
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/3066700.html
最近更新
教材專著