否定信息識別研究
發(fā)布時間:2021-03-06 07:42
否定是存在于所有語言中一種復(fù)雜的語言現(xiàn)象,能對句子或詞語包含的語義信息進(jìn)行反轉(zhuǎn)。越來越多的自然語言處理任務(wù)需要從文本信息中挖掘出有價(jià)值的信息,否定的存在將會導(dǎo)致挖掘到無用甚至完全相反含義的信息,對任務(wù)的性能產(chǎn)生消極影響。因此,需要對否定信息進(jìn)行識別,將文本信息中肯定信息與否定信息分離,并進(jìn)一步識別出否定的作用范圍,從而獲得句子表達(dá)的正確含義,同時也能提升情感分析、信息檢索、信息抽取等任務(wù)的性能。本文主要圍繞漢語和英語的否定觸發(fā)詞識別任務(wù)、否定覆蓋域識別展開了以下工作:1)使用雙向長短期記憶網(wǎng)絡(luò)結(jié)合條件隨機(jī)場為模型對漢語和英語分別進(jìn)行否定觸發(fā)詞識別和否定覆蓋域識別。該模型能夠克服條件隨機(jī)場嚴(yán)重依賴人工提取特征的缺點(diǎn)和雙向長短期記憶網(wǎng)絡(luò)沒有從全局考慮標(biāo)簽序列的缺點(diǎn),僅以預(yù)訓(xùn)練的詞向量作為輸入進(jìn)行否定觸發(fā)詞識別,在此基礎(chǔ)上添加標(biāo)準(zhǔn)觸發(fā)詞特征進(jìn)行否定覆蓋域識別。實(shí)驗(yàn)證明:在漢語和英語語料上,基于該模型的否定觸發(fā)詞識別和否定覆蓋域識別都獲得了較好的實(shí)驗(yàn)結(jié)果,并且該模型在英語語料的生物醫(yī)學(xué)領(lǐng)域不同文本之間具有較強(qiáng)的泛化能力。2)融合自注意力機(jī)制進(jìn)行否定覆蓋域識別。針對否定覆蓋域較長時難以識別完整的...
【文章來源】:重慶大學(xué)重慶市 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:64 頁
【學(xué)位級別】:碩士
【部分圖文】:
圖2.1條件隨機(jī)場模型
重慶大學(xué)碩士學(xué)位論文2理論基礎(chǔ)9圖2.2鏈?zhǔn)綏l件隨機(jī)場模型Fig2.2LinearChainConditionalRandomFieldsmodel鏈?zhǔn)紺RF模型在處理序列標(biāo)注問題時,對相鄰標(biāo)簽之間建立了聯(lián)系,它在輸出Y序列時,考慮了整個Y序列在X條件下的概率,并將概率最大的Y序列作為輸出的預(yù)測序列,因此鏈?zhǔn)紺RF不僅能學(xué)習(xí)到輸入的特征,還能從標(biāo)簽之間學(xué)習(xí)到隱藏的關(guān)系,提高模型對序列標(biāo)注問題的識別能力。但是和所有統(tǒng)計(jì)機(jī)器學(xué)習(xí)模型一樣,它需要的輸入是特征,特征提取的數(shù)目和質(zhì)量將會極大的影響到模型的效果,并且特征的提取耗費(fèi)時間和人力且人力上要求需要具備相關(guān)知識。2.1.2標(biāo)準(zhǔn)RNN模型循環(huán)神經(jīng)網(wǎng)絡(luò)(RecurrentNeuralNetwork,RNN)模型和普通網(wǎng)絡(luò)相比具有“記憶”的能力,是專門用于處理具有時序性數(shù)據(jù)問題的深度學(xué)習(xí)模型。RNN的基本形式如圖2.3所示。圖2.3循環(huán)神經(jīng)網(wǎng)絡(luò)按時間步展開Fig2.3RNNexpandsbytimestep
重慶大學(xué)碩士學(xué)位論文2理論基礎(chǔ)9圖2.2鏈?zhǔn)綏l件隨機(jī)場模型Fig2.2LinearChainConditionalRandomFieldsmodel鏈?zhǔn)紺RF模型在處理序列標(biāo)注問題時,對相鄰標(biāo)簽之間建立了聯(lián)系,它在輸出Y序列時,考慮了整個Y序列在X條件下的概率,并將概率最大的Y序列作為輸出的預(yù)測序列,因此鏈?zhǔn)紺RF不僅能學(xué)習(xí)到輸入的特征,還能從標(biāo)簽之間學(xué)習(xí)到隱藏的關(guān)系,提高模型對序列標(biāo)注問題的識別能力。但是和所有統(tǒng)計(jì)機(jī)器學(xué)習(xí)模型一樣,它需要的輸入是特征,特征提取的數(shù)目和質(zhì)量將會極大的影響到模型的效果,并且特征的提取耗費(fèi)時間和人力且人力上要求需要具備相關(guān)知識。2.1.2標(biāo)準(zhǔn)RNN模型循環(huán)神經(jīng)網(wǎng)絡(luò)(RecurrentNeuralNetwork,RNN)模型和普通網(wǎng)絡(luò)相比具有“記憶”的能力,是專門用于處理具有時序性數(shù)據(jù)問題的深度學(xué)習(xí)模型。RNN的基本形式如圖2.3所示。圖2.3循環(huán)神經(jīng)網(wǎng)絡(luò)按時間步展開Fig2.3RNNexpandsbytimestep
【參考文獻(xiàn)】:
期刊論文
[1]基于雙向LSTM網(wǎng)絡(luò)的不確定和否定作用范圍識別[J]. 錢忠,李培峰,周國棟,朱巧明. 軟件學(xué)報(bào). 2018(08)
[2]否定信息識別研究綜述[J]. 唐凡,伍星. 計(jì)算機(jī)工程與應(yīng)用. 2017(12)
[3]面向自然語言文本的否定性與不確定性信息抽取[J]. 鄒博偉,錢忠,陳站成,朱巧明,周國棟. 軟件學(xué)報(bào). 2016(02)
[4]否定句的情感不確定性度量及分類[J]. 張志飛,苗奪謙,聶建云,岳曉冬. 計(jì)算機(jī)研究與發(fā)展. 2015(08)
[5]否定與不確定信息抽取研究綜述[J]. 鄒博偉,周國棟,朱巧明. 中文信息學(xué)報(bào). 2015(04)
碩士論文
[1]基于深度學(xué)習(xí)的漢語否定信息識別研究[D]. 唐凡.重慶大學(xué) 2017
[2]漢語否定與不確定信息識別研究[D]. 陳站成.蘇州大學(xué) 2014
本文編號:3066700
【文章來源】:重慶大學(xué)重慶市 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:64 頁
【學(xué)位級別】:碩士
【部分圖文】:
圖2.1條件隨機(jī)場模型
重慶大學(xué)碩士學(xué)位論文2理論基礎(chǔ)9圖2.2鏈?zhǔn)綏l件隨機(jī)場模型Fig2.2LinearChainConditionalRandomFieldsmodel鏈?zhǔn)紺RF模型在處理序列標(biāo)注問題時,對相鄰標(biāo)簽之間建立了聯(lián)系,它在輸出Y序列時,考慮了整個Y序列在X條件下的概率,并將概率最大的Y序列作為輸出的預(yù)測序列,因此鏈?zhǔn)紺RF不僅能學(xué)習(xí)到輸入的特征,還能從標(biāo)簽之間學(xué)習(xí)到隱藏的關(guān)系,提高模型對序列標(biāo)注問題的識別能力。但是和所有統(tǒng)計(jì)機(jī)器學(xué)習(xí)模型一樣,它需要的輸入是特征,特征提取的數(shù)目和質(zhì)量將會極大的影響到模型的效果,并且特征的提取耗費(fèi)時間和人力且人力上要求需要具備相關(guān)知識。2.1.2標(biāo)準(zhǔn)RNN模型循環(huán)神經(jīng)網(wǎng)絡(luò)(RecurrentNeuralNetwork,RNN)模型和普通網(wǎng)絡(luò)相比具有“記憶”的能力,是專門用于處理具有時序性數(shù)據(jù)問題的深度學(xué)習(xí)模型。RNN的基本形式如圖2.3所示。圖2.3循環(huán)神經(jīng)網(wǎng)絡(luò)按時間步展開Fig2.3RNNexpandsbytimestep
重慶大學(xué)碩士學(xué)位論文2理論基礎(chǔ)9圖2.2鏈?zhǔn)綏l件隨機(jī)場模型Fig2.2LinearChainConditionalRandomFieldsmodel鏈?zhǔn)紺RF模型在處理序列標(biāo)注問題時,對相鄰標(biāo)簽之間建立了聯(lián)系,它在輸出Y序列時,考慮了整個Y序列在X條件下的概率,并將概率最大的Y序列作為輸出的預(yù)測序列,因此鏈?zhǔn)紺RF不僅能學(xué)習(xí)到輸入的特征,還能從標(biāo)簽之間學(xué)習(xí)到隱藏的關(guān)系,提高模型對序列標(biāo)注問題的識別能力。但是和所有統(tǒng)計(jì)機(jī)器學(xué)習(xí)模型一樣,它需要的輸入是特征,特征提取的數(shù)目和質(zhì)量將會極大的影響到模型的效果,并且特征的提取耗費(fèi)時間和人力且人力上要求需要具備相關(guān)知識。2.1.2標(biāo)準(zhǔn)RNN模型循環(huán)神經(jīng)網(wǎng)絡(luò)(RecurrentNeuralNetwork,RNN)模型和普通網(wǎng)絡(luò)相比具有“記憶”的能力,是專門用于處理具有時序性數(shù)據(jù)問題的深度學(xué)習(xí)模型。RNN的基本形式如圖2.3所示。圖2.3循環(huán)神經(jīng)網(wǎng)絡(luò)按時間步展開Fig2.3RNNexpandsbytimestep
【參考文獻(xiàn)】:
期刊論文
[1]基于雙向LSTM網(wǎng)絡(luò)的不確定和否定作用范圍識別[J]. 錢忠,李培峰,周國棟,朱巧明. 軟件學(xué)報(bào). 2018(08)
[2]否定信息識別研究綜述[J]. 唐凡,伍星. 計(jì)算機(jī)工程與應(yīng)用. 2017(12)
[3]面向自然語言文本的否定性與不確定性信息抽取[J]. 鄒博偉,錢忠,陳站成,朱巧明,周國棟. 軟件學(xué)報(bào). 2016(02)
[4]否定句的情感不確定性度量及分類[J]. 張志飛,苗奪謙,聶建云,岳曉冬. 計(jì)算機(jī)研究與發(fā)展. 2015(08)
[5]否定與不確定信息抽取研究綜述[J]. 鄒博偉,周國棟,朱巧明. 中文信息學(xué)報(bào). 2015(04)
碩士論文
[1]基于深度學(xué)習(xí)的漢語否定信息識別研究[D]. 唐凡.重慶大學(xué) 2017
[2]漢語否定與不確定信息識別研究[D]. 陳站成.蘇州大學(xué) 2014
本文編號:3066700
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/3066700.html
最近更新
教材專著