基于深度學(xué)習(xí)的文本分類方法研究
發(fā)布時(shí)間:2022-07-03 18:31
人工智能出現(xiàn)的意義是讓機(jī)器自動(dòng)的處理某些任務(wù),希望處理結(jié)果能夠達(dá)到人類水平或者超越人類水平。人工智能技術(shù)目前已經(jīng)在教育,金融,醫(yī)療等多個(gè)領(lǐng)域?qū)崿F(xiàn)技術(shù)落地,而且應(yīng)用場景還在不斷擴(kuò)大。但是目前人工智能技術(shù)在很多方面仍存在些許不足。自然語言處理作為人工智能的一個(gè)子領(lǐng)域,目前仍然存在由于語言多樣性,語義復(fù)雜性,導(dǎo)致機(jī)器不能充分理解人類語言這一重大難題,同時(shí)這也是業(yè)界眾多學(xué)者共同面臨的難題。本文針對自然語言處理方向中文文本分類這一細(xì)分領(lǐng)域中出現(xiàn)的語義理解不足,模型實(shí)際可用性不夠好等問題進(jìn)行了深入研究,研究成果如下:(1)針對現(xiàn)有常用模型處理實(shí)際特定領(lǐng)域文本情感分類準(zhǔn)確度不高這一問題,同時(shí)考慮實(shí)際文本復(fù)雜情況,本文提出了一種優(yōu)化算法。該方法基于經(jīng)典算法模型BERT,優(yōu)化了傳統(tǒng)文本情感分類算法和主流文本情感分類算法。該算法采用3段式的學(xué)習(xí)方法,通過使用垂直領(lǐng)域數(shù)據(jù)進(jìn)行增強(qiáng)學(xué)習(xí),極大的增強(qiáng)了模型的語義情感理解效果。對比傳統(tǒng)文本分類模型和主流文本分類模型,該算法的驗(yàn)證集準(zhǔn)確度有較大的提升。最后將模型應(yīng)用到實(shí)際生活中,完成了一個(gè)簡單案例展示,最終取得了比較好的實(shí)際應(yīng)用效果。(2)針對主流文本分類模型BER...
【文章頁數(shù)】:58 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
abstract
第一章 緒論
1.1 研究背景
1.2 國內(nèi)外研究現(xiàn)狀
1.3 論文主要內(nèi)容
1.4 論文組織結(jié)構(gòu)
第二章 相關(guān)理論及技術(shù)介紹
2.1 Word2Vec模型介紹
2.1.1 模型概述
2.1.2 CBOW
2.1.3 Skip-gram
2.1.4 優(yōu)化技巧
2.2 LSTM模型介紹
2.3 BERT模型介紹
2.4 XLNet模型介紹
2.5 遷移學(xué)習(xí)介紹
2.6 本章小結(jié)
第三章 基于BERT模型的文本情感分類方法優(yōu)化
3.1 引言
3.2 文本情感分類的分析與研究
3.2.1 研究任務(wù)
3.2.2 任務(wù)分析
3.2.3 相關(guān)調(diào)研
3.3 算法框架
3.4 基于BERT模型的情感極性分析優(yōu)化算法設(shè)計(jì)
3.4.1 傳統(tǒng)文本情感分類算法分析
3.4.2 基于BERT模型的情感極性分析優(yōu)化算法
3.4.3 基于BERT模型的情感極性分析優(yōu)化算法的具體實(shí)現(xiàn)
3.5 實(shí)驗(yàn)詳述
3.5.1 實(shí)驗(yàn)設(shè)計(jì)
3.5.2 實(shí)驗(yàn)數(shù)據(jù)
3.5.3 優(yōu)化算法實(shí)驗(yàn)流程
3.5.4 基于Word2Vec和 LSTM模型的參數(shù)設(shè)置
3.5.5 基于BERT和 LSTM模型的參數(shù)設(shè)置
3.5.6 實(shí)驗(yàn)環(huán)境
3.5.7 評價(jià)指標(biāo)
3.6 實(shí)驗(yàn)結(jié)果分析
3.7 案例展示
3.8 本章小結(jié)
第四章 基于XLNet模型的文本分類方法優(yōu)化
4.1 引言
4.2 算法設(shè)計(jì)
4.2.1 XLNet模型
4.2.2 基于XLNet模型的文本分類優(yōu)化算法
4.3 實(shí)驗(yàn)詳述
4.3.1 實(shí)驗(yàn)設(shè)計(jì)
4.3.2 實(shí)驗(yàn)原始數(shù)據(jù)
4.3.3 實(shí)驗(yàn)流程
4.3.4 實(shí)驗(yàn)優(yōu)化及問題處理
4.3.5 參數(shù)設(shè)置
4.3.6 評價(jià)指標(biāo)
4.4 實(shí)驗(yàn)結(jié)果與分析
4.5 本章小結(jié)
第五章 總結(jié)與展望
5.1 總結(jié)
5.2 展望
參考文獻(xiàn)
發(fā)表論文和科研情況說明
致謝
【參考文獻(xiàn)】:
期刊論文
[1]基于NER的石油非結(jié)構(gòu)化信息抽取研究[J]. 鐘原,劉小溶,王杰,陳雁,張?zhí)? 西南石油大學(xué)學(xué)報(bào)(自然科學(xué)版). 2020(06)
[2]基于BiLSTM-CRF的軍事命名實(shí)體識(shí)別方法[J]. 高學(xué)攀,杜楚,吳金亮. 無線電工程. 2020(12)
[3]基于分層最大邊緣相關(guān)的柬語多文檔抽取式摘要方法[J]. 曾昭霖,嚴(yán)馨,余兵兵,周楓,徐廣義. 河北科技大學(xué)學(xué)報(bào). 2020(06)
[4]基于CNN-BGRU-CRF的中文電子病歷實(shí)體抽取方法[J]. 馮云霞,衣鵬,韓正亮,宋波. 計(jì)算機(jī)與現(xiàn)代化. 2020(11)
[5]基于ELMO-CNN-BiLSTM-CRF模型的地質(zhì)實(shí)體識(shí)別[J]. 儲(chǔ)德平,萬波,李紅,方芳,王潤. 地球科學(xué). 2021(08)
[6]基于上下文相關(guān)字向量的中文命名實(shí)體識(shí)別[J]. 張棟,陳文亮. 計(jì)算機(jī)科學(xué). 2021(03)
[7]無監(jiān)督的句法可控復(fù)述模型用于對抗樣本生成[J]. 楊二光,劉明童,張玉潔,孟遙,胡長建,徐金安,陳鈺楓. 北京大學(xué)學(xué)報(bào)(自然科學(xué)版). 2021(01)
[8]一種基于改進(jìn)邏輯回歸算法實(shí)現(xiàn)模型在線調(diào)參方法[J]. 余韋,余鳳麗,吉晶,楊猛. 通信技術(shù). 2020(08)
[9]營銷數(shù)據(jù)清洗及治理方法的研究及應(yīng)用[J]. 梁衛(wèi)寧,周鈺書,唐文彬,劉森,陳玲娜. 信息技術(shù)與信息化. 2020(07)
[10]淺談人工智能時(shí)代背景下自然語言處理技術(shù)的發(fā)展應(yīng)用[J]. 趙園丁. 辦公自動(dòng)化. 2019(10)
博士論文
[1]基于深度模型的零樣本遷移學(xué)習(xí)[D]. 宋杰.浙江大學(xué) 2020
碩士論文
[1]基于深度學(xué)習(xí)的智能問答系統(tǒng)研究[D]. 李敬鑫.電子科技大學(xué) 2020
[2]基于深度學(xué)習(xí)的文本分類問題研究[D]. 潘成龍.華中科技大學(xué) 2019
[3]基于GRU神經(jīng)網(wǎng)絡(luò)的時(shí)間序列預(yù)測研究[D]. 劉洋.成都理工大學(xué) 2017
[4]基于Attention-Based LSTM模型的文本分類技術(shù)的研究[D]. 張沖.南京大學(xué) 2016
本文編號(hào):3655428
【文章頁數(shù)】:58 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
abstract
第一章 緒論
1.1 研究背景
1.2 國內(nèi)外研究現(xiàn)狀
1.3 論文主要內(nèi)容
1.4 論文組織結(jié)構(gòu)
第二章 相關(guān)理論及技術(shù)介紹
2.1 Word2Vec模型介紹
2.1.1 模型概述
2.1.2 CBOW
2.1.3 Skip-gram
2.1.4 優(yōu)化技巧
2.2 LSTM模型介紹
2.3 BERT模型介紹
2.4 XLNet模型介紹
2.5 遷移學(xué)習(xí)介紹
2.6 本章小結(jié)
第三章 基于BERT模型的文本情感分類方法優(yōu)化
3.1 引言
3.2 文本情感分類的分析與研究
3.2.1 研究任務(wù)
3.2.2 任務(wù)分析
3.2.3 相關(guān)調(diào)研
3.3 算法框架
3.4 基于BERT模型的情感極性分析優(yōu)化算法設(shè)計(jì)
3.4.1 傳統(tǒng)文本情感分類算法分析
3.4.2 基于BERT模型的情感極性分析優(yōu)化算法
3.4.3 基于BERT模型的情感極性分析優(yōu)化算法的具體實(shí)現(xiàn)
3.5 實(shí)驗(yàn)詳述
3.5.1 實(shí)驗(yàn)設(shè)計(jì)
3.5.2 實(shí)驗(yàn)數(shù)據(jù)
3.5.3 優(yōu)化算法實(shí)驗(yàn)流程
3.5.4 基于Word2Vec和 LSTM模型的參數(shù)設(shè)置
3.5.5 基于BERT和 LSTM模型的參數(shù)設(shè)置
3.5.6 實(shí)驗(yàn)環(huán)境
3.5.7 評價(jià)指標(biāo)
3.6 實(shí)驗(yàn)結(jié)果分析
3.7 案例展示
3.8 本章小結(jié)
第四章 基于XLNet模型的文本分類方法優(yōu)化
4.1 引言
4.2 算法設(shè)計(jì)
4.2.1 XLNet模型
4.2.2 基于XLNet模型的文本分類優(yōu)化算法
4.3 實(shí)驗(yàn)詳述
4.3.1 實(shí)驗(yàn)設(shè)計(jì)
4.3.2 實(shí)驗(yàn)原始數(shù)據(jù)
4.3.3 實(shí)驗(yàn)流程
4.3.4 實(shí)驗(yàn)優(yōu)化及問題處理
4.3.5 參數(shù)設(shè)置
4.3.6 評價(jià)指標(biāo)
4.4 實(shí)驗(yàn)結(jié)果與分析
4.5 本章小結(jié)
第五章 總結(jié)與展望
5.1 總結(jié)
5.2 展望
參考文獻(xiàn)
發(fā)表論文和科研情況說明
致謝
【參考文獻(xiàn)】:
期刊論文
[1]基于NER的石油非結(jié)構(gòu)化信息抽取研究[J]. 鐘原,劉小溶,王杰,陳雁,張?zhí)? 西南石油大學(xué)學(xué)報(bào)(自然科學(xué)版). 2020(06)
[2]基于BiLSTM-CRF的軍事命名實(shí)體識(shí)別方法[J]. 高學(xué)攀,杜楚,吳金亮. 無線電工程. 2020(12)
[3]基于分層最大邊緣相關(guān)的柬語多文檔抽取式摘要方法[J]. 曾昭霖,嚴(yán)馨,余兵兵,周楓,徐廣義. 河北科技大學(xué)學(xué)報(bào). 2020(06)
[4]基于CNN-BGRU-CRF的中文電子病歷實(shí)體抽取方法[J]. 馮云霞,衣鵬,韓正亮,宋波. 計(jì)算機(jī)與現(xiàn)代化. 2020(11)
[5]基于ELMO-CNN-BiLSTM-CRF模型的地質(zhì)實(shí)體識(shí)別[J]. 儲(chǔ)德平,萬波,李紅,方芳,王潤. 地球科學(xué). 2021(08)
[6]基于上下文相關(guān)字向量的中文命名實(shí)體識(shí)別[J]. 張棟,陳文亮. 計(jì)算機(jī)科學(xué). 2021(03)
[7]無監(jiān)督的句法可控復(fù)述模型用于對抗樣本生成[J]. 楊二光,劉明童,張玉潔,孟遙,胡長建,徐金安,陳鈺楓. 北京大學(xué)學(xué)報(bào)(自然科學(xué)版). 2021(01)
[8]一種基于改進(jìn)邏輯回歸算法實(shí)現(xiàn)模型在線調(diào)參方法[J]. 余韋,余鳳麗,吉晶,楊猛. 通信技術(shù). 2020(08)
[9]營銷數(shù)據(jù)清洗及治理方法的研究及應(yīng)用[J]. 梁衛(wèi)寧,周鈺書,唐文彬,劉森,陳玲娜. 信息技術(shù)與信息化. 2020(07)
[10]淺談人工智能時(shí)代背景下自然語言處理技術(shù)的發(fā)展應(yīng)用[J]. 趙園丁. 辦公自動(dòng)化. 2019(10)
博士論文
[1]基于深度模型的零樣本遷移學(xué)習(xí)[D]. 宋杰.浙江大學(xué) 2020
碩士論文
[1]基于深度學(xué)習(xí)的智能問答系統(tǒng)研究[D]. 李敬鑫.電子科技大學(xué) 2020
[2]基于深度學(xué)習(xí)的文本分類問題研究[D]. 潘成龍.華中科技大學(xué) 2019
[3]基于GRU神經(jīng)網(wǎng)絡(luò)的時(shí)間序列預(yù)測研究[D]. 劉洋.成都理工大學(xué) 2017
[4]基于Attention-Based LSTM模型的文本分類技術(shù)的研究[D]. 張沖.南京大學(xué) 2016
本文編號(hào):3655428
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/3655428.html
最近更新
教材專著