基于多模態(tài)的印尼語(yǔ)新聞文本分類(lèi)
發(fā)布時(shí)間:2021-09-05 02:03
隨著人工智能在人類(lèi)自然語(yǔ)言中應(yīng)用的越來(lái)越多,NLP(Natural Language Processing)在文本翻譯、詞性標(biāo)注以及實(shí)體命名等領(lǐng)域中發(fā)揮著越來(lái)越重要作用。本論文的目的是在基于將計(jì)算機(jī)視覺(jué)中的圖片信息和文本特征信息相融合的基礎(chǔ)上對(duì)文本進(jìn)行分類(lèi)處理,主要研究工作由四個(gè)部分組成。針對(duì)多模態(tài)文本分類(lèi)的詞向量問(wèn)題,設(shè)計(jì)了一種基于CBOW模型和Skip-Gram模型的SC詞向量訓(xùn)練模型;分析已有的文本分類(lèi)模型方法的優(yōu)缺點(diǎn),將已有方法進(jìn)行創(chuàng)新融合。為了提升文本分類(lèi)的準(zhǔn)確率,我們提出了融合圖片特征和文本特征的多模態(tài)文本分類(lèi)模型MTC(Multimodal Text Classification),我們用Word2vec的CBOW和Skip-Gram兩種方法對(duì)印尼語(yǔ)新聞的標(biāo)題進(jìn)行詞級(jí)的特征提取,同時(shí)也用統(tǒng)計(jì)學(xué)習(xí)的方法TF-IDF來(lái)提取標(biāo)題的詞頻特征和逆文檔頻率,將提取到的所有標(biāo)題特征進(jìn)行加和得到標(biāo)題的詞級(jí)特征;再通過(guò)將Bi-LSTM與TextCNN結(jié)構(gòu)相融合,得到新的網(wǎng)絡(luò)結(jié)構(gòu),來(lái)提取標(biāo)題句子級(jí)的特征;將得到的詞級(jí)特征與句級(jí)特征通過(guò)融合,作為標(biāo)題特征。再對(duì)新聞的正文部分Bi-LSTM模型提...
【文章來(lái)源】:電子科技大學(xué)四川省 211工程院校 985工程院校 教育部直屬院校
【文章頁(yè)數(shù)】:75 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
Sigmoid函數(shù)示意圖
tanh函數(shù)示意圖
ReLU函數(shù)示意圖
【參考文獻(xiàn)】:
期刊論文
[1]機(jī)器學(xué)習(xí)在網(wǎng)絡(luò)空間安全研究中的應(yīng)用[J]. 張蕾,崔勇,劉靜,江勇,吳建平. 計(jì)算機(jī)學(xué)報(bào). 2018(09)
[2]Multi-feature-Based Subjective-Sentence Classification Method for Chinese Micro-blogs[J]. ZHANG Yangsen,ZHANG Yaorong,JIANG Yuru,HUANG Gaijuan. Chinese Journal of Electronics. 2017(06)
[3]Word2vec的工作原理及應(yīng)用探究[J]. 周練. 科技情報(bào)開(kāi)發(fā)與經(jīng)濟(jì). 2015(02)
[4]支持向量機(jī)理論及算法研究綜述[J]. 汪海燕,黎建輝,楊風(fēng)雷. 計(jì)算機(jī)應(yīng)用研究. 2014(05)
[5]基于改進(jìn)的隱馬爾科夫模型的詞性標(biāo)注方法[J]. 袁里馳. 中南大學(xué)學(xué)報(bào)(自然科學(xué)版). 2012(08)
[6]基于多模態(tài)子空間相關(guān)性傳遞的視頻語(yǔ)義挖掘[J]. 劉亞楠,吳飛,莊越挺. 計(jì)算機(jī)研究與發(fā)展. 2009(01)
本文編號(hào):3384453
【文章來(lái)源】:電子科技大學(xué)四川省 211工程院校 985工程院校 教育部直屬院校
【文章頁(yè)數(shù)】:75 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
Sigmoid函數(shù)示意圖
tanh函數(shù)示意圖
ReLU函數(shù)示意圖
【參考文獻(xiàn)】:
期刊論文
[1]機(jī)器學(xué)習(xí)在網(wǎng)絡(luò)空間安全研究中的應(yīng)用[J]. 張蕾,崔勇,劉靜,江勇,吳建平. 計(jì)算機(jī)學(xué)報(bào). 2018(09)
[2]Multi-feature-Based Subjective-Sentence Classification Method for Chinese Micro-blogs[J]. ZHANG Yangsen,ZHANG Yaorong,JIANG Yuru,HUANG Gaijuan. Chinese Journal of Electronics. 2017(06)
[3]Word2vec的工作原理及應(yīng)用探究[J]. 周練. 科技情報(bào)開(kāi)發(fā)與經(jīng)濟(jì). 2015(02)
[4]支持向量機(jī)理論及算法研究綜述[J]. 汪海燕,黎建輝,楊風(fēng)雷. 計(jì)算機(jī)應(yīng)用研究. 2014(05)
[5]基于改進(jìn)的隱馬爾科夫模型的詞性標(biāo)注方法[J]. 袁里馳. 中南大學(xué)學(xué)報(bào)(自然科學(xué)版). 2012(08)
[6]基于多模態(tài)子空間相關(guān)性傳遞的視頻語(yǔ)義挖掘[J]. 劉亞楠,吳飛,莊越挺. 計(jì)算機(jī)研究與發(fā)展. 2009(01)
本文編號(hào):3384453
本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3384453.html
最近更新
教材專(zhuān)著