基于深度學(xué)習(xí)的多標(biāo)簽文本分類的研究與實(shí)現(xiàn)

發(fā)布時(shí)間：2021-08-17 15:09

　　多標(biāo)簽文本分類是自然語言處理的核心研究領(lǐng)域,也是實(shí)現(xiàn)某些智能系統(tǒng)的關(guān)鍵技術(shù)。檢索系統(tǒng),推薦系統(tǒng)以及對話系統(tǒng)等智能系統(tǒng)中都有多標(biāo)簽文本分類技術(shù)的應(yīng)用。這些復(fù)雜的應(yīng)用中,多標(biāo)簽文本的內(nèi)容可能是長文本,也可能是短文本,也有可能附帶上下文信息;多標(biāo)簽文本的標(biāo)簽可能數(shù)目巨大,可能不均衡,也有可能有依賴關(guān)系。例如多輪對話系統(tǒng)中的意圖分類就是典型的多標(biāo)簽文本分類問題,對話數(shù)據(jù)的特點(diǎn)包括:短文本、帶有上下文信息、不均衡和標(biāo)簽之間存在依賴關(guān)系。傳統(tǒng)的機(jī)器學(xué)習(xí)方法在處理短文本的語義特征抽取上表現(xiàn)不足,處理帶有上下文信息的短文本更是不佳。而深度學(xué)習(xí)在特征的自動(dòng)學(xué)習(xí)和表達(dá)中有出色的發(fā)揮,且具有很好的建模能力。綜合上述問題,本文針對多輪對話系統(tǒng)中的意圖分類任務(wù)這個(gè)典型的多標(biāo)簽文本分類問題,提出了一個(gè)基于深度學(xué)習(xí)的多標(biāo)簽文本分類模型。本文主要的工作包括:1)針對多標(biāo)簽文本分類中上下文信息的抽取,提出利用參數(shù)式注意力機(jī)制抽取上下文信息。參數(shù)式注意力機(jī)制既能從上下文中抽取相似信息,又能抽取關(guān)聯(lián)信息。2)針對多標(biāo)簽文本分類中上下文信息的控制,提出利用遺忘門來控制上下文信息。遺忘門通過控制信息的引入,避免了噪聲的干擾,使...

【文章來源】：東南大學(xué)江蘇省 211工程院校 985工程院校教育部直屬院校

【文章頁數(shù)】：46 頁

【學(xué)位級別】：碩士

【部分圖文】：

基于機(jī)器學(xué)習(xí)的文本分類過程

模型圖,模型,文本分類,語料

圖 2-2 DAN 模型NNs）也被廣泛應(yīng)用于處理文本分類問題。文獻(xiàn)的語料庫來驗(yàn)證一個(gè) CNN 架構(gòu)處理文本分類的出了很好的效果，并且在少數(shù)幾個(gè)語料集中，獲

模型圖,模型

textCNN模型

【參考文獻(xiàn)】：
碩士論文
[1]基于長短時(shí)記憶網(wǎng)絡(luò)的多標(biāo)簽文本分類[D]. 熊濤.浙江大學(xué) 2017

本文編號：3347996

資料下載

論文發(fā)表

支付寶下載

Download by Alipay
微信下載

Download by Wechat
會(huì)員下載

Download by Member

本文鏈接：http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/3347996.html

上一篇：基于YOLOv3的國內(nèi)交通標(biāo)志識(shí)別及嵌入式實(shí)現(xiàn)
下一篇：基于事件驅(qū)動(dòng)控制的正切換線性系統(tǒng)的穩(wěn)定性研究

論文發(fā)表

·知網(wǎng)|萬方|維普|龍?jiān)磡省級|國家級|科技核心|北大核心|南大核心CSSCI|EI|SCI|SSCI|

天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于深度學(xué)習(xí)的多標(biāo)簽文本分類的研究與實(shí)現(xiàn)