基于深度學(xué)習(xí)的多標(biāo)簽文本分類的研究與實(shí)現(xiàn)
發(fā)布時(shí)間:2021-08-17 15:09
多標(biāo)簽文本分類是自然語言處理的核心研究領(lǐng)域,也是實(shí)現(xiàn)某些智能系統(tǒng)的關(guān)鍵技術(shù)。檢索系統(tǒng),推薦系統(tǒng)以及對話系統(tǒng)等智能系統(tǒng)中都有多標(biāo)簽文本分類技術(shù)的應(yīng)用。這些復(fù)雜的應(yīng)用中,多標(biāo)簽文本的內(nèi)容可能是長文本,也可能是短文本,也有可能附帶上下文信息;多標(biāo)簽文本的標(biāo)簽可能數(shù)目巨大,可能不均衡,也有可能有依賴關(guān)系。例如多輪對話系統(tǒng)中的意圖分類就是典型的多標(biāo)簽文本分類問題,對話數(shù)據(jù)的特點(diǎn)包括:短文本、帶有上下文信息、不均衡和標(biāo)簽之間存在依賴關(guān)系。傳統(tǒng)的機(jī)器學(xué)習(xí)方法在處理短文本的語義特征抽取上表現(xiàn)不足,處理帶有上下文信息的短文本更是不佳。而深度學(xué)習(xí)在特征的自動(dòng)學(xué)習(xí)和表達(dá)中有出色的發(fā)揮,且具有很好的建模能力。綜合上述問題,本文針對多輪對話系統(tǒng)中的意圖分類任務(wù)這個(gè)典型的多標(biāo)簽文本分類問題,提出了一個(gè)基于深度學(xué)習(xí)的多標(biāo)簽文本分類模型。本文主要的工作包括:1)針對多標(biāo)簽文本分類中上下文信息的抽取,提出利用參數(shù)式注意力機(jī)制抽取上下文信息。參數(shù)式注意力機(jī)制既能從上下文中抽取相似信息,又能抽取關(guān)聯(lián)信息。2)針對多標(biāo)簽文本分類中上下文信息的控制,提出利用遺忘門來控制上下文信息。遺忘門通過控制信息的引入,避免了噪聲的干擾,使...
【文章來源】:東南大學(xué)江蘇省 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:46 頁
【學(xué)位級別】:碩士
【部分圖文】:
基于機(jī)器學(xué)習(xí)的文本分類過程
圖 2-2 DAN 模型NNs)也被廣泛應(yīng)用于處理文本分類問題。文獻(xiàn)的語料庫來驗(yàn)證一個(gè) CNN 架構(gòu)處理文本分類的出了很好的效果,并且在少數(shù)幾個(gè)語料集中,獲
textCNN模型
【參考文獻(xiàn)】:
碩士論文
[1]基于長短時(shí)記憶網(wǎng)絡(luò)的多標(biāo)簽文本分類[D]. 熊濤.浙江大學(xué) 2017
本文編號:3347996
【文章來源】:東南大學(xué)江蘇省 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:46 頁
【學(xué)位級別】:碩士
【部分圖文】:
基于機(jī)器學(xué)習(xí)的文本分類過程
圖 2-2 DAN 模型NNs)也被廣泛應(yīng)用于處理文本分類問題。文獻(xiàn)的語料庫來驗(yàn)證一個(gè) CNN 架構(gòu)處理文本分類的出了很好的效果,并且在少數(shù)幾個(gè)語料集中,獲
textCNN模型
【參考文獻(xiàn)】:
碩士論文
[1]基于長短時(shí)記憶網(wǎng)絡(luò)的多標(biāo)簽文本分類[D]. 熊濤.浙江大學(xué) 2017
本文編號:3347996
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/3347996.html
最近更新
教材專著