基于深度學習的多標簽文本分類的研究與實現(xiàn)
發(fā)布時間:2021-08-17 15:09
多標簽文本分類是自然語言處理的核心研究領(lǐng)域,也是實現(xiàn)某些智能系統(tǒng)的關(guān)鍵技術(shù)。檢索系統(tǒng),推薦系統(tǒng)以及對話系統(tǒng)等智能系統(tǒng)中都有多標簽文本分類技術(shù)的應(yīng)用。這些復雜的應(yīng)用中,多標簽文本的內(nèi)容可能是長文本,也可能是短文本,也有可能附帶上下文信息;多標簽文本的標簽可能數(shù)目巨大,可能不均衡,也有可能有依賴關(guān)系。例如多輪對話系統(tǒng)中的意圖分類就是典型的多標簽文本分類問題,對話數(shù)據(jù)的特點包括:短文本、帶有上下文信息、不均衡和標簽之間存在依賴關(guān)系。傳統(tǒng)的機器學習方法在處理短文本的語義特征抽取上表現(xiàn)不足,處理帶有上下文信息的短文本更是不佳。而深度學習在特征的自動學習和表達中有出色的發(fā)揮,且具有很好的建模能力。綜合上述問題,本文針對多輪對話系統(tǒng)中的意圖分類任務(wù)這個典型的多標簽文本分類問題,提出了一個基于深度學習的多標簽文本分類模型。本文主要的工作包括:1)針對多標簽文本分類中上下文信息的抽取,提出利用參數(shù)式注意力機制抽取上下文信息。參數(shù)式注意力機制既能從上下文中抽取相似信息,又能抽取關(guān)聯(lián)信息。2)針對多標簽文本分類中上下文信息的控制,提出利用遺忘門來控制上下文信息。遺忘門通過控制信息的引入,避免了噪聲的干擾,使...
【文章來源】:東南大學江蘇省 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:46 頁
【學位級別】:碩士
【部分圖文】:
基于機器學習的文本分類過程
圖 2-2 DAN 模型NNs)也被廣泛應(yīng)用于處理文本分類問題。文獻的語料庫來驗證一個 CNN 架構(gòu)處理文本分類的出了很好的效果,并且在少數(shù)幾個語料集中,獲
textCNN模型
【參考文獻】:
碩士論文
[1]基于長短時記憶網(wǎng)絡(luò)的多標簽文本分類[D]. 熊濤.浙江大學 2017
本文編號:3347996
【文章來源】:東南大學江蘇省 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:46 頁
【學位級別】:碩士
【部分圖文】:
基于機器學習的文本分類過程
圖 2-2 DAN 模型NNs)也被廣泛應(yīng)用于處理文本分類問題。文獻的語料庫來驗證一個 CNN 架構(gòu)處理文本分類的出了很好的效果,并且在少數(shù)幾個語料集中,獲
textCNN模型
【參考文獻】:
碩士論文
[1]基于長短時記憶網(wǎng)絡(luò)的多標簽文本分類[D]. 熊濤.浙江大學 2017
本文編號:3347996
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/3347996.html
最近更新
教材專著