基于詞對句交互機(jī)制與多任務(wù)學(xué)習(xí)的論壇重復(fù)問題檢測算法研究
發(fā)布時間:2023-05-11 05:58
社區(qū)問答論壇——如Stack Overflow,Stack Exchange,教育論壇——如大規(guī)模在線公開課(Massive Open Online Course,簡稱MOOC)論壇是網(wǎng)民學(xué)習(xí)交流中重要的媒介。人們對信息質(zhì)量、信息時效性和反饋效率的追求,促使論壇管理的不斷完善。對論壇中重復(fù)問題的檢測識別是論壇管理中面對的主要任務(wù)之一。重復(fù)問題的精準(zhǔn)識別和檢測對構(gòu)建常見問題庫有重要意義,且影響著論壇平臺能否有效地為用戶檢索相關(guān)答案,影響著能否為資深用戶或論壇“領(lǐng)袖”推薦一些有挑戰(zhàn)性、未被提問過的問題,這與用戶的體驗密切相關(guān),甚至影響著用戶的去留。借助語義匹配模型,可以解析問題對的釋義,以識別問題對的語義是否對等,從而實現(xiàn)對重復(fù)問題的檢測和判別,減少人工標(biāo)記和管理的成本。但多數(shù)網(wǎng)絡(luò)論壇分學(xué)科、分領(lǐng)域,領(lǐng)域數(shù)據(jù)不足等領(lǐng)域特殊性問題使現(xiàn)有語義匹配模型很少能直接應(yīng)用于此類具有領(lǐng)域特殊性的論壇。為解決上述問題,本文提出將語義匹配模型與多任務(wù)學(xué)習(xí)集成的解決方案,多任務(wù)學(xué)習(xí)采用基于參數(shù)軟共享的方法,利用大規(guī)模數(shù)據(jù)輔助目標(biāo)領(lǐng)域任務(wù),實現(xiàn)多學(xué)科、多領(lǐng)域論壇的重復(fù)問題檢測。針對現(xiàn)有語義匹配模型對句子級別語義...
【文章頁數(shù)】:78 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
Abstract
第一章 緒論
1.1 研究背景和意義
1.2 國內(nèi)外研究現(xiàn)狀
1.2.1 重復(fù)問題檢測
1.2.2 深度語義匹配
1.2.3 領(lǐng)域自適應(yīng)的檢測方法
1.3 論文研究工作
1.4 論文的組織結(jié)構(gòu)
第二章 重復(fù)問題檢測技術(shù)與遷移學(xué)習(xí)相關(guān)方法
2.1 重復(fù)問題檢測相關(guān)方法
2.1.1 任務(wù)定義、框架與評價指標(biāo)
2.1.2 語義匹配的交互機(jī)制介紹
2.1.3 Attention
2.1.4 基于CNN的 n-grams交叉匹配方法
2.2 遷移學(xué)習(xí)的方法概述
2.2.1 INIT方法
2.2.2 多任務(wù)學(xué)習(xí)
2.3 本章小結(jié)
第三章 基于詞對句交互機(jī)制的語義匹配模型設(shè)計
3.1 hCNN
3.1.1 上下文表示層
3.1.2 金字塔結(jié)構(gòu)
3.1.3 上下文表示層與金字塔的融合
3.1.4 推斷層
3.2 詞對句交互機(jī)制
3.2.1 交互機(jī)制的設(shè)計
3.2.2 兩種交互信息提取
3.3 本章小結(jié)
第四章 基于參數(shù)軟共享多任務(wù)學(xué)習(xí)的重復(fù)問題檢測
4.1 基于參數(shù)軟共享機(jī)制的多任務(wù)學(xué)習(xí)方法
4.2 基于軟共享機(jī)制的參數(shù)優(yōu)化與訓(xùn)練
4.3 INIT與基于參數(shù)硬共享機(jī)制的訓(xùn)練
4.4 本章小結(jié)
第五章 論壇重復(fù)問題檢測實驗
5.1 數(shù)據(jù)集、評價指標(biāo)與實驗設(shè)置
5.1.1 社區(qū)論壇與慕課論壇數(shù)據(jù)集
5.1.2 慕課數(shù)據(jù)標(biāo)注方法
5.1.3 數(shù)據(jù)概況
5.1.4 實驗評價指標(biāo)
5.1.5 實驗設(shè)置
5.2 基于詞對句交互機(jī)制的重復(fù)問題檢測實驗
5.2.1 與經(jīng)典算法對比實驗
5.2.2 詞對句交互機(jī)制與Attention對比
5.2.3 hCNN-Ⅰ與 hCNN-Ⅱ的結(jié)構(gòu)差異影響
5.3 基于參數(shù)軟共享多任務(wù)學(xué)習(xí)的對比實驗
5.3.1 對比算法選取
5.3.2 實驗結(jié)果分析
5.4 模型可解釋性分析
5.5 本章小結(jié)
結(jié)論與展望
參考文獻(xiàn)
攻讀碩士學(xué)位期間取得的研究成果
致謝
附件
本文編號:3814304
【文章頁數(shù)】:78 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
Abstract
第一章 緒論
1.1 研究背景和意義
1.2 國內(nèi)外研究現(xiàn)狀
1.2.1 重復(fù)問題檢測
1.2.2 深度語義匹配
1.2.3 領(lǐng)域自適應(yīng)的檢測方法
1.3 論文研究工作
1.4 論文的組織結(jié)構(gòu)
第二章 重復(fù)問題檢測技術(shù)與遷移學(xué)習(xí)相關(guān)方法
2.1 重復(fù)問題檢測相關(guān)方法
2.1.1 任務(wù)定義、框架與評價指標(biāo)
2.1.2 語義匹配的交互機(jī)制介紹
2.1.3 Attention
2.1.4 基于CNN的 n-grams交叉匹配方法
2.2 遷移學(xué)習(xí)的方法概述
2.2.1 INIT方法
2.2.2 多任務(wù)學(xué)習(xí)
2.3 本章小結(jié)
第三章 基于詞對句交互機(jī)制的語義匹配模型設(shè)計
3.1 hCNN
3.1.1 上下文表示層
3.1.2 金字塔結(jié)構(gòu)
3.1.3 上下文表示層與金字塔的融合
3.1.4 推斷層
3.2 詞對句交互機(jī)制
3.2.1 交互機(jī)制的設(shè)計
3.2.2 兩種交互信息提取
3.3 本章小結(jié)
第四章 基于參數(shù)軟共享多任務(wù)學(xué)習(xí)的重復(fù)問題檢測
4.1 基于參數(shù)軟共享機(jī)制的多任務(wù)學(xué)習(xí)方法
4.2 基于軟共享機(jī)制的參數(shù)優(yōu)化與訓(xùn)練
4.3 INIT與基于參數(shù)硬共享機(jī)制的訓(xùn)練
4.4 本章小結(jié)
第五章 論壇重復(fù)問題檢測實驗
5.1 數(shù)據(jù)集、評價指標(biāo)與實驗設(shè)置
5.1.1 社區(qū)論壇與慕課論壇數(shù)據(jù)集
5.1.2 慕課數(shù)據(jù)標(biāo)注方法
5.1.3 數(shù)據(jù)概況
5.1.4 實驗評價指標(biāo)
5.1.5 實驗設(shè)置
5.2 基于詞對句交互機(jī)制的重復(fù)問題檢測實驗
5.2.1 與經(jīng)典算法對比實驗
5.2.2 詞對句交互機(jī)制與Attention對比
5.2.3 hCNN-Ⅰ與 hCNN-Ⅱ的結(jié)構(gòu)差異影響
5.3 基于參數(shù)軟共享多任務(wù)學(xué)習(xí)的對比實驗
5.3.1 對比算法選取
5.3.2 實驗結(jié)果分析
5.4 模型可解釋性分析
5.5 本章小結(jié)
結(jié)論與展望
參考文獻(xiàn)
攻讀碩士學(xué)位期間取得的研究成果
致謝
附件
本文編號:3814304
本文鏈接:http://sikaile.net/guanlilunwen/shequguanli/3814304.html
最近更新
教材專著