面向網(wǎng)絡(luò)社區(qū)問答對(duì)的語義挖掘研究
發(fā)布時(shí)間:2021-02-14 22:36
Web2.0技術(shù)的飛速發(fā)展帶來了互聯(lián)網(wǎng)中的用戶生成內(nèi)容(User-generatedContents, UGC)的規(guī)模的不斷增長。作為一種新的網(wǎng)絡(luò)信息資源,高質(zhì)量的用戶生成內(nèi)容的研究和應(yīng)用價(jià)值正逐漸顯現(xiàn),針對(duì)其開展的采集和挖掘工作具有非常重要的意義。由問題和其答案組成的問答對(duì)是用戶生成內(nèi)容的典型代表,是用戶之間以互聯(lián)網(wǎng)為媒介的知識(shí)分享行為的直接產(chǎn)物,因而由大量用戶生成的問答對(duì)組成的問答資源是人類知識(shí)以網(wǎng)絡(luò)文本為載體的體現(xiàn)形式之一,同時(shí)也蘊(yùn)含著人類在通過網(wǎng)絡(luò)進(jìn)行交流過程中的語言規(guī)律。因此無論對(duì)于問答系統(tǒng)的構(gòu)建還是自然語言處理研究來說,優(yōu)質(zhì)的問答資源都具有舉足輕重的地位。網(wǎng)絡(luò)社區(qū)(如社區(qū)型問答系統(tǒng)、在線論壇等)為互聯(lián)網(wǎng)用戶提供了信息交流的平臺(tái),用戶在其中的知識(shí)交流和分享活動(dòng)多是以提問和回答的形式進(jìn)行的,因此網(wǎng)絡(luò)社區(qū)中蘊(yùn)含著大量的問答對(duì)資源。網(wǎng)絡(luò)社區(qū)中存在數(shù)量可觀的描述型問答對(duì),這種問答信息的價(jià)值在于其有助于彌補(bǔ)現(xiàn)有自動(dòng)問答系統(tǒng)在復(fù)雜問題上的不足,從而提高自動(dòng)問答系統(tǒng)的整體表現(xiàn)。然而由于網(wǎng)絡(luò)社區(qū)中的知識(shí)分享并不存在義務(wù)性,有價(jià)值的問答信息往往混雜在大量的無意義信息之中,因此對(duì)于問答知識(shí)庫的構(gòu)...
【文章來源】:哈爾濱工業(yè)大學(xué)黑龍江省 211工程院校 985工程院校
【文章頁數(shù)】:126 頁
【學(xué)位級(jí)別】:博士
【文章目錄】:
摘要
Abstract
第1章 緒論
1.1 課題背景及意義
1.2 網(wǎng)絡(luò)社區(qū)的結(jié)構(gòu)與文本信息特點(diǎn)
1.3 國內(nèi)外研究現(xiàn)狀
1.3.1 面向cQA系統(tǒng)的問答信息挖掘
1.3.2 論壇話題中的問答信息發(fā)現(xiàn)
1.3.3 答案自動(dòng)摘要
1.3.4 自動(dòng)問答研究的新進(jìn)展
1.3.5 研究現(xiàn)狀總結(jié)
1.4 本文的研究內(nèi)容
1.5 本文的內(nèi)容安排
第2章 基于深度學(xué)習(xí)的短文本語義相關(guān)性量化
2.1 引言
2.2 復(fù)雜問答對(duì)的語言特性
2.3 受限玻爾茲曼機(jī)與深度學(xué)習(xí)
2.4 問答對(duì)語義相關(guān)性量化
2.4.1 基于問題答案聯(lián)合分布的深度置信網(wǎng)絡(luò)
2.4.2 基于答案-問題重建的深度置信網(wǎng)絡(luò)
2.4.3 特征及模型參數(shù)
2.5 論壇與cQA文本的同質(zhì)性
2.6 實(shí)驗(yàn)與討論
2.6.1 實(shí)驗(yàn)設(shè)置
2.6.2 實(shí)驗(yàn)結(jié)果與分析
2.7 本章小結(jié)
第3章 基于社區(qū)非文本特征的問答對(duì)挖掘
3.1 引言
3.2 常見非文本特征在答案識(shí)別中的應(yīng)用
3.3 基于話題段落劃分的答案識(shí)別
3.3.1 話題段落劃分
3.3.2 答案識(shí)別
3.3.3 特征集合描述
3.4 噪聲環(huán)境下的問題發(fā)現(xiàn)
3.5 實(shí)驗(yàn)與討論
3.5.1 實(shí)驗(yàn)設(shè)置
3.5.2 實(shí)驗(yàn)結(jié)果與分析
3.6 本章小結(jié)
第4章 基于統(tǒng)計(jì)模型的問句生成
4.1 引言
4.2 問句生成問題的不同解決方法
4.3 統(tǒng)計(jì)問句生成與問答系統(tǒng)的關(guān)系
4.4 基于深度學(xué)習(xí)的問句生成
4.4.1 架構(gòu)描述
4.4.2 問句核心詞語生成
4.4.3 基于模板的問句構(gòu)建
4.5 實(shí)驗(yàn)與討論
4.5.1 實(shí)驗(yàn)設(shè)置
4.5.2 實(shí)驗(yàn)結(jié)果與分析
4.6 本章小結(jié)
第5章 面向問答社區(qū)的答案文摘
5.1 引言
5.2 答案文摘概述
5.2.1 答案文摘的研究對(duì)象
5.2.2 答案文摘的評(píng)價(jià)指標(biāo)
5.2.3 答案文摘與多文檔文摘的關(guān)系
5.3 主題信息存在條件下的答案文摘
5.3.1 主題信息在答案文摘中的作用
5.3.2 基于自適應(yīng)最大間隔相關(guān)模型的答案文摘
5.3.3 實(shí)驗(yàn)結(jié)果與分析
5.4 無主題信息的答案文摘
5.4.1 無主題信息情況下的答案文摘策略
5.4.2 基于稀疏編碼的答案文摘
5.4.3 基于深度學(xué)習(xí)的答案文摘
5.4.4 實(shí)驗(yàn)結(jié)果與討論
5.5 本章小結(jié)
結(jié)論
參考文獻(xiàn)
攻讀博士學(xué)位期間發(fā)表的論文及其他成果
致謝
個(gè)人簡歷
【參考文獻(xiàn)】:
期刊論文
[1]微博文本處理研究綜述[J]. 張劍峰,夏云慶,姚建民. 中文信息學(xué)報(bào). 2012(04)
[2]基于上下文重構(gòu)的短文本情感極性判別研究[J]. 楊震,賴英旭,段立娟,李玉鑑. 自動(dòng)化學(xué)報(bào). 2012(01)
[3]基于淺層句法特征的評(píng)價(jià)對(duì)象抽取研究[J]. 徐冰,趙鐵軍,王山雨,鄭德權(quán). 自動(dòng)化學(xué)報(bào). 2011(10)
[4]中文社區(qū)問答中問題答案質(zhì)量評(píng)價(jià)和預(yù)測(cè)[J]. 李晨,巢文涵,陳小明,李舟軍. 計(jì)算機(jī)科學(xué). 2011(06)
[5]大規(guī)模短文本的不完全聚類[J]. 彭澤映,俞曉明,許洪波,劉春陽. 中文信息學(xué)報(bào). 2011(01)
[6]社區(qū)問答系統(tǒng)研究綜述[J]. 張中峰,李秋丹. 計(jì)算機(jī)科學(xué). 2010(11)
[7]多文檔文摘句子優(yōu)選算法研究[J]. 張姝,趙鐵軍,姚超,鄭德權(quán). 電子與信息學(xué)報(bào). 2008(12)
[8]多文檔自動(dòng)文摘綜述[J]. 秦兵,劉挺,李生. 中文信息學(xué)報(bào). 2005(06)
博士論文
[1]多文檔自動(dòng)文摘關(guān)鍵技術(shù)研究[D]. 徐永東.哈爾濱工業(yè)大學(xué) 2007
本文編號(hào):3033978
【文章來源】:哈爾濱工業(yè)大學(xué)黑龍江省 211工程院校 985工程院校
【文章頁數(shù)】:126 頁
【學(xué)位級(jí)別】:博士
【文章目錄】:
摘要
Abstract
第1章 緒論
1.1 課題背景及意義
1.2 網(wǎng)絡(luò)社區(qū)的結(jié)構(gòu)與文本信息特點(diǎn)
1.3 國內(nèi)外研究現(xiàn)狀
1.3.1 面向cQA系統(tǒng)的問答信息挖掘
1.3.2 論壇話題中的問答信息發(fā)現(xiàn)
1.3.3 答案自動(dòng)摘要
1.3.4 自動(dòng)問答研究的新進(jìn)展
1.3.5 研究現(xiàn)狀總結(jié)
1.4 本文的研究內(nèi)容
1.5 本文的內(nèi)容安排
第2章 基于深度學(xué)習(xí)的短文本語義相關(guān)性量化
2.1 引言
2.2 復(fù)雜問答對(duì)的語言特性
2.3 受限玻爾茲曼機(jī)與深度學(xué)習(xí)
2.4 問答對(duì)語義相關(guān)性量化
2.4.1 基于問題答案聯(lián)合分布的深度置信網(wǎng)絡(luò)
2.4.2 基于答案-問題重建的深度置信網(wǎng)絡(luò)
2.4.3 特征及模型參數(shù)
2.5 論壇與cQA文本的同質(zhì)性
2.6 實(shí)驗(yàn)與討論
2.6.1 實(shí)驗(yàn)設(shè)置
2.6.2 實(shí)驗(yàn)結(jié)果與分析
2.7 本章小結(jié)
第3章 基于社區(qū)非文本特征的問答對(duì)挖掘
3.1 引言
3.2 常見非文本特征在答案識(shí)別中的應(yīng)用
3.3 基于話題段落劃分的答案識(shí)別
3.3.1 話題段落劃分
3.3.2 答案識(shí)別
3.3.3 特征集合描述
3.4 噪聲環(huán)境下的問題發(fā)現(xiàn)
3.5 實(shí)驗(yàn)與討論
3.5.1 實(shí)驗(yàn)設(shè)置
3.5.2 實(shí)驗(yàn)結(jié)果與分析
3.6 本章小結(jié)
第4章 基于統(tǒng)計(jì)模型的問句生成
4.1 引言
4.2 問句生成問題的不同解決方法
4.3 統(tǒng)計(jì)問句生成與問答系統(tǒng)的關(guān)系
4.4 基于深度學(xué)習(xí)的問句生成
4.4.1 架構(gòu)描述
4.4.2 問句核心詞語生成
4.4.3 基于模板的問句構(gòu)建
4.5 實(shí)驗(yàn)與討論
4.5.1 實(shí)驗(yàn)設(shè)置
4.5.2 實(shí)驗(yàn)結(jié)果與分析
4.6 本章小結(jié)
第5章 面向問答社區(qū)的答案文摘
5.1 引言
5.2 答案文摘概述
5.2.1 答案文摘的研究對(duì)象
5.2.2 答案文摘的評(píng)價(jià)指標(biāo)
5.2.3 答案文摘與多文檔文摘的關(guān)系
5.3 主題信息存在條件下的答案文摘
5.3.1 主題信息在答案文摘中的作用
5.3.2 基于自適應(yīng)最大間隔相關(guān)模型的答案文摘
5.3.3 實(shí)驗(yàn)結(jié)果與分析
5.4 無主題信息的答案文摘
5.4.1 無主題信息情況下的答案文摘策略
5.4.2 基于稀疏編碼的答案文摘
5.4.3 基于深度學(xué)習(xí)的答案文摘
5.4.4 實(shí)驗(yàn)結(jié)果與討論
5.5 本章小結(jié)
結(jié)論
參考文獻(xiàn)
攻讀博士學(xué)位期間發(fā)表的論文及其他成果
致謝
個(gè)人簡歷
【參考文獻(xiàn)】:
期刊論文
[1]微博文本處理研究綜述[J]. 張劍峰,夏云慶,姚建民. 中文信息學(xué)報(bào). 2012(04)
[2]基于上下文重構(gòu)的短文本情感極性判別研究[J]. 楊震,賴英旭,段立娟,李玉鑑. 自動(dòng)化學(xué)報(bào). 2012(01)
[3]基于淺層句法特征的評(píng)價(jià)對(duì)象抽取研究[J]. 徐冰,趙鐵軍,王山雨,鄭德權(quán). 自動(dòng)化學(xué)報(bào). 2011(10)
[4]中文社區(qū)問答中問題答案質(zhì)量評(píng)價(jià)和預(yù)測(cè)[J]. 李晨,巢文涵,陳小明,李舟軍. 計(jì)算機(jī)科學(xué). 2011(06)
[5]大規(guī)模短文本的不完全聚類[J]. 彭澤映,俞曉明,許洪波,劉春陽. 中文信息學(xué)報(bào). 2011(01)
[6]社區(qū)問答系統(tǒng)研究綜述[J]. 張中峰,李秋丹. 計(jì)算機(jī)科學(xué). 2010(11)
[7]多文檔文摘句子優(yōu)選算法研究[J]. 張姝,趙鐵軍,姚超,鄭德權(quán). 電子與信息學(xué)報(bào). 2008(12)
[8]多文檔自動(dòng)文摘綜述[J]. 秦兵,劉挺,李生. 中文信息學(xué)報(bào). 2005(06)
博士論文
[1]多文檔自動(dòng)文摘關(guān)鍵技術(shù)研究[D]. 徐永東.哈爾濱工業(yè)大學(xué) 2007
本文編號(hào):3033978
本文鏈接:http://sikaile.net/guanlilunwen/ydhl/3033978.html
最近更新
教材專著