面向網(wǎng)絡(luò)社區(qū)問答對的語義挖掘研究
發(fā)布時間:2021-02-14 22:36
Web2.0技術(shù)的飛速發(fā)展帶來了互聯(lián)網(wǎng)中的用戶生成內(nèi)容(User-generatedContents, UGC)的規(guī)模的不斷增長。作為一種新的網(wǎng)絡(luò)信息資源,高質(zhì)量的用戶生成內(nèi)容的研究和應(yīng)用價值正逐漸顯現(xiàn),針對其開展的采集和挖掘工作具有非常重要的意義。由問題和其答案組成的問答對是用戶生成內(nèi)容的典型代表,是用戶之間以互聯(lián)網(wǎng)為媒介的知識分享行為的直接產(chǎn)物,因而由大量用戶生成的問答對組成的問答資源是人類知識以網(wǎng)絡(luò)文本為載體的體現(xiàn)形式之一,同時也蘊含著人類在通過網(wǎng)絡(luò)進行交流過程中的語言規(guī)律。因此無論對于問答系統(tǒng)的構(gòu)建還是自然語言處理研究來說,優(yōu)質(zhì)的問答資源都具有舉足輕重的地位。網(wǎng)絡(luò)社區(qū)(如社區(qū)型問答系統(tǒng)、在線論壇等)為互聯(lián)網(wǎng)用戶提供了信息交流的平臺,用戶在其中的知識交流和分享活動多是以提問和回答的形式進行的,因此網(wǎng)絡(luò)社區(qū)中蘊含著大量的問答對資源。網(wǎng)絡(luò)社區(qū)中存在數(shù)量可觀的描述型問答對,這種問答信息的價值在于其有助于彌補現(xiàn)有自動問答系統(tǒng)在復(fù)雜問題上的不足,從而提高自動問答系統(tǒng)的整體表現(xiàn)。然而由于網(wǎng)絡(luò)社區(qū)中的知識分享并不存在義務(wù)性,有價值的問答信息往往混雜在大量的無意義信息之中,因此對于問答知識庫的構(gòu)...
【文章來源】:哈爾濱工業(yè)大學(xué)黑龍江省 211工程院校 985工程院校
【文章頁數(shù)】:126 頁
【學(xué)位級別】:博士
【文章目錄】:
摘要
Abstract
第1章 緒論
1.1 課題背景及意義
1.2 網(wǎng)絡(luò)社區(qū)的結(jié)構(gòu)與文本信息特點
1.3 國內(nèi)外研究現(xiàn)狀
1.3.1 面向cQA系統(tǒng)的問答信息挖掘
1.3.2 論壇話題中的問答信息發(fā)現(xiàn)
1.3.3 答案自動摘要
1.3.4 自動問答研究的新進展
1.3.5 研究現(xiàn)狀總結(jié)
1.4 本文的研究內(nèi)容
1.5 本文的內(nèi)容安排
第2章 基于深度學(xué)習(xí)的短文本語義相關(guān)性量化
2.1 引言
2.2 復(fù)雜問答對的語言特性
2.3 受限玻爾茲曼機與深度學(xué)習(xí)
2.4 問答對語義相關(guān)性量化
2.4.1 基于問題答案聯(lián)合分布的深度置信網(wǎng)絡(luò)
2.4.2 基于答案-問題重建的深度置信網(wǎng)絡(luò)
2.4.3 特征及模型參數(shù)
2.5 論壇與cQA文本的同質(zhì)性
2.6 實驗與討論
2.6.1 實驗設(shè)置
2.6.2 實驗結(jié)果與分析
2.7 本章小結(jié)
第3章 基于社區(qū)非文本特征的問答對挖掘
3.1 引言
3.2 常見非文本特征在答案識別中的應(yīng)用
3.3 基于話題段落劃分的答案識別
3.3.1 話題段落劃分
3.3.2 答案識別
3.3.3 特征集合描述
3.4 噪聲環(huán)境下的問題發(fā)現(xiàn)
3.5 實驗與討論
3.5.1 實驗設(shè)置
3.5.2 實驗結(jié)果與分析
3.6 本章小結(jié)
第4章 基于統(tǒng)計模型的問句生成
4.1 引言
4.2 問句生成問題的不同解決方法
4.3 統(tǒng)計問句生成與問答系統(tǒng)的關(guān)系
4.4 基于深度學(xué)習(xí)的問句生成
4.4.1 架構(gòu)描述
4.4.2 問句核心詞語生成
4.4.3 基于模板的問句構(gòu)建
4.5 實驗與討論
4.5.1 實驗設(shè)置
4.5.2 實驗結(jié)果與分析
4.6 本章小結(jié)
第5章 面向問答社區(qū)的答案文摘
5.1 引言
5.2 答案文摘概述
5.2.1 答案文摘的研究對象
5.2.2 答案文摘的評價指標(biāo)
5.2.3 答案文摘與多文檔文摘的關(guān)系
5.3 主題信息存在條件下的答案文摘
5.3.1 主題信息在答案文摘中的作用
5.3.2 基于自適應(yīng)最大間隔相關(guān)模型的答案文摘
5.3.3 實驗結(jié)果與分析
5.4 無主題信息的答案文摘
5.4.1 無主題信息情況下的答案文摘策略
5.4.2 基于稀疏編碼的答案文摘
5.4.3 基于深度學(xué)習(xí)的答案文摘
5.4.4 實驗結(jié)果與討論
5.5 本章小結(jié)
結(jié)論
參考文獻
攻讀博士學(xué)位期間發(fā)表的論文及其他成果
致謝
個人簡歷
【參考文獻】:
期刊論文
[1]微博文本處理研究綜述[J]. 張劍峰,夏云慶,姚建民. 中文信息學(xué)報. 2012(04)
[2]基于上下文重構(gòu)的短文本情感極性判別研究[J]. 楊震,賴英旭,段立娟,李玉鑑. 自動化學(xué)報. 2012(01)
[3]基于淺層句法特征的評價對象抽取研究[J]. 徐冰,趙鐵軍,王山雨,鄭德權(quán). 自動化學(xué)報. 2011(10)
[4]中文社區(qū)問答中問題答案質(zhì)量評價和預(yù)測[J]. 李晨,巢文涵,陳小明,李舟軍. 計算機科學(xué). 2011(06)
[5]大規(guī)模短文本的不完全聚類[J]. 彭澤映,俞曉明,許洪波,劉春陽. 中文信息學(xué)報. 2011(01)
[6]社區(qū)問答系統(tǒng)研究綜述[J]. 張中峰,李秋丹. 計算機科學(xué). 2010(11)
[7]多文檔文摘句子優(yōu)選算法研究[J]. 張姝,趙鐵軍,姚超,鄭德權(quán). 電子與信息學(xué)報. 2008(12)
[8]多文檔自動文摘綜述[J]. 秦兵,劉挺,李生. 中文信息學(xué)報. 2005(06)
博士論文
[1]多文檔自動文摘關(guān)鍵技術(shù)研究[D]. 徐永東.哈爾濱工業(yè)大學(xué) 2007
本文編號:3033978
【文章來源】:哈爾濱工業(yè)大學(xué)黑龍江省 211工程院校 985工程院校
【文章頁數(shù)】:126 頁
【學(xué)位級別】:博士
【文章目錄】:
摘要
Abstract
第1章 緒論
1.1 課題背景及意義
1.2 網(wǎng)絡(luò)社區(qū)的結(jié)構(gòu)與文本信息特點
1.3 國內(nèi)外研究現(xiàn)狀
1.3.1 面向cQA系統(tǒng)的問答信息挖掘
1.3.2 論壇話題中的問答信息發(fā)現(xiàn)
1.3.3 答案自動摘要
1.3.4 自動問答研究的新進展
1.3.5 研究現(xiàn)狀總結(jié)
1.4 本文的研究內(nèi)容
1.5 本文的內(nèi)容安排
第2章 基于深度學(xué)習(xí)的短文本語義相關(guān)性量化
2.1 引言
2.2 復(fù)雜問答對的語言特性
2.3 受限玻爾茲曼機與深度學(xué)習(xí)
2.4 問答對語義相關(guān)性量化
2.4.1 基于問題答案聯(lián)合分布的深度置信網(wǎng)絡(luò)
2.4.2 基于答案-問題重建的深度置信網(wǎng)絡(luò)
2.4.3 特征及模型參數(shù)
2.5 論壇與cQA文本的同質(zhì)性
2.6 實驗與討論
2.6.1 實驗設(shè)置
2.6.2 實驗結(jié)果與分析
2.7 本章小結(jié)
第3章 基于社區(qū)非文本特征的問答對挖掘
3.1 引言
3.2 常見非文本特征在答案識別中的應(yīng)用
3.3 基于話題段落劃分的答案識別
3.3.1 話題段落劃分
3.3.2 答案識別
3.3.3 特征集合描述
3.4 噪聲環(huán)境下的問題發(fā)現(xiàn)
3.5 實驗與討論
3.5.1 實驗設(shè)置
3.5.2 實驗結(jié)果與分析
3.6 本章小結(jié)
第4章 基于統(tǒng)計模型的問句生成
4.1 引言
4.2 問句生成問題的不同解決方法
4.3 統(tǒng)計問句生成與問答系統(tǒng)的關(guān)系
4.4 基于深度學(xué)習(xí)的問句生成
4.4.1 架構(gòu)描述
4.4.2 問句核心詞語生成
4.4.3 基于模板的問句構(gòu)建
4.5 實驗與討論
4.5.1 實驗設(shè)置
4.5.2 實驗結(jié)果與分析
4.6 本章小結(jié)
第5章 面向問答社區(qū)的答案文摘
5.1 引言
5.2 答案文摘概述
5.2.1 答案文摘的研究對象
5.2.2 答案文摘的評價指標(biāo)
5.2.3 答案文摘與多文檔文摘的關(guān)系
5.3 主題信息存在條件下的答案文摘
5.3.1 主題信息在答案文摘中的作用
5.3.2 基于自適應(yīng)最大間隔相關(guān)模型的答案文摘
5.3.3 實驗結(jié)果與分析
5.4 無主題信息的答案文摘
5.4.1 無主題信息情況下的答案文摘策略
5.4.2 基于稀疏編碼的答案文摘
5.4.3 基于深度學(xué)習(xí)的答案文摘
5.4.4 實驗結(jié)果與討論
5.5 本章小結(jié)
結(jié)論
參考文獻
攻讀博士學(xué)位期間發(fā)表的論文及其他成果
致謝
個人簡歷
【參考文獻】:
期刊論文
[1]微博文本處理研究綜述[J]. 張劍峰,夏云慶,姚建民. 中文信息學(xué)報. 2012(04)
[2]基于上下文重構(gòu)的短文本情感極性判別研究[J]. 楊震,賴英旭,段立娟,李玉鑑. 自動化學(xué)報. 2012(01)
[3]基于淺層句法特征的評價對象抽取研究[J]. 徐冰,趙鐵軍,王山雨,鄭德權(quán). 自動化學(xué)報. 2011(10)
[4]中文社區(qū)問答中問題答案質(zhì)量評價和預(yù)測[J]. 李晨,巢文涵,陳小明,李舟軍. 計算機科學(xué). 2011(06)
[5]大規(guī)模短文本的不完全聚類[J]. 彭澤映,俞曉明,許洪波,劉春陽. 中文信息學(xué)報. 2011(01)
[6]社區(qū)問答系統(tǒng)研究綜述[J]. 張中峰,李秋丹. 計算機科學(xué). 2010(11)
[7]多文檔文摘句子優(yōu)選算法研究[J]. 張姝,趙鐵軍,姚超,鄭德權(quán). 電子與信息學(xué)報. 2008(12)
[8]多文檔自動文摘綜述[J]. 秦兵,劉挺,李生. 中文信息學(xué)報. 2005(06)
博士論文
[1]多文檔自動文摘關(guān)鍵技術(shù)研究[D]. 徐永東.哈爾濱工業(yè)大學(xué) 2007
本文編號:3033978
本文鏈接:http://sikaile.net/guanlilunwen/ydhl/3033978.html
最近更新
教材專著