網(wǎng)絡(luò)問答社區(qū)的問題分類及專家發(fā)現(xiàn)研究
發(fā)布時(shí)間:2023-05-31 04:13
Web3.0與大數(shù)據(jù)時(shí)代的到來,為網(wǎng)絡(luò)用戶提供了更多交互的方式,隨之也產(chǎn)生了一系列用戶互動(dòng)的社區(qū)平臺(tái),網(wǎng)絡(luò)問答社區(qū)便是其中之一,用戶可以在社區(qū)平臺(tái)中提出問題,也可以回答其他用戶的提問。知乎作為中國版Quora,自2013年開放注冊(cè),便受到了廣大網(wǎng)絡(luò)用戶的關(guān)注,目前,知乎已發(fā)展為中國第一大網(wǎng)絡(luò)問答社區(qū)。網(wǎng)絡(luò)問答社區(qū)像一個(gè)巨型知識(shí)庫,為用戶提供了在線交流、經(jīng)驗(yàn)分享的平臺(tái)。網(wǎng)絡(luò)問答社區(qū)中大量的用戶生成內(nèi)容蘊(yùn)含著巨大的價(jià)值,如何發(fā)現(xiàn)用戶的興趣偏好,激發(fā)更多用戶的積極性,提高用戶發(fā)表內(nèi)容的質(zhì)量,對(duì)社區(qū)中知識(shí)傳播,提高社區(qū)的平臺(tái)影響力至關(guān)重要。本文通過構(gòu)建問題分類和專家發(fā)現(xiàn)模型,實(shí)現(xiàn)了對(duì)問題的自動(dòng)分類和領(lǐng)域?qū)<业陌l(fā)現(xiàn),使得用戶提出的問題可以快速歸類,進(jìn)而發(fā)現(xiàn)所在領(lǐng)域的專家,推送給專家用戶為提問者解答。主要完成了以下工作:(1)構(gòu)建了多通道問題特征提取模型。在實(shí)現(xiàn)社區(qū)問題文本自動(dòng)分類時(shí),采用LDA主題模型、Doc2vec模型多通道進(jìn)行問題文本特征提取,該方法有效解決了問題文本內(nèi)容短,數(shù)據(jù)稀疏問題。(2)提出了網(wǎng)絡(luò)問答社區(qū)問題集成分類方法。將多通道融合的問題文本特征分別輸入到支持向量機(jī)和隨機(jī)森林得到基...
【文章頁數(shù)】:60 頁
【學(xué)位級(jí)別】:碩士
【文章目錄】:
致謝
摘要
abstract
第一章 緒論
1.1 研究背景與意義
1.1.1 研究背景
1.1.2 研究意義
1.2 國內(nèi)外研究現(xiàn)狀
1.2.1 問題建模
1.2.2 問題分類
1.2.3 領(lǐng)域?qū)<野l(fā)現(xiàn)
1.3 研究內(nèi)容
1.4 組織結(jié)構(gòu)
第二章 相關(guān)理論與關(guān)鍵技術(shù)
2.1 文本表示模型
2.1.1 主題模型
2.1.2 詞向量模型
2.2 文本分類算法
2.2.1 樸素貝葉斯算法
2.2.2 決策樹算法
2.2.3 K近鄰算法
2.2.4 集成分類算法
2.3 鏈接分析法
2.3.1 HITS模型
2.3.2 Page Rank模型
2.4 本章小節(jié)
第三章 網(wǎng)絡(luò)問答社區(qū)問題文本建模
3.1 問題分類及專家發(fā)現(xiàn)的模型設(shè)計(jì)
3.2 問題文本的獲取和預(yù)處理
3.3 多通道問題特征建模
3.3.1 LDA主題特征提取
3.3.2 Doc2Vec文本特征提取
3.3.3 多通道問題特征融合
3.4 本章小節(jié)
第四章 網(wǎng)絡(luò)問答社區(qū)問題文本分類模型
4.1 問題文本分類器的選擇與集成
4.1.1 基于SVM的問題分類
4.1.2 基于RF的問題分類
4.1.3 集成分類方案設(shè)計(jì)
4.2 基于n LD-SVM-RF的問題分類流程
4.3 實(shí)驗(yàn)設(shè)計(jì)與分析
4.3.1 實(shí)驗(yàn)設(shè)計(jì)與評(píng)價(jià)標(biāo)準(zhǔn)
4.3.2 實(shí)驗(yàn)結(jié)果與分析
4.4 本章小節(jié)
第五章 網(wǎng)絡(luò)問答社區(qū)領(lǐng)域?qū)<野l(fā)現(xiàn)
5.1 專家用戶特征建模
5.1.1 用戶節(jié)點(diǎn)特征提取
5.1.2 用戶間關(guān)系提取
5.2 基于LN-User Rank的專家發(fā)現(xiàn)模型
5.2.1 專家發(fā)現(xiàn)方法流程設(shè)計(jì)
5.2.2 構(gòu)建概率轉(zhuǎn)移矩陣
5.2.3 領(lǐng)域?qū)<业梅钟?jì)算
5.3 實(shí)驗(yàn)設(shè)計(jì)與分析
5.3.1 數(shù)據(jù)收集與處理
5.3.2 實(shí)驗(yàn)設(shè)計(jì)
5.3.3 實(shí)驗(yàn)結(jié)果
5.4 本章小節(jié)
第六章 總結(jié)與展望
6.1 工作總結(jié)
6.2 工作展望
參考文獻(xiàn)
攻讀碩士學(xué)位期間的學(xué)術(shù)活動(dòng)及成果情況
本文編號(hào):3825663
【文章頁數(shù)】:60 頁
【學(xué)位級(jí)別】:碩士
【文章目錄】:
致謝
摘要
abstract
第一章 緒論
1.1 研究背景與意義
1.1.1 研究背景
1.1.2 研究意義
1.2 國內(nèi)外研究現(xiàn)狀
1.2.1 問題建模
1.2.2 問題分類
1.2.3 領(lǐng)域?qū)<野l(fā)現(xiàn)
1.3 研究內(nèi)容
1.4 組織結(jié)構(gòu)
第二章 相關(guān)理論與關(guān)鍵技術(shù)
2.1 文本表示模型
2.1.1 主題模型
2.1.2 詞向量模型
2.2 文本分類算法
2.2.1 樸素貝葉斯算法
2.2.2 決策樹算法
2.2.3 K近鄰算法
2.2.4 集成分類算法
2.3 鏈接分析法
2.3.1 HITS模型
2.3.2 Page Rank模型
2.4 本章小節(jié)
第三章 網(wǎng)絡(luò)問答社區(qū)問題文本建模
3.1 問題分類及專家發(fā)現(xiàn)的模型設(shè)計(jì)
3.2 問題文本的獲取和預(yù)處理
3.3 多通道問題特征建模
3.3.1 LDA主題特征提取
3.3.2 Doc2Vec文本特征提取
3.3.3 多通道問題特征融合
3.4 本章小節(jié)
第四章 網(wǎng)絡(luò)問答社區(qū)問題文本分類模型
4.1 問題文本分類器的選擇與集成
4.1.1 基于SVM的問題分類
4.1.2 基于RF的問題分類
4.1.3 集成分類方案設(shè)計(jì)
4.2 基于n LD-SVM-RF的問題分類流程
4.3 實(shí)驗(yàn)設(shè)計(jì)與分析
4.3.1 實(shí)驗(yàn)設(shè)計(jì)與評(píng)價(jià)標(biāo)準(zhǔn)
4.3.2 實(shí)驗(yàn)結(jié)果與分析
4.4 本章小節(jié)
第五章 網(wǎng)絡(luò)問答社區(qū)領(lǐng)域?qū)<野l(fā)現(xiàn)
5.1 專家用戶特征建模
5.1.1 用戶節(jié)點(diǎn)特征提取
5.1.2 用戶間關(guān)系提取
5.2 基于LN-User Rank的專家發(fā)現(xiàn)模型
5.2.1 專家發(fā)現(xiàn)方法流程設(shè)計(jì)
5.2.2 構(gòu)建概率轉(zhuǎn)移矩陣
5.2.3 領(lǐng)域?qū)<业梅钟?jì)算
5.3 實(shí)驗(yàn)設(shè)計(jì)與分析
5.3.1 數(shù)據(jù)收集與處理
5.3.2 實(shí)驗(yàn)設(shè)計(jì)
5.3.3 實(shí)驗(yàn)結(jié)果
5.4 本章小節(jié)
第六章 總結(jié)與展望
6.1 工作總結(jié)
6.2 工作展望
參考文獻(xiàn)
攻讀碩士學(xué)位期間的學(xué)術(shù)活動(dòng)及成果情況
本文編號(hào):3825663
本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3825663.html
最近更新
教材專著