社區(qū)問答系統(tǒng)中融入用戶標簽和用戶行為的列表排序方法研究
本文關(guān)鍵詞:社區(qū)問答系統(tǒng)中融入用戶標簽和用戶行為的列表排序方法研究
更多相關(guān)文章: 社區(qū)問答系統(tǒng) 用戶特征 ListNet 排序?qū)W習 排序模型
【摘要】:早期的搜索引擎,如百度、Google等為互聯(lián)網(wǎng)用戶提供了比較方便的信息獲取方式,用戶通過在搜索引擎中輸入相關(guān)關(guān)鍵詞可以很快得到自己想要的信息。但是隨著互聯(lián)網(wǎng)上信息的大爆炸以及生活節(jié)奏的加快,傳統(tǒng)的搜索引擎已經(jīng)不能很好地滿足互聯(lián)網(wǎng)用戶快速獲取目標知識的需求。然而,社區(qū)問答系統(tǒng)的出現(xiàn)彌補了搜索引擎的這種不足。社區(qū)問答系統(tǒng)開放性和交互性的特點將問題提問者和回答者緊密地聯(lián)系在一起,可以滿足用戶更直接地快速地獲取目標知識的需求。而在社區(qū)問答系統(tǒng)中答案排序是至關(guān)重要的,排序的準確性直接影響問答系統(tǒng)的質(zhì)量和用戶的體驗。本文針對社區(qū)問答系統(tǒng)中的答案排序進行了如下幾個方面的研究:(1)分析了社區(qū)問答系統(tǒng)中影響答案排序效果的特征。社區(qū)問答系統(tǒng)的特征包括用戶標簽和用戶行為。社區(qū)問答系統(tǒng)中用戶標簽有問題回答者級別、問題回答者的擅長領(lǐng)域、問題回答者的被采納率、問題回答者的被贊同數(shù)、問題回答者的經(jīng)驗值和問題回答者所關(guān)注的關(guān)鍵詞等;用戶行為有提問者的打分、游客的打分以及問題回答者經(jīng);卮鸬膯栴}類別等。本文結(jié)合以上特征來對答案進行排序,后續(xù)實驗表明融入用戶標簽和行為特征能有效提高答案排序的效果。(2)采用一種基于集成方法的半監(jiān)督問句分類方法構(gòu)建分類模型。為了將問題回答者的擅長領(lǐng)域和關(guān)注的關(guān)鍵詞等特點有效地利用起來,必須對問句進行分類來匹配問題回答者的相關(guān)標簽。該方法通過集成方法對分類器進行集成,再結(jié)合半監(jiān)督學習方法用處理好的少量有標記問句特征和大量無標記問句特征來訓練分類模型。然后用訓練出的模型對新的問句進行分類,實驗表明用基于集成的半監(jiān)督分類方法可以有效提高問句分類準確率。(3)采用一種融入用戶標簽和用戶行為特征的列表排序方法構(gòu)建排序模型。首先對社區(qū)問答系統(tǒng)中用戶標簽和用戶行為進行研究和分析,選取具有利用價值的用戶標簽和行為特征融合到答案特征空間中。選用神經(jīng)網(wǎng)絡(luò)作為模型,利用梯度下降法作為優(yōu)化參數(shù)的ListNet作為排序方法,構(gòu)建融入用戶標簽和用戶行為特征的ListNet答案排序模型。最后用訓練好的排序模型對已經(jīng)經(jīng)過處理的答案特征空間進行實驗,對比實驗結(jié)果表明融入用戶標簽和用戶行為特征的ListNet答案排序方法能明顯提高答案排序效果。(4)采用一種基于用戶標簽和用戶行為優(yōu)化的列表排序方法構(gòu)建排序模型。分析研究社區(qū)問答系統(tǒng)中用戶標簽和用戶行為,選取具有利用價值的用戶標簽和用戶行為對ListNet排序模型進行優(yōu)化。結(jié)合融入用戶標簽和用戶行為的特征空間構(gòu)建基于用戶標簽和用戶行為優(yōu)化的ListNet答案排序模型。最后用訓練好的排序模型對已經(jīng)經(jīng)過處理的答案特征空間進行實驗,對比實驗結(jié)果表明基于用戶標簽和用戶行為優(yōu)化的ListNet答案排序方法能不同程度地提高答案排序的效果。
【關(guān)鍵詞】:社區(qū)問答系統(tǒng) 用戶特征 ListNet 排序?qū)W習 排序模型
【學位授予單位】:昆明理工大學
【學位級別】:碩士
【學位授予年份】:2016
【分類號】:TP391.3
【目錄】:
- 摘要5-7
- Abstract7-13
- 第一章 緒論13-19
- 1.1 研究背景及意義13-14
- 1.2 國內(nèi)外研究現(xiàn)狀14-16
- 1.3 論文的研究內(nèi)容16-17
- 1.4 論文的組織17-19
- 第二章 分類與排序?qū)W習的理論知識19-29
- 2.1 引言19
- 2.2 分類算法簡介19-21
- 2.2.1 傳統(tǒng)的分類方法19-20
- 2.2.2 基于機器學習的分類方法20-21
- 2.3 排序?qū)W習問題21-24
- 2.3.1 傳統(tǒng)排序模型21-22
- 2.3.2 排序?qū)W習簡介22-24
- 2.4 排序?qū)W習算法24-26
- 2.4.1 PointWise排序?qū)W習方法24
- 2.4.2 PairWise排序?qū)W習方法24-25
- 2.4.3 ListWise排序?qū)W習方法25-26
- 2.5 排序?qū)W習性能評價指標26-28
- 2.5.1 P@n(Precision at position n)26
- 2.5.2 MAP(Mean average precision)26-27
- 2.5.3 MRR(Mean Reciprocal Ranking)27
- 2.5.4 NDCG(Normalized discount cumulative gain)27-28
- 2.6 本章小結(jié)28-29
- 第三章 社區(qū)問答中問句及答案的特征提取29-35
- 3.1 引言29-30
- 3.2 社區(qū)問答中影響排序的因素30-31
- 3.2.1 用戶的標簽30
- 3.2.2 用戶的行為30-31
- 3.3 社區(qū)問答中問句及答案的特征提取31-33
- 3.3.1 TFIDF特征提取31-32
- 3.3.2 基于同義詞詞林的語義擴展度特征提取32-33
- 3.4 融入用戶標簽和用戶行為的特征優(yōu)化33-34
- 3.5 本章小結(jié)34-35
- 第四章 基于集成方法的半監(jiān)督問句分類35-43
- 4.1 引言35-36
- 4.2 集成學習方法簡介36-37
- 4.3 基于集成的半監(jiān)督分類方法介紹37-38
- 4.4 實驗數(shù)據(jù)與參數(shù)設(shè)置38
- 4.5 實驗設(shè)計與結(jié)果分析38-42
- 4.5.1 中文問句分類特征提取方法比較分析38-40
- 4.5.2 中文問句分類集成方法和單一分類器的比較分析40-41
- 4.5.3 半監(jiān)督方法Semi-Bagging與監(jiān)督方法Bagging問句分類比較41-42
- 4.6 本章小結(jié)42-43
- 第五章 融入用戶標簽和行為特征的列表排序方法43-49
- 5.1 引言43
- 5.2 用戶標簽和行為特征的提取43-44
- 5.3 ListNet列表排序方法介紹44-45
- 5.4 實驗數(shù)據(jù)與參數(shù)設(shè)置45
- 5.5 實驗設(shè)計與結(jié)果分析45-48
- 5.5.1 不同排序?qū)W習方法的答案排序比較分析45-46
- 5.5.2 融入用戶標簽和行為特征的列表排序方法46-48
- 5.6 本章小結(jié)48-49
- 第六章 基于用戶標簽和行為優(yōu)化的列表排序方法49-55
- 6.1 引言49
- 6.2 基于用戶標簽和行為優(yōu)化的列表排序方法49-50
- 6.3 實驗數(shù)據(jù)與參數(shù)設(shè)置50
- 6.4 實驗設(shè)計與結(jié)果分析50-53
- 6.4.1 不同評價指標的排序結(jié)果比較分析50-51
- 6.4.2 不同維度的排序比較分析51-53
- 6.5 本章小結(jié)53-55
- 第七章 總結(jié)與展望55-57
- 7.1 總結(jié)55-56
- 7.2 工作展望56-57
- 致謝57-59
- 參考文獻59-65
- 附錄A 攻讀碩士學位期間發(fā)表論文與申請軟件著作權(quán)65-67
- 附錄B 攻讀碩士期間參與項目67
【相似文獻】
中國期刊全文數(shù)據(jù)庫 前10條
1 毛先領(lǐng);李曉明;;問答系統(tǒng)研究綜述[J];計算機科學與探索;2012年03期
2 莫麗萍,王樹西,姜吉發(fā),雷雨霞;問答系統(tǒng)和淺層結(jié)構(gòu)模式推理[J];廣西師范大學學報(自然科學版);2004年01期
3 盧志堅,張冬茉;中文問答系統(tǒng)中的問句理解[J];計算機工程;2004年18期
4 王樹西;問答系統(tǒng):核心技術(shù)、發(fā)展趨勢[J];計算機工程與應用;2005年18期
5 林曉慶;;問答系統(tǒng)中基于列表類問題的研究[J];電腦知識與技術(shù)(學術(shù)交流);2007年07期
6 張積賓;徐志明;王恒;潘啟樹;;面向大規(guī)模網(wǎng)絡(luò)數(shù)據(jù)的社會化問答系統(tǒng)[J];哈爾濱工業(yè)大學學報;2008年12期
7 賈君枝;毛海飛;;漢語框架網(wǎng)絡(luò)問答系統(tǒng)問句處理研究[J];圖書情報工作;2008年10期
8 胡小華;劉軒;劉丹;陸偉;;基于冗余的仿真問答系統(tǒng)的輕量級局部文本分析[J];圖書情報知識;2009年01期
9 張中峰;李秋丹;;社區(qū)問答系統(tǒng)研究綜述[J];計算機科學;2010年11期
10 陳玉;;基于“為什么”問句的中文問答系統(tǒng)研究[J];農(nóng)業(yè)網(wǎng)絡(luò)信息;2010年11期
中國重要會議論文全文數(shù)據(jù)庫 前10條
1 何靖;陳,
本文編號:1047224
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/1047224.html