基于深度學(xué)習(xí)的專家列表排序方法研究
發(fā)布時間:2017-05-06 16:07
本文關(guān)鍵詞:基于深度學(xué)習(xí)的專家列表排序方法研究,由筆耕文化傳播整理發(fā)布。
【摘要】:不論是在研究機構(gòu)還是在大型企業(yè)都需要有豐富的專業(yè)知識和技能,代表著領(lǐng)域前沿發(fā)展的專家,去領(lǐng)導(dǎo)團隊開展工作,提高工作效率,所以如何有效的找到相關(guān)領(lǐng)域的專家至關(guān)重要。傳統(tǒng)的方法通常借助搜索引擎對專家進行檢索,存在準確率低和信息不全等弊端,因此面向?qū)<疫@一特定人群進行垂直信息檢索是非常必要的。專家檢索是基于表征專家專長的各種資源,識別專家在某給定查詢主題下的相關(guān)性程度,并按相關(guān)程度高低進行排序并顯示專家結(jié)果列表的過程。專家檢索是最有效的獲取專家信息的方法,而專家排序是專家檢索的核心,專家排序方法的優(yōu)劣決定了專家檢索的精度,因此專家排序具有重要的研究價值。本文圍繞專家排序這一問題,主要在以下幾個方面展開深入研究與探討: (1)提出了一種融合特征層次類型信息的專家列表排序方法。 該方法針對專家排序的特點進行深入分析,定義了查詢和文檔相關(guān)性特征,頁面內(nèi)容特征,語言模型特征和專家相關(guān)特征四大類特征。不同類型的特征對專家排序的貢獻程度不同,因此根據(jù)貢獻程度的大小定義了特征層次類型值。最后將特征層次類型信息結(jié)合專家列表的思想對專家進行排序。 (2)提出了一種基于深度學(xué)習(xí)的專家排序方法。 該方法針對神經(jīng)網(wǎng)絡(luò)由于隨機初始化導(dǎo)致的容易陷入局部最小和訓(xùn)練時間過長,并且不能更好的逼近排序函數(shù)等缺點,提出通過受限玻爾茲曼機RBM無監(jiān)督的自訓(xùn)練得到較優(yōu)的參數(shù)來逐層初始化權(quán)重,進而構(gòu)建深度可信網(wǎng)DBN模型對專家進行排序。 (3)提出了一種基于深度學(xué)習(xí)的專家列表排序方法。 傳統(tǒng)的受限玻爾茲曼機RBM在自訓(xùn)練求解參數(shù)時是將單個專家文檔作為一個訓(xùn)練實例,沒有考慮專家列表之間的相關(guān)性,因此對受限玻爾茲曼機進行了改進,將查詢對應(yīng)的所有專家文檔形成的訓(xùn)練實例輸入到受限玻爾茲曼機中并全部訓(xùn)練結(jié)束后,整體進行一次更新,并且此處采用余弦值取代矩陣簡單相減對更新變量△W進行計算。 (4)利用上述研究成果,設(shè)計實現(xiàn)了基于深度學(xué)習(xí)的專家列表排序原型系統(tǒng)。
【關(guān)鍵詞】:專家排序 列表排序 深度學(xué)習(xí) 深度可信網(wǎng)絡(luò) 受限玻爾茲曼機
【學(xué)位授予單位】:昆明理工大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2014
【分類號】:TP391.3
【目錄】:
- 摘要5-6
- Abstract6-11
- 第一章 緒論11-17
- 1.1 研究背景及意義11-12
- 1.2 國內(nèi)外研究現(xiàn)狀12-15
- 1.3 論文的研究內(nèi)容15-16
- 1.4 論文的組織16-17
- 第二章 排序?qū)W習(xí)基礎(chǔ)理論17-31
- 2.1 排序?qū)W習(xí)17-21
- 2.1.1 pointwise排序?qū)W習(xí)方法17-19
- 2.1.2 pairwise排序?qū)W習(xí)19-20
- 2.1.3 listwise排序?qū)W習(xí)20-21
- 2.2 專家排序?qū)W習(xí)模型21-25
- 2.2.1 專家模型21-23
- 2.2.2 文檔模型23-24
- 2.2.3 投票模型24
- 2.2.4 鏈接分析模型24-25
- 2.3 專家排序相關(guān)系統(tǒng)25
- 2.4 深度可信網(wǎng)絡(luò)25-26
- 2.5 排序?qū)W習(xí)性能評價指標26-29
- 2.5.1 MRR(Mean Reciprocal Ranking)26-27
- 2.5.2 Mean average precision(MAP)27-28
- 2.5.3 Precision at position n (P@n)28
- 2.5.4 Normalized discount cumulative gain(NDCG)28-29
- 2.6 本章小結(jié)29-31
- 第三章 融合特征層次類型信息的專家列表排序方法31-43
- 3.1 引言31
- 3.2 特征提取31-35
- 3.2.1 查詢和文檔相關(guān)性特征32
- 3.2.2 頁面內(nèi)容特征32-33
- 3.2.3 語言模型33-35
- 3.2.4 專家相關(guān)特征35
- 3.3 特征層次類型35-36
- 3.4 融合特征層次類型的專家列表排序?qū)W習(xí)模型36-40
- 3.4.1 神經(jīng)網(wǎng)絡(luò)模型36-38
- 3.4.2 梯度下降算法38-39
- 3.4.3 專家列表排序模型39-40
- 3.5 實驗設(shè)置和分析40-42
- 3.5.1 不同特征對排序?qū)W習(xí)的影響40-41
- 3.5.2 融入特征層次類型對排序?qū)W習(xí)的影響41-42
- 3.5.3 不同排序方法效果比較42
- 3.6 小結(jié)42-43
- 第四章 基于深度學(xué)習(xí)的專家排序方法43-51
- 4.1 引言43-44
- 4.2 深度學(xué)習(xí)模型44-47
- 4.2.1 深度可信網(wǎng)絡(luò)DBN44-45
- 4.2.2 受限玻爾茲曼機RBM自訓(xùn)練過程45-46
- 4.2.3 BP神經(jīng)網(wǎng)絡(luò)微調(diào)DBN過程46-47
- 4.3 實驗設(shè)計以及結(jié)果分析47-49
- 4.3.1 深度學(xué)習(xí)的學(xué)習(xí)層數(shù)對排序結(jié)果的影響47
- 4.3.2 每層節(jié)點個數(shù)對排序結(jié)果的影響47-48
- 4.3.3 不同排序?qū)W習(xí)方法的比較48-49
- 4.4 本章小結(jié)49-51
- 第五章 基于深度學(xué)習(xí)的專家列表排序方法51-61
- 5.1 引言51
- 5.2 基于深度學(xué)習(xí)的專家列表學(xué)習(xí)排序方法51-57
- 5.2.1 RBM理論研究51-54
- 5.2.2 列表思想54-55
- 5.2.3 改進深度學(xué)習(xí)模型55-57
- 5.3 實驗設(shè)計以及結(jié)果分析57-59
- 5.3.1 不同RBM層數(shù)對專家列表排序性能的影響57-58
- 5.3.2 與傳統(tǒng)的排序?qū)W習(xí)方法的比較58
- 5.3.3 基于深度學(xué)習(xí)的專家列表排序方法的有效性58-59
- 5.4 本章小結(jié)59-61
- 第六章 基于深度學(xué)習(xí)的專家列表排序原型系統(tǒng)61-65
- 6.1 引言61
- 6.2 實驗壞境61
- 6.3 語料收集61-62
- 6.4 專家排序系統(tǒng)的設(shè)計與實現(xiàn)62-64
- 6.4.1 系統(tǒng)框架62-63
- 6.4.2 專家排序系統(tǒng)實現(xiàn)效果63-64
- 6.5 本章小結(jié)64-65
- 第七章 總結(jié)和展望65-67
- 7.1 總結(jié)65
- 7.2 工作展望65-67
- 致謝67-69
- 參考文獻69-75
- 附錄A 攻讀碩士期間發(fā)表的論文75-76
- 附錄B 攻讀碩士期間參與項目與申請軟件著作權(quán)76
【參考文獻】
中國期刊全文數(shù)據(jù)庫 前2條
1 奚雪峰;周國棟;;基于Deep Learning的代詞指代消解[J];北京大學(xué)學(xué)報(自然科學(xué)版);2014年01期
2 王文鈞;李巍;;垂直搜索引擎的現(xiàn)狀與發(fā)展探究[J];情報科學(xué);2010年03期
本文關(guān)鍵詞:基于深度學(xué)習(xí)的專家列表排序方法研究,,由筆耕文化傳播整理發(fā)布。
本文編號:348706
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/348706.html
最近更新
教材專著