基于B細胞算法的排序?qū)W習方法研究
本文關(guān)鍵詞:基于B細胞算法的排序?qū)W習方法研究
更多相關(guān)文章: 信息檢索 并行算法 B細胞算法 排序?qū)W習 排序函數(shù)
【摘要】:排序?qū)W習是一種利用訓練數(shù)據(jù)自動構(gòu)建排序模型的技術(shù),廣泛應(yīng)用于信息檢索領(lǐng)域。傳統(tǒng)基于損失函數(shù)的排序?qū)W習方法存在優(yōu)化目標不直接以及計算復(fù)雜度高等缺陷,為了能夠直接將信息檢索領(lǐng)域的評價指標函數(shù)作為優(yōu)化對象,出現(xiàn)了基于遺傳算法和克隆選擇算法的排序?qū)W習方法,雖然解決了優(yōu)化目標不直接這一問題,但是學習時間仍然沒有得到有效改善。為了既能保證最優(yōu)排序函數(shù)的質(zhì)量,又同時降低學習時間,本文將B細胞算法用于解決排序?qū)W習問題,研究基于B細胞算法的排序?qū)W習方法,研究內(nèi)容主要包含以下三個方面:(1)針對排序?qū)W習問題定義抗原、抗體和親和力,以將B細胞算法應(yīng)用于排序?qū)W習。B細胞算法是一種基于克隆選擇機制的免疫算法,為了能夠?qū)⑵鋺?yīng)用于解決排序?qū)W習問題,需要將抗體、抗原以及親和力針對排序?qū)W習問題進行具體定義。本文將抗體定義為候選排序函數(shù),將抗原定義為以查詢?yōu)閱挝坏奈臋n列表,將親和力定義為評價排序函數(shù)性能的評價指標函數(shù)。(2)構(gòu)建抗體的先序編碼序列,以實現(xiàn)抗體上的連續(xù)區(qū)域變異。研究表明B細胞算法比克隆選擇算法收斂速度更快,其原因在于B細胞算法使用一種連續(xù)區(qū)域變異算子。由于抗體使用樹結(jié)構(gòu)進行表示,無法直接在樹上進行連續(xù)區(qū)域變異。所以,本文定義抗體樹的先序編碼序列,先序編碼序列中的連續(xù)區(qū)域與樹結(jié)構(gòu)中的連續(xù)區(qū)域具有對應(yīng)關(guān)系。在抗體樹的先序編碼序列上定義連續(xù)區(qū)域變異算子以及變異規(guī)則,抗體樹先序編碼的另一個優(yōu)點是降低計算復(fù)雜度,因為每個節(jié)點變異無需遍歷樹,只需在線性序列上執(zhí)行。(3)對B細胞算法并行化,以提高學習效率。B細胞算法是一種快速、簡單的群智能優(yōu)化算法,具有天然的并行特征,所以在研究其他并行算法的基礎(chǔ)上,將B細胞算法并行化。并行B細胞算法能夠充分利用現(xiàn)代計算機多核處理器的優(yōu)勢,在同樣的學習任務(wù)上成倍降低計算時間。除了減少學習時間,本文在并行算法中添加交叉操作以豐富種群多樣性,提高學習的精度。在以上研究的基礎(chǔ)上,提出基于B細胞算法的排序?qū)W習算法Rank BCA以及基于并行B細胞算法的排序?qū)W習算法PRank BCA。通過實驗將這兩個算法與Rank SVM、Rank Boost、Ada Rank-MAP和List Net進行比較,實驗證明在OHSUMED數(shù)據(jù)集上Rank BCA表現(xiàn)優(yōu)于Rank SVM和Rank Boost,而PRank BCA的表現(xiàn)優(yōu)于4種算法且更穩(wěn)定。在MQ2007數(shù)據(jù)集上,Rank BCA和PRank BCA表現(xiàn)優(yōu)于Ada Rank-MAP而低于另外三種。每個數(shù)據(jù)集上的PRank BCA均優(yōu)于Rank BCA。在學習時間方面,PRank BCA有著較好的加速比,在同樣問題規(guī)模的條件下,PRank BCA將學習時間大幅度降低,并且隨著問題規(guī)模的增大,并行算法的優(yōu)越性會進一步凸顯。這些結(jié)果證明了B細胞算法能夠有效解決排序?qū)W習問題。
【關(guān)鍵詞】:信息檢索 并行算法 B細胞算法 排序?qū)W習 排序函數(shù)
【學位授予單位】:太原理工大學
【學位級別】:碩士
【學位授予年份】:2016
【分類號】:TP18
【目錄】:
- 摘要3-5
- ABSTRACT5-10
- 第一章 緒論10-22
- 1.1 課題的研究背景和意義10-12
- 1.1.1 課題的研究背景10-11
- 1.1.2 課題的研究意義11-12
- 1.2 研究現(xiàn)狀12-18
- 1.3 論文研究內(nèi)容和組織結(jié)構(gòu)18-22
- 1.3.1 論文研究內(nèi)容18-20
- 1.3.2 論文組織結(jié)構(gòu)20-22
- 第二章 相關(guān)研究理論基礎(chǔ)22-32
- 2.1 信息檢索模型22-29
- 2.1.1 排序模型概述22-24
- 2.1.2 傳統(tǒng)排序模型24-27
- 2.1.3 排序?qū)W習一般框架27-29
- 2.2 測評方法29-30
- 2.3 B細胞算法30-31
- 2.4 本章小結(jié)31-32
- 第三章 基于B細胞算法的排序?qū)W習算法32-42
- 3.1 概述32
- 3.2 Rank BCA相關(guān)定義32-37
- 3.2.1 抗體、抗原和親和力32-36
- 3.2.2 抗體先序編碼36-37
- 3.3 Rank BCA算法37-38
- 3.4 Rank BCA算法實現(xiàn)38-41
- 3.4.1 初始化38-39
- 3.4.2 克隆39
- 3.4.3 變異規(guī)則與變異算子39-40
- 3.4.4 選擇最優(yōu)抗體40-41
- 3.5 本章小結(jié)41-42
- 第四章 基于并行B細胞算法的排序?qū)W習算法42-54
- 4.1 概述42
- 4.2 并行B細胞算法42-50
- 4.2.1 并行B細胞算法設(shè)計42-45
- 4.2.2 B細胞算法并行框架45-47
- 4.2.3 并行B細胞算法描述47-50
- 4.3 排序?qū)W習算法PRank BCA設(shè)計50-51
- 4.4 PRank BCA算法描述51-52
- 4.5 PRank BCA算法實現(xiàn)52-53
- 4.6 本章小結(jié)53-54
- 第五章 相關(guān)實驗54-72
- 5.1 數(shù)據(jù)集54-56
- 5.2 實驗環(huán)境與數(shù)據(jù)處理56-57
- 5.3 實驗設(shè)計57-61
- 5.3.1 總體設(shè)計57-59
- 5.3.2 詳細設(shè)計59-61
- 5.4 實驗參數(shù)設(shè)置61
- 5.5 評價指標與評價過程61-64
- 5.5.1 評價指標61-63
- 5.5.2 評價過程63-64
- 5.6 實驗結(jié)果64-70
- 5.6.1 精度對比64-69
- 5.6.2 加速比69-70
- 5.7 本章小結(jié)70-72
- 第六章 總結(jié)與展望72-74
- 參考文獻74-78
- 致謝78-80
- 攻讀碩士學位期間發(fā)表的學術(shù)論文目錄80
【相似文獻】
中國期刊全文數(shù)據(jù)庫 前10條
1 張睿;翟瑩瑩;譚翔;代勇;呂振遼;韓俊青;;電力交易規(guī)則算法庫系統(tǒng)的設(shè)計與開發(fā)[J];控制工程;2013年S1期
2 王詠剛;;黑鐵時代的算法“悖論"[J];程序員;2006年04期
3 樊鑫;李興衛(wèi);;基于SCA的DBF算法可重構(gòu)設(shè)計及其仿真實現(xiàn)[J];軟件導(dǎo)刊;2009年11期
4 李玉梅;;按學習情境設(shè)計的數(shù)據(jù)結(jié)構(gòu)算法庫[J];電腦知識與技術(shù);2011年30期
5 杜中華;狄長春;;一種基于人工神經(jīng)網(wǎng)絡(luò)和優(yōu)化算法庫的復(fù)雜虛擬樣機優(yōu)化通用方法[J];機械工程師;2009年10期
6 宋明;劉麗;;SBA中生命周期費用預(yù)測算法庫的研究[J];系統(tǒng)仿真學報;2009年S2期
7 王宏艷;;基于可擴展算法庫的多Agent社會體系結(jié)構(gòu)[J];燕山大學學報;2005年06期
8 李惠君;王志宇;張芳;張毅;;基于可擴展算法庫的多Agent社會體系結(jié)構(gòu)[J];計算機工程與設(shè)計;2006年09期
9 張?zhí)拈?;Z-80微型機BASIC常用算法庫建庫技術(shù)[J];化工自動化及儀表;1981年08期
10 趙賓賓;高慧敏;;進化算法研究平臺的設(shè)計與開發(fā)[J];太原科技大學學報;2011年06期
中國博士學位論文全文數(shù)據(jù)庫 前1條
1 張全;相位差算法的并行化分析與實現(xiàn)[D];電子科技大學;2015年
中國碩士學位論文全文數(shù)據(jù)庫 前10條
1 蔣爽;面向云應(yīng)用的負載預(yù)測框架[D];上海交通大學;2015年
2 張弘弦;基于B細胞算法的排序?qū)W習方法研究[D];太原理工大學;2016年
3 陳淑珍;工業(yè)在線色譜工作站算法庫的開發(fā)[D];浙江大學;2013年
4 廖晶貴;基于Hadoop的大數(shù)據(jù)關(guān)聯(lián)規(guī)則挖掘算法的研究與實現(xiàn)[D];華南理工大學;2015年
5 王兵;密度聚類算法的研究與應(yīng)用[D];西安電子科技大學;2012年
6 程進偉;濾波定位算法評估方法研究[D];上海交通大學;2013年
7 郝曉麗;信息檢索系統(tǒng)的算法庫研究[D];天津大學;2006年
8 余輝;基于Mahout的聚類算法的研究[D];上海師范大學;2014年
9 鮑宇;免費機場接送服務(wù)中基于時間優(yōu)先的聚類算法研究[D];東北大學;2011年
10 謝俊凰;進化算法研究平臺的設(shè)計與開發(fā)—數(shù)據(jù)處理[D];太原科技大學;2011年
,本文編號:865301
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/865301.html