基于B細(xì)胞算法的排序?qū)W習(xí)方法研究
本文關(guān)鍵詞:基于B細(xì)胞算法的排序?qū)W習(xí)方法研究
更多相關(guān)文章: 信息檢索 并行算法 B細(xì)胞算法 排序?qū)W習(xí) 排序函數(shù)
【摘要】:排序?qū)W習(xí)是一種利用訓(xùn)練數(shù)據(jù)自動(dòng)構(gòu)建排序模型的技術(shù),廣泛應(yīng)用于信息檢索領(lǐng)域。傳統(tǒng)基于損失函數(shù)的排序?qū)W習(xí)方法存在優(yōu)化目標(biāo)不直接以及計(jì)算復(fù)雜度高等缺陷,為了能夠直接將信息檢索領(lǐng)域的評(píng)價(jià)指標(biāo)函數(shù)作為優(yōu)化對(duì)象,出現(xiàn)了基于遺傳算法和克隆選擇算法的排序?qū)W習(xí)方法,雖然解決了優(yōu)化目標(biāo)不直接這一問(wèn)題,但是學(xué)習(xí)時(shí)間仍然沒(méi)有得到有效改善。為了既能保證最優(yōu)排序函數(shù)的質(zhì)量,又同時(shí)降低學(xué)習(xí)時(shí)間,本文將B細(xì)胞算法用于解決排序?qū)W習(xí)問(wèn)題,研究基于B細(xì)胞算法的排序?qū)W習(xí)方法,研究?jī)?nèi)容主要包含以下三個(gè)方面:(1)針對(duì)排序?qū)W習(xí)問(wèn)題定義抗原、抗體和親和力,以將B細(xì)胞算法應(yīng)用于排序?qū)W習(xí)。B細(xì)胞算法是一種基于克隆選擇機(jī)制的免疫算法,為了能夠?qū)⑵鋺?yīng)用于解決排序?qū)W習(xí)問(wèn)題,需要將抗體、抗原以及親和力針對(duì)排序?qū)W習(xí)問(wèn)題進(jìn)行具體定義。本文將抗體定義為候選排序函數(shù),將抗原定義為以查詢?yōu)閱挝坏奈臋n列表,將親和力定義為評(píng)價(jià)排序函數(shù)性能的評(píng)價(jià)指標(biāo)函數(shù)。(2)構(gòu)建抗體的先序編碼序列,以實(shí)現(xiàn)抗體上的連續(xù)區(qū)域變異。研究表明B細(xì)胞算法比克隆選擇算法收斂速度更快,其原因在于B細(xì)胞算法使用一種連續(xù)區(qū)域變異算子。由于抗體使用樹(shù)結(jié)構(gòu)進(jìn)行表示,無(wú)法直接在樹(shù)上進(jìn)行連續(xù)區(qū)域變異。所以,本文定義抗體樹(shù)的先序編碼序列,先序編碼序列中的連續(xù)區(qū)域與樹(shù)結(jié)構(gòu)中的連續(xù)區(qū)域具有對(duì)應(yīng)關(guān)系。在抗體樹(shù)的先序編碼序列上定義連續(xù)區(qū)域變異算子以及變異規(guī)則,抗體樹(shù)先序編碼的另一個(gè)優(yōu)點(diǎn)是降低計(jì)算復(fù)雜度,因?yàn)槊總(gè)節(jié)點(diǎn)變異無(wú)需遍歷樹(shù),只需在線性序列上執(zhí)行。(3)對(duì)B細(xì)胞算法并行化,以提高學(xué)習(xí)效率。B細(xì)胞算法是一種快速、簡(jiǎn)單的群智能優(yōu)化算法,具有天然的并行特征,所以在研究其他并行算法的基礎(chǔ)上,將B細(xì)胞算法并行化。并行B細(xì)胞算法能夠充分利用現(xiàn)代計(jì)算機(jī)多核處理器的優(yōu)勢(shì),在同樣的學(xué)習(xí)任務(wù)上成倍降低計(jì)算時(shí)間。除了減少學(xué)習(xí)時(shí)間,本文在并行算法中添加交叉操作以豐富種群多樣性,提高學(xué)習(xí)的精度。在以上研究的基礎(chǔ)上,提出基于B細(xì)胞算法的排序?qū)W習(xí)算法Rank BCA以及基于并行B細(xì)胞算法的排序?qū)W習(xí)算法PRank BCA。通過(guò)實(shí)驗(yàn)將這兩個(gè)算法與Rank SVM、Rank Boost、Ada Rank-MAP和List Net進(jìn)行比較,實(shí)驗(yàn)證明在OHSUMED數(shù)據(jù)集上Rank BCA表現(xiàn)優(yōu)于Rank SVM和Rank Boost,而PRank BCA的表現(xiàn)優(yōu)于4種算法且更穩(wěn)定。在MQ2007數(shù)據(jù)集上,Rank BCA和PRank BCA表現(xiàn)優(yōu)于Ada Rank-MAP而低于另外三種。每個(gè)數(shù)據(jù)集上的PRank BCA均優(yōu)于Rank BCA。在學(xué)習(xí)時(shí)間方面,PRank BCA有著較好的加速比,在同樣問(wèn)題規(guī)模的條件下,PRank BCA將學(xué)習(xí)時(shí)間大幅度降低,并且隨著問(wèn)題規(guī)模的增大,并行算法的優(yōu)越性會(huì)進(jìn)一步凸顯。這些結(jié)果證明了B細(xì)胞算法能夠有效解決排序?qū)W習(xí)問(wèn)題。
【關(guān)鍵詞】:信息檢索 并行算法 B細(xì)胞算法 排序?qū)W習(xí) 排序函數(shù)
【學(xué)位授予單位】:太原理工大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2016
【分類號(hào)】:TP18
【目錄】:
- 摘要3-5
- ABSTRACT5-10
- 第一章 緒論10-22
- 1.1 課題的研究背景和意義10-12
- 1.1.1 課題的研究背景10-11
- 1.1.2 課題的研究意義11-12
- 1.2 研究現(xiàn)狀12-18
- 1.3 論文研究?jī)?nèi)容和組織結(jié)構(gòu)18-22
- 1.3.1 論文研究?jī)?nèi)容18-20
- 1.3.2 論文組織結(jié)構(gòu)20-22
- 第二章 相關(guān)研究理論基礎(chǔ)22-32
- 2.1 信息檢索模型22-29
- 2.1.1 排序模型概述22-24
- 2.1.2 傳統(tǒng)排序模型24-27
- 2.1.3 排序?qū)W習(xí)一般框架27-29
- 2.2 測(cè)評(píng)方法29-30
- 2.3 B細(xì)胞算法30-31
- 2.4 本章小結(jié)31-32
- 第三章 基于B細(xì)胞算法的排序?qū)W習(xí)算法32-42
- 3.1 概述32
- 3.2 Rank BCA相關(guān)定義32-37
- 3.2.1 抗體、抗原和親和力32-36
- 3.2.2 抗體先序編碼36-37
- 3.3 Rank BCA算法37-38
- 3.4 Rank BCA算法實(shí)現(xiàn)38-41
- 3.4.1 初始化38-39
- 3.4.2 克隆39
- 3.4.3 變異規(guī)則與變異算子39-40
- 3.4.4 選擇最優(yōu)抗體40-41
- 3.5 本章小結(jié)41-42
- 第四章 基于并行B細(xì)胞算法的排序?qū)W習(xí)算法42-54
- 4.1 概述42
- 4.2 并行B細(xì)胞算法42-50
- 4.2.1 并行B細(xì)胞算法設(shè)計(jì)42-45
- 4.2.2 B細(xì)胞算法并行框架45-47
- 4.2.3 并行B細(xì)胞算法描述47-50
- 4.3 排序?qū)W習(xí)算法PRank BCA設(shè)計(jì)50-51
- 4.4 PRank BCA算法描述51-52
- 4.5 PRank BCA算法實(shí)現(xiàn)52-53
- 4.6 本章小結(jié)53-54
- 第五章 相關(guān)實(shí)驗(yàn)54-72
- 5.1 數(shù)據(jù)集54-56
- 5.2 實(shí)驗(yàn)環(huán)境與數(shù)據(jù)處理56-57
- 5.3 實(shí)驗(yàn)設(shè)計(jì)57-61
- 5.3.1 總體設(shè)計(jì)57-59
- 5.3.2 詳細(xì)設(shè)計(jì)59-61
- 5.4 實(shí)驗(yàn)參數(shù)設(shè)置61
- 5.5 評(píng)價(jià)指標(biāo)與評(píng)價(jià)過(guò)程61-64
- 5.5.1 評(píng)價(jià)指標(biāo)61-63
- 5.5.2 評(píng)價(jià)過(guò)程63-64
- 5.6 實(shí)驗(yàn)結(jié)果64-70
- 5.6.1 精度對(duì)比64-69
- 5.6.2 加速比69-70
- 5.7 本章小結(jié)70-72
- 第六章 總結(jié)與展望72-74
- 參考文獻(xiàn)74-78
- 致謝78-80
- 攻讀碩士學(xué)位期間發(fā)表的學(xué)術(shù)論文目錄80
【相似文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前10條
1 張睿;翟瑩瑩;譚翔;代勇;呂振遼;韓俊青;;電力交易規(guī)則算法庫(kù)系統(tǒng)的設(shè)計(jì)與開(kāi)發(fā)[J];控制工程;2013年S1期
2 王詠剛;;黑鐵時(shí)代的算法“悖論"[J];程序員;2006年04期
3 樊鑫;李興衛(wèi);;基于SCA的DBF算法可重構(gòu)設(shè)計(jì)及其仿真實(shí)現(xiàn)[J];軟件導(dǎo)刊;2009年11期
4 李玉梅;;按學(xué)習(xí)情境設(shè)計(jì)的數(shù)據(jù)結(jié)構(gòu)算法庫(kù)[J];電腦知識(shí)與技術(shù);2011年30期
5 杜中華;狄長(zhǎng)春;;一種基于人工神經(jīng)網(wǎng)絡(luò)和優(yōu)化算法庫(kù)的復(fù)雜虛擬樣機(jī)優(yōu)化通用方法[J];機(jī)械工程師;2009年10期
6 宋明;劉麗;;SBA中生命周期費(fèi)用預(yù)測(cè)算法庫(kù)的研究[J];系統(tǒng)仿真學(xué)報(bào);2009年S2期
7 王宏艷;;基于可擴(kuò)展算法庫(kù)的多Agent社會(huì)體系結(jié)構(gòu)[J];燕山大學(xué)學(xué)報(bào);2005年06期
8 李惠君;王志宇;張芳;張毅;;基于可擴(kuò)展算法庫(kù)的多Agent社會(huì)體系結(jié)構(gòu)[J];計(jì)算機(jī)工程與設(shè)計(jì);2006年09期
9 張?zhí)拈?;Z-80微型機(jī)BASIC常用算法庫(kù)建庫(kù)技術(shù)[J];化工自動(dòng)化及儀表;1981年08期
10 趙賓賓;高慧敏;;進(jìn)化算法研究平臺(tái)的設(shè)計(jì)與開(kāi)發(fā)[J];太原科技大學(xué)學(xué)報(bào);2011年06期
中國(guó)博士學(xué)位論文全文數(shù)據(jù)庫(kù) 前1條
1 張全;相位差算法的并行化分析與實(shí)現(xiàn)[D];電子科技大學(xué);2015年
中國(guó)碩士學(xué)位論文全文數(shù)據(jù)庫(kù) 前10條
1 蔣爽;面向云應(yīng)用的負(fù)載預(yù)測(cè)框架[D];上海交通大學(xué);2015年
2 張弘弦;基于B細(xì)胞算法的排序?qū)W習(xí)方法研究[D];太原理工大學(xué);2016年
3 陳淑珍;工業(yè)在線色譜工作站算法庫(kù)的開(kāi)發(fā)[D];浙江大學(xué);2013年
4 廖晶貴;基于Hadoop的大數(shù)據(jù)關(guān)聯(lián)規(guī)則挖掘算法的研究與實(shí)現(xiàn)[D];華南理工大學(xué);2015年
5 王兵;密度聚類算法的研究與應(yīng)用[D];西安電子科技大學(xué);2012年
6 程進(jìn)偉;濾波定位算法評(píng)估方法研究[D];上海交通大學(xué);2013年
7 郝曉麗;信息檢索系統(tǒng)的算法庫(kù)研究[D];天津大學(xué);2006年
8 余輝;基于Mahout的聚類算法的研究[D];上海師范大學(xué);2014年
9 鮑宇;免費(fèi)機(jī)場(chǎng)接送服務(wù)中基于時(shí)間優(yōu)先的聚類算法研究[D];東北大學(xué);2011年
10 謝俊凰;進(jìn)化算法研究平臺(tái)的設(shè)計(jì)與開(kāi)發(fā)—數(shù)據(jù)處理[D];太原科技大學(xué);2011年
,本文編號(hào):865301
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/865301.html