基于演化算法的序回歸技術(shù)研究
本文關(guān)鍵詞:基于演化算法的序回歸技術(shù)研究
更多相關(guān)文章: 序回歸 半監(jiān)督學(xué)習(xí) 核判別分析 標(biāo)簽傳播 演化算法 差分進(jìn)化
【摘要】:在很多實(shí)際應(yīng)用中,數(shù)據(jù)的類(lèi)別之間存在一種自然的序關(guān)系。例如,我們用1~5星去評(píng)價(jià)一部電影,3星評(píng)價(jià)高于2星評(píng)價(jià),而4星評(píng)價(jià)低于5星評(píng)價(jià)。和標(biāo)稱(chēng)數(shù)據(jù)不同,我們稱(chēng)這樣一類(lèi)數(shù)據(jù)為有序數(shù)據(jù)。有序數(shù)據(jù)的類(lèi)別之間可以排序,但類(lèi)別之間的差異卻沒(méi)有精確的定義。例如,對(duì)電影的3星評(píng)價(jià)通常被認(rèn)為優(yōu)于2星評(píng)價(jià),但是3星究竟比2星好多少卻難以度量。預(yù)測(cè)有序數(shù)據(jù)的序的學(xué)習(xí)問(wèn)題,稱(chēng)之為序回歸。序回歸有著廣泛的實(shí)際應(yīng)用場(chǎng)景,例如情感分析、信息檢索、推薦系統(tǒng)、信用評(píng)價(jià)、醫(yī)學(xué)等。序回歸問(wèn)題作為機(jī)器學(xué)習(xí)、數(shù)據(jù)挖掘領(lǐng)域重要的問(wèn)題之一,越來(lái)越受到研究者們的關(guān)注。已有的工作主要集中在研究有監(jiān)督序回歸問(wèn)題。然而,當(dāng)缺少足夠的有標(biāo)簽數(shù)據(jù)時(shí),該問(wèn)題變得難以處理。在很多實(shí)際應(yīng)用中,有標(biāo)簽數(shù)據(jù)往往難以獲取并且校對(duì)起來(lái)代價(jià)很高。而無(wú)標(biāo)簽數(shù)據(jù)通常大量存在,并且易于獲得。因此,同時(shí)考慮有標(biāo)簽數(shù)據(jù)和無(wú)標(biāo)簽數(shù)據(jù)的半監(jiān)督序回歸問(wèn)題具有重要的研究意義和實(shí)際價(jià)值。本文以此為動(dòng)機(jī),對(duì)半監(jiān)督序回歸問(wèn)題做了一定的研究和討論。本文提出了一種基于加權(quán)核判別分析的半監(jiān)督序回歸技術(shù)。該算法通過(guò)一個(gè)加權(quán)策略來(lái)引入無(wú)標(biāo)簽數(shù)據(jù),而權(quán)重體現(xiàn)了不同訓(xùn)練數(shù)據(jù)對(duì)于類(lèi)分布的貢獻(xiàn)大小。通過(guò)同時(shí)使用有標(biāo)簽數(shù)據(jù)和無(wú)標(biāo)簽數(shù)據(jù),可以更準(zhǔn)確地估計(jì)類(lèi)的分布信息,從而獲得更好的投影向量和閾值。該投影向量將原始數(shù)據(jù)映射到一個(gè)一維的空間,使得相鄰類(lèi)別之間可以分隔開(kāi)、相同類(lèi)別的數(shù)據(jù)可以聚合緊,同時(shí)保持正確的序關(guān)系;閾值用來(lái)預(yù)測(cè)新樣例的序。該算法使用一種標(biāo)簽傳播的方法來(lái)計(jì)算權(quán)重。然而,由于標(biāo)簽傳播算法沒(méi)有考慮數(shù)據(jù)中的序信息,導(dǎo)致估計(jì)的權(quán)重有時(shí)不是很準(zhǔn)確。為了更準(zhǔn)確地估計(jì)類(lèi)的分布信息并進(jìn)一步提升性能,我們提出了改進(jìn)的算法——基于演化算法的半監(jiān)督序回歸技術(shù)。該算法通過(guò)使用演化算法來(lái)優(yōu)化無(wú)標(biāo)簽數(shù)據(jù)的權(quán)重,優(yōu)化目標(biāo)是使學(xué)習(xí)器擁有良好的學(xué)習(xí)性能和泛化能力。由于同時(shí)引入了無(wú)標(biāo)簽數(shù)據(jù)和序信息,所以該問(wèn)題是一個(gè)非凸且不可導(dǎo)的優(yōu)化問(wèn)題。演化算法適用于處理這類(lèi)問(wèn)題,我們?cè)诒疚氖褂貌罘诌M(jìn)化算法。為了降低優(yōu)化問(wèn)題的維度,本文提出了一種權(quán)重更新規(guī)則和個(gè)體表示方法,用來(lái)間接地演化權(quán)重。通過(guò)該方法,問(wèn)題維度從無(wú)標(biāo)簽樣例個(gè)數(shù)量級(jí)下降到序個(gè)數(shù)量級(jí)。在多個(gè)數(shù)據(jù)集上的實(shí)驗(yàn)結(jié)果,證明了本文提出的兩個(gè)半監(jiān)督序回歸算法的有效性。
【關(guān)鍵詞】:序回歸 半監(jiān)督學(xué)習(xí) 核判別分析 標(biāo)簽傳播 演化算法 差分進(jìn)化
【學(xué)位授予單位】:中國(guó)科學(xué)技術(shù)大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2016
【分類(lèi)號(hào)】:TP181
【目錄】:
- 摘要5-6
- ABSTRACT6-13
- 第一章 緒論13-17
- 1.1 研究?jī)?nèi)容背景及意義13
- 1.2 文獻(xiàn)綜述及研究成果13-14
- 1.3 本文概述及主要貢獻(xiàn)14-17
- 1.3.1 本文研究?jī)?nèi)容14-15
- 1.3.2 本文主要貢獻(xiàn)15
- 1.3.3 本文結(jié)構(gòu)15-17
- 第二章 序回歸技術(shù)發(fā)展回顧17-27
- 2.1 序回歸問(wèn)題定義和評(píng)估指標(biāo)17
- 2.2 基于有監(jiān)督學(xué)習(xí)方式的序回歸技術(shù)17-22
- 2.2.1 直接用傳統(tǒng)分類(lèi)或回歸方法處理的序回歸技術(shù)18-19
- 2.2.2 先分解成二分類(lèi)問(wèn)題再進(jìn)行處理的序同歸技術(shù)19-20
- 2.2.3 拓展傳統(tǒng)分類(lèi)模型引入序信息的序回歸技術(shù)20-22
- 2.3 基于半監(jiān)督學(xué)習(xí)方式的序回歸技術(shù)22-23
- 2.4 基于演化算法的序回歸技術(shù)23-24
- 2.4.1 演化算法及演化機(jī)器學(xué)習(xí)23-24
- 2.4.2 演化算法在序回歸問(wèn)題中的應(yīng)用24
- 2.5 發(fā)展趨勢(shì)及不足24-25
- 2.6 小結(jié)25-27
- 第三章 基于加權(quán)核判別分析的半監(jiān)督序回歸技術(shù)27-37
- 3.1 半監(jiān)督序回歸問(wèn)題定義27
- 3.2 半監(jiān)督學(xué)習(xí)27
- 3.3 KDLOR算法回顧27-29
- 3.4 基于加權(quán)核判別分析的半監(jiān)督序回歸算法29-33
- 3.4.1 估計(jì)無(wú)標(biāo)簽數(shù)據(jù)對(duì)每個(gè)類(lèi)別的隸屬度30-31
- 3.4.2 基于加權(quán)核判別分析的半監(jiān)督序回歸算法31-33
- 3.5 實(shí)驗(yàn)驗(yàn)證33-36
- 3.5.1 實(shí)驗(yàn)設(shè)置33
- 3.5.2 合成數(shù)據(jù)集33-34
- 3.5.3 真實(shí)數(shù)據(jù)集34-36
- 3.6 小結(jié)36-37
- 第四章 基于演化算法的半監(jiān)督序回歸技術(shù)37-47
- 4.1 基于演化算法的半監(jiān)督核判別分析序回歸算法37-43
- 4.1.1 個(gè)體表示37-39
- 4.1.2 適應(yīng)度函數(shù)39-40
- 4.1.3 差分進(jìn)化40-43
- 4.2 實(shí)驗(yàn)驗(yàn)證43-45
- 4.2.1 實(shí)驗(yàn)設(shè)置43
- 4.2.2 處理大數(shù)據(jù)43-44
- 4.2.3 實(shí)驗(yàn)結(jié)果44-45
- 4.3 小結(jié)45-47
- 第五章 總結(jié)47-51
- 參考文獻(xiàn)51-55
- 致謝55-57
- 在讀期間發(fā)表的學(xué)術(shù)論文與取得的研究成果57
【相似文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前10條
1 龔文引;謝丹;;針對(duì)本科生的演化算法教學(xué)探討[J];計(jì)算機(jī)時(shí)代;2012年07期
2 熊盛武,李元香,康立山,陳毓屏;用演化算法求解拋物型方程擴(kuò)散系數(shù)的識(shí)別問(wèn)題[J];計(jì)算機(jī)學(xué)報(bào);2000年03期
3 曾三友,康立山,丁立新;基于偏序關(guān)系的演化算法[J];計(jì)算機(jī)工程;2001年08期
4 周永華,毛宗源;基于混合雜交與間歇變異的演化算法[J];計(jì)算機(jī)工程與應(yīng)用;2003年06期
5 閆震宇,康立山,陳毓屏,付朋輝;一種新的多目標(biāo)演化算法——穩(wěn)態(tài)淘汰演化算法[J];武漢大學(xué)學(xué)報(bào)(理學(xué)版);2003年01期
6 王濤,李歧強(qiáng);基于空間收縮的并行演化算法[J];中國(guó)工程科學(xué);2003年03期
7 何國(guó)良,李元香;多個(gè)粒子參與交叉的一種動(dòng)態(tài)演化算法[J];計(jì)算機(jī)工程與應(yīng)用;2004年08期
8 劉敏忠,鄒秀芬,康立山;一種基于偏序排名的高效的多目標(biāo)演化算法[J];小型微型計(jì)算機(jī)系統(tǒng);2004年12期
9 王龍奎,汪祖柱;關(guān)于多目標(biāo)演化算法的策略分析[J];安徽大學(xué)學(xué)報(bào)(自然科學(xué)版);2005年03期
10 田麗,林錦國(guó),劉建峰,張光云;基于演化算法的客戶(hù)關(guān)系管理系統(tǒng)研究[J];微處理機(jī);2005年03期
中國(guó)重要會(huì)議論文全文數(shù)據(jù)庫(kù) 前3條
1 馮珊;李鋒;周凱波;;面向演化算法應(yīng)用的智能體系統(tǒng)建模與仿真研究[A];西部開(kāi)發(fā)與系統(tǒng)工程——中國(guó)系統(tǒng)工程學(xué)會(huì)第12屆年會(huì)論文集[C];2002年
2 張文俊;謝曉鋒;馬君;;并行演化算法在半導(dǎo)體器件綜合中的應(yīng)用[A];2006年全國(guó)開(kāi)放式分布與并行計(jì)算學(xué)術(shù)會(huì)議論文集(二)[C];2006年
3 謝柏橋;戴光明;鄭蔚;王劍文;;有指導(dǎo)的多目標(biāo)演化算法在區(qū)域星座設(shè)計(jì)中的應(yīng)用[A];中國(guó)宇航學(xué)會(huì)深空探測(cè)技術(shù)專(zhuān)業(yè)委員會(huì)第四屆學(xué)術(shù)年會(huì)論文集[C];2007年
中國(guó)博士學(xué)位論文全文數(shù)據(jù)庫(kù) 前10條
1 俞揚(yáng);演化計(jì)算理論分析與學(xué)習(xí)算法的研究[D];南京大學(xué);2011年
2 庫(kù)俊華;自適應(yīng)差分演化算法及其應(yīng)用研究[D];中國(guó)地質(zhì)大學(xué);2015年
3 彭晟;演化算法的靜電場(chǎng)論模型[D];武漢大學(xué);2011年
4 陳明;演化算法漸近行為的若干問(wèn)題研究[D];武漢大學(xué);2012年
5 彭飛;實(shí)值演化算法投資組合研究[D];中國(guó)科學(xué)技術(shù)大學(xué);2011年
6 萬(wàn)書(shū)振;動(dòng)態(tài)環(huán)境下差分演化算法研究與應(yīng)用[D];武漢理工大學(xué);2012年
7 魏波;交互式與自適應(yīng)演化算法研究[D];武漢大學(xué);2013年
8 賴(lài)鑫生;演化算法與混合算法的性能研究[D];華南理工大學(xué);2014年
9 武志峰;差異演化算法及其應(yīng)用研究[D];北京交通大學(xué);2009年
10 陳天石;演化算法的計(jì)算復(fù)雜性研究[D];中國(guó)科學(xué)技術(shù)大學(xué);2010年
中國(guó)碩士學(xué)位論文全文數(shù)據(jù)庫(kù) 前10條
1 要婷婷;基于模因演化算法的有限容量弧路徑問(wèn)題研究[D];北京交通大學(xué);2016年
2 邢雪;基于Pi演算的關(guān)系演化算法的研究與實(shí)現(xiàn)[D];吉林大學(xué);2016年
3 戴志晃;一種基于熵量守恒的改進(jìn)演化算法的研究[D];江西理工大學(xué);2010年
4 潘偉豐;一種基于平均矢量偏差的仿生演化算法[D];江西理工大學(xué);2008年
5 胡中波;差分演化算法及其在函數(shù)優(yōu)化中的應(yīng)用研究[D];武漢理工大學(xué);2006年
6 李程俊;組合優(yōu)化問(wèn)題的并行演化算法研究[D];武漢理工大學(xué);2003年
7 趙永翔;多目標(biāo)差分演化算法的構(gòu)造及其應(yīng)用[D];武漢理工大學(xué);2007年
8 張?chǎng)?協(xié)同演化算法及其在組合投資中的研究與應(yīng)用[D];哈爾濱工程大學(xué);2011年
9 顏穎;異步分層并行演化算法及其在模糊聚類(lèi)分析中的應(yīng)用[D];廈門(mén)大學(xué);2006年
10 程鋼;基于差分演化算法的圖像聚類(lèi)研究[D];湖北工業(yè)大學(xué);2015年
,本文編號(hào):797699
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/797699.html