基于演化算法的序回歸技術(shù)研究
本文關(guān)鍵詞:基于演化算法的序回歸技術(shù)研究
更多相關(guān)文章: 序回歸 半監(jiān)督學(xué)習(xí) 核判別分析 標(biāo)簽傳播 演化算法 差分進化
【摘要】:在很多實際應(yīng)用中,數(shù)據(jù)的類別之間存在一種自然的序關(guān)系。例如,我們用1~5星去評價一部電影,3星評價高于2星評價,而4星評價低于5星評價。和標(biāo)稱數(shù)據(jù)不同,我們稱這樣一類數(shù)據(jù)為有序數(shù)據(jù)。有序數(shù)據(jù)的類別之間可以排序,但類別之間的差異卻沒有精確的定義。例如,對電影的3星評價通常被認(rèn)為優(yōu)于2星評價,但是3星究竟比2星好多少卻難以度量。預(yù)測有序數(shù)據(jù)的序的學(xué)習(xí)問題,稱之為序回歸。序回歸有著廣泛的實際應(yīng)用場景,例如情感分析、信息檢索、推薦系統(tǒng)、信用評價、醫(yī)學(xué)等。序回歸問題作為機器學(xué)習(xí)、數(shù)據(jù)挖掘領(lǐng)域重要的問題之一,越來越受到研究者們的關(guān)注。已有的工作主要集中在研究有監(jiān)督序回歸問題。然而,當(dāng)缺少足夠的有標(biāo)簽數(shù)據(jù)時,該問題變得難以處理。在很多實際應(yīng)用中,有標(biāo)簽數(shù)據(jù)往往難以獲取并且校對起來代價很高。而無標(biāo)簽數(shù)據(jù)通常大量存在,并且易于獲得。因此,同時考慮有標(biāo)簽數(shù)據(jù)和無標(biāo)簽數(shù)據(jù)的半監(jiān)督序回歸問題具有重要的研究意義和實際價值。本文以此為動機,對半監(jiān)督序回歸問題做了一定的研究和討論。本文提出了一種基于加權(quán)核判別分析的半監(jiān)督序回歸技術(shù)。該算法通過一個加權(quán)策略來引入無標(biāo)簽數(shù)據(jù),而權(quán)重體現(xiàn)了不同訓(xùn)練數(shù)據(jù)對于類分布的貢獻大小。通過同時使用有標(biāo)簽數(shù)據(jù)和無標(biāo)簽數(shù)據(jù),可以更準(zhǔn)確地估計類的分布信息,從而獲得更好的投影向量和閾值。該投影向量將原始數(shù)據(jù)映射到一個一維的空間,使得相鄰類別之間可以分隔開、相同類別的數(shù)據(jù)可以聚合緊,同時保持正確的序關(guān)系;閾值用來預(yù)測新樣例的序。該算法使用一種標(biāo)簽傳播的方法來計算權(quán)重。然而,由于標(biāo)簽傳播算法沒有考慮數(shù)據(jù)中的序信息,導(dǎo)致估計的權(quán)重有時不是很準(zhǔn)確。為了更準(zhǔn)確地估計類的分布信息并進一步提升性能,我們提出了改進的算法——基于演化算法的半監(jiān)督序回歸技術(shù)。該算法通過使用演化算法來優(yōu)化無標(biāo)簽數(shù)據(jù)的權(quán)重,優(yōu)化目標(biāo)是使學(xué)習(xí)器擁有良好的學(xué)習(xí)性能和泛化能力。由于同時引入了無標(biāo)簽數(shù)據(jù)和序信息,所以該問題是一個非凸且不可導(dǎo)的優(yōu)化問題。演化算法適用于處理這類問題,我們在本文使用差分進化算法。為了降低優(yōu)化問題的維度,本文提出了一種權(quán)重更新規(guī)則和個體表示方法,用來間接地演化權(quán)重。通過該方法,問題維度從無標(biāo)簽樣例個數(shù)量級下降到序個數(shù)量級。在多個數(shù)據(jù)集上的實驗結(jié)果,證明了本文提出的兩個半監(jiān)督序回歸算法的有效性。
【關(guān)鍵詞】:序回歸 半監(jiān)督學(xué)習(xí) 核判別分析 標(biāo)簽傳播 演化算法 差分進化
【學(xué)位授予單位】:中國科學(xué)技術(shù)大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2016
【分類號】:TP181
【目錄】:
- 摘要5-6
- ABSTRACT6-13
- 第一章 緒論13-17
- 1.1 研究內(nèi)容背景及意義13
- 1.2 文獻綜述及研究成果13-14
- 1.3 本文概述及主要貢獻14-17
- 1.3.1 本文研究內(nèi)容14-15
- 1.3.2 本文主要貢獻15
- 1.3.3 本文結(jié)構(gòu)15-17
- 第二章 序回歸技術(shù)發(fā)展回顧17-27
- 2.1 序回歸問題定義和評估指標(biāo)17
- 2.2 基于有監(jiān)督學(xué)習(xí)方式的序回歸技術(shù)17-22
- 2.2.1 直接用傳統(tǒng)分類或回歸方法處理的序回歸技術(shù)18-19
- 2.2.2 先分解成二分類問題再進行處理的序同歸技術(shù)19-20
- 2.2.3 拓展傳統(tǒng)分類模型引入序信息的序回歸技術(shù)20-22
- 2.3 基于半監(jiān)督學(xué)習(xí)方式的序回歸技術(shù)22-23
- 2.4 基于演化算法的序回歸技術(shù)23-24
- 2.4.1 演化算法及演化機器學(xué)習(xí)23-24
- 2.4.2 演化算法在序回歸問題中的應(yīng)用24
- 2.5 發(fā)展趨勢及不足24-25
- 2.6 小結(jié)25-27
- 第三章 基于加權(quán)核判別分析的半監(jiān)督序回歸技術(shù)27-37
- 3.1 半監(jiān)督序回歸問題定義27
- 3.2 半監(jiān)督學(xué)習(xí)27
- 3.3 KDLOR算法回顧27-29
- 3.4 基于加權(quán)核判別分析的半監(jiān)督序回歸算法29-33
- 3.4.1 估計無標(biāo)簽數(shù)據(jù)對每個類別的隸屬度30-31
- 3.4.2 基于加權(quán)核判別分析的半監(jiān)督序回歸算法31-33
- 3.5 實驗驗證33-36
- 3.5.1 實驗設(shè)置33
- 3.5.2 合成數(shù)據(jù)集33-34
- 3.5.3 真實數(shù)據(jù)集34-36
- 3.6 小結(jié)36-37
- 第四章 基于演化算法的半監(jiān)督序回歸技術(shù)37-47
- 4.1 基于演化算法的半監(jiān)督核判別分析序回歸算法37-43
- 4.1.1 個體表示37-39
- 4.1.2 適應(yīng)度函數(shù)39-40
- 4.1.3 差分進化40-43
- 4.2 實驗驗證43-45
- 4.2.1 實驗設(shè)置43
- 4.2.2 處理大數(shù)據(jù)43-44
- 4.2.3 實驗結(jié)果44-45
- 4.3 小結(jié)45-47
- 第五章 總結(jié)47-51
- 參考文獻51-55
- 致謝55-57
- 在讀期間發(fā)表的學(xué)術(shù)論文與取得的研究成果57
【相似文獻】
中國期刊全文數(shù)據(jù)庫 前10條
1 龔文引;謝丹;;針對本科生的演化算法教學(xué)探討[J];計算機時代;2012年07期
2 熊盛武,李元香,康立山,陳毓屏;用演化算法求解拋物型方程擴散系數(shù)的識別問題[J];計算機學(xué)報;2000年03期
3 曾三友,康立山,丁立新;基于偏序關(guān)系的演化算法[J];計算機工程;2001年08期
4 周永華,毛宗源;基于混合雜交與間歇變異的演化算法[J];計算機工程與應(yīng)用;2003年06期
5 閆震宇,康立山,陳毓屏,付朋輝;一種新的多目標(biāo)演化算法——穩(wěn)態(tài)淘汰演化算法[J];武漢大學(xué)學(xué)報(理學(xué)版);2003年01期
6 王濤,李歧強;基于空間收縮的并行演化算法[J];中國工程科學(xué);2003年03期
7 何國良,李元香;多個粒子參與交叉的一種動態(tài)演化算法[J];計算機工程與應(yīng)用;2004年08期
8 劉敏忠,鄒秀芬,康立山;一種基于偏序排名的高效的多目標(biāo)演化算法[J];小型微型計算機系統(tǒng);2004年12期
9 王龍奎,汪祖柱;關(guān)于多目標(biāo)演化算法的策略分析[J];安徽大學(xué)學(xué)報(自然科學(xué)版);2005年03期
10 田麗,林錦國,劉建峰,張光云;基于演化算法的客戶關(guān)系管理系統(tǒng)研究[J];微處理機;2005年03期
中國重要會議論文全文數(shù)據(jù)庫 前3條
1 馮珊;李鋒;周凱波;;面向演化算法應(yīng)用的智能體系統(tǒng)建模與仿真研究[A];西部開發(fā)與系統(tǒng)工程——中國系統(tǒng)工程學(xué)會第12屆年會論文集[C];2002年
2 張文俊;謝曉鋒;馬君;;并行演化算法在半導(dǎo)體器件綜合中的應(yīng)用[A];2006年全國開放式分布與并行計算學(xué)術(shù)會議論文集(二)[C];2006年
3 謝柏橋;戴光明;鄭蔚;王劍文;;有指導(dǎo)的多目標(biāo)演化算法在區(qū)域星座設(shè)計中的應(yīng)用[A];中國宇航學(xué)會深空探測技術(shù)專業(yè)委員會第四屆學(xué)術(shù)年會論文集[C];2007年
中國博士學(xué)位論文全文數(shù)據(jù)庫 前10條
1 俞揚;演化計算理論分析與學(xué)習(xí)算法的研究[D];南京大學(xué);2011年
2 庫俊華;自適應(yīng)差分演化算法及其應(yīng)用研究[D];中國地質(zhì)大學(xué);2015年
3 彭晟;演化算法的靜電場論模型[D];武漢大學(xué);2011年
4 陳明;演化算法漸近行為的若干問題研究[D];武漢大學(xué);2012年
5 彭飛;實值演化算法投資組合研究[D];中國科學(xué)技術(shù)大學(xué);2011年
6 萬書振;動態(tài)環(huán)境下差分演化算法研究與應(yīng)用[D];武漢理工大學(xué);2012年
7 魏波;交互式與自適應(yīng)演化算法研究[D];武漢大學(xué);2013年
8 賴鑫生;演化算法與混合算法的性能研究[D];華南理工大學(xué);2014年
9 武志峰;差異演化算法及其應(yīng)用研究[D];北京交通大學(xué);2009年
10 陳天石;演化算法的計算復(fù)雜性研究[D];中國科學(xué)技術(shù)大學(xué);2010年
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前10條
1 要婷婷;基于模因演化算法的有限容量弧路徑問題研究[D];北京交通大學(xué);2016年
2 邢雪;基于Pi演算的關(guān)系演化算法的研究與實現(xiàn)[D];吉林大學(xué);2016年
3 戴志晃;一種基于熵量守恒的改進演化算法的研究[D];江西理工大學(xué);2010年
4 潘偉豐;一種基于平均矢量偏差的仿生演化算法[D];江西理工大學(xué);2008年
5 胡中波;差分演化算法及其在函數(shù)優(yōu)化中的應(yīng)用研究[D];武漢理工大學(xué);2006年
6 李程俊;組合優(yōu)化問題的并行演化算法研究[D];武漢理工大學(xué);2003年
7 趙永翔;多目標(biāo)差分演化算法的構(gòu)造及其應(yīng)用[D];武漢理工大學(xué);2007年
8 張鑫;協(xié)同演化算法及其在組合投資中的研究與應(yīng)用[D];哈爾濱工程大學(xué);2011年
9 顏穎;異步分層并行演化算法及其在模糊聚類分析中的應(yīng)用[D];廈門大學(xué);2006年
10 程鋼;基于差分演化算法的圖像聚類研究[D];湖北工業(yè)大學(xué);2015年
,本文編號:797699
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/797699.html