面向多特征集成的;7椒捌鋺(yīng)用研究
本文選題:多粒度 + 信息; ; 參考:《江蘇科技大學(xué)》2017年碩士論文
【摘要】:隨著互聯(lián)網(wǎng)技術(shù)的迅猛發(fā)展,特別是近年來云計算、物聯(lián)網(wǎng)、社交網(wǎng)絡(luò)等新興服務(wù)的快速普及,人類社會產(chǎn)生的數(shù)據(jù)規(guī)模正以一種前所未有的速度增長.從大規(guī)模復(fù)雜數(shù)據(jù)中,以應(yīng)用需求為目標(biāo),挖掘有效的信息已經(jīng)成為現(xiàn)代科技發(fā)展的主要驅(qū)動力.然而,現(xiàn)代數(shù)據(jù)具有描述的多樣性、來源的廣博性、結(jié)構(gòu)的復(fù)雜性、增長的飛速性等典型特征,探尋如何從規(guī)模龐大且復(fù)雜異構(gòu)的數(shù)據(jù)中獲取蘊(yùn)含的深層信息和隱含知識,相對于傳統(tǒng)的數(shù)據(jù)挖掘與知識發(fā)現(xiàn)任務(wù)而言,顯得任重而道遠(yuǎn)且極具挑戰(zhàn)性.目前很多大規(guī)模復(fù)雜數(shù)據(jù)處理方法中,分而治之是一種能被廣泛接受的策略,即先采用適當(dāng)?shù)某闃踊蚍謱蛹夹g(shù)對復(fù)雜數(shù)據(jù)進(jìn)行合理的“分割”,再建立高效的學(xué)習(xí)機(jī)制對各部分?jǐn)?shù)據(jù)進(jìn)行針對性地處理,該策略體現(xiàn)了人類面臨復(fù)雜問題時所擁有的多粒度認(rèn)知能力.但粒度世界的多樣性致使有關(guān)多粒度的研究面臨計算復(fù)雜度高、對指定目標(biāo)特性掌握不夠、缺乏足夠的融合思想與動態(tài)學(xué)習(xí)能力等嚴(yán)峻挑戰(zhàn),鑒于此,本文將在復(fù)雜數(shù)據(jù)背景下,分別從標(biāo)記多特征空間的信息;、參數(shù)多特征空間的分類器設(shè)計、多特征空間的融合學(xué)習(xí)方法等方面來探索高效的多粒度信息粒化技術(shù),并以此為基礎(chǔ)發(fā)展新的多粒度建模與知識獲取方法.具體而言,本文的研究內(nèi)容和創(chuàng)新性成果主要在于:(1)單標(biāo)記下的特征空間轉(zhuǎn)換策略與粗糙數(shù)據(jù)分析.有關(guān)粗糙集的研究大多建立在原始特征空間之上,并未考慮具有不同決策類別的樣本可能擁有自身特定的性質(zhì),而這些特性往往有助于產(chǎn)生更為精準(zhǔn)的規(guī)則.為此,本文針對決策系統(tǒng)中不同的決策類,提出了一種能夠反映各個決策類性質(zhì)的多特征空間轉(zhuǎn)換策略,并給出了多特征空間下決策系統(tǒng)近似質(zhì)量和條件熵的定義方法,有效地降低了決策系統(tǒng)的不確定性程度,提升了分類性能.(2)多標(biāo)記下的特征空間轉(zhuǎn)換策略與粗糙數(shù)據(jù)分析.考慮到不同標(biāo)記可能會帶有其自身的一些特性,故為多標(biāo)記學(xué)習(xí)構(gòu)建類屬特征空間顯得尤為重要.然而,類屬特征空間的構(gòu)建可能導(dǎo)致特征空間維度的增加,且含有大量冗余信息.為了緩解該不足,本文借助模糊粗糙近似約簡的思想,提出了兩種基于類屬特征空間維度約簡的多標(biāo)記學(xué)習(xí)方法,即:FRS-LIFT和FRS-SS-LIFT.其中,FRS-SS-LIFT在FRS-LIFT的基礎(chǔ)上,采用了樣本選擇策略,大幅降低了維度約簡的時間消耗.相關(guān)實(shí)驗(yàn)結(jié)果驗(yàn)證了本文算法在提升多標(biāo)記學(xué)習(xí)系統(tǒng)預(yù)測性能的可行性和高效性.(3)參數(shù)化特征空間下的協(xié)同分類方法.在鄰域粗糙集模型中,隨著信息粒尺寸的增長,基于多數(shù)投票原則的鄰域分類器容易對未知樣本的類別產(chǎn)生誤判.為了緩解該不足,本文借助協(xié)同表達(dá)的思想,提出了一種鄰域協(xié)同分類器NCC.該算法在未知樣本的鄰域空間內(nèi),通過協(xié)同表達(dá)的方式找出與未知樣本具有最小重構(gòu)誤差的類別作為預(yù)測的類別標(biāo)記.相關(guān)實(shí)驗(yàn)結(jié)果在驗(yàn)證本文算法能夠提升較大尺寸信息粒下鄰域分類器分類性能的同時,也表明該算法是一種降低傳統(tǒng)CRC算法時間消耗的有效手段.(4)多特征空間融合策略下的蛋白質(zhì)結(jié)構(gòu)類型預(yù)測方法.本文針對生物信息學(xué)中蛋白質(zhì)二級結(jié)構(gòu)類型的預(yù)測問題,先從Pse AAC和Pse PSSM兩個視角抽取了蛋白質(zhì)序列的特征,并將兩者以串行方式融合,再以k-近鄰錯誤率最小化為目標(biāo),借助啟發(fā)式搜索策略,提出了一種基于k-近鄰錯誤率下降的蛋白質(zhì)結(jié)構(gòu)類型預(yù)測方法.相關(guān)實(shí)驗(yàn)結(jié)果表明本文算法對蛋白質(zhì)二級結(jié)構(gòu)預(yù)測的準(zhǔn)確率有一定程度地提升.
[Abstract]:With the rapid development of Internet technology , especially the rapid popularization of new services such as cloud computing , Internet of Things , social network and so on in recent years , the scale of data generated by human society has become the main driving force for modern science and technology . In order to alleviate this deficiency , this paper proposes two kinds of methods for predicting the structure types of protein structures based on fuzzy rough approximation . In order to alleviate this deficiency , this paper presents a new method for predicting the structure types of protein structures based on the concept of fuzzy rough approximation .
【學(xué)位授予單位】:江蘇科技大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2017
【分類號】:TP18
【參考文獻(xiàn)】
相關(guān)期刊論文 前9條
1 楊習(xí)貝;徐蘇平;戚ng;於東軍;;基于多特征空間的粗糙數(shù)據(jù)分析方法[J];江蘇科技大學(xué)學(xué)報(自然科學(xué)版);2016年04期
2 張云泉;徐葳;龍桂魯;;數(shù)據(jù)科學(xué):問題導(dǎo)向的交叉學(xué)科創(chuàng)新[J];科學(xué)通報;2015年Z1期
3 吳偉志;高倉健;李同軍;;序粒度標(biāo)記結(jié)構(gòu)及其粗糙近似[J];計算機(jī)研究與發(fā)展;2014年12期
4 蔣亦樟;鄧趙紅;王駿;錢鵬江;王士同;;熵加權(quán)多視角協(xié)同劃分模糊聚類算法[J];軟件學(xué)報;2014年10期
5 張維;苗奪謙;高燦;岳曉冬;;鄰域粗糙協(xié)同分類模型[J];計算機(jī)研究與發(fā)展;2014年08期
6 李霖;毛凱;譚永濱;;地標(biāo)分層多粒度路徑導(dǎo)引描述方法[J];測繪學(xué)報;2014年01期
7 王磊;李天瑞;劉清;黎敏;;對象集變化時近似集動態(tài)維護(hù)的矩陣方法[J];計算機(jī)研究與發(fā)展;2013年09期
8 王國胤;張清華;;不同知識粒度下粗糙集的不確定性研究[J];計算機(jī)學(xué)報;2008年09期
9 胡清華;于達(dá)仁;謝宗霞;;基于鄰域;痛植诒平臄(shù)值屬性約簡[J];軟件學(xué)報;2008年03期
相關(guān)博士學(xué)位論文 前1條
1 楊習(xí)貝;不完備信息系統(tǒng)中粗糙集理論研究[D];南京理工大學(xué);2010年
,本文編號:2079324
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/2079324.html