天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

布爾向量數(shù)據(jù)模式分類關(guān)鍵問(wèn)題及中醫(yī)診斷量表研制

發(fā)布時(shí)間:2021-06-30 06:55
  論文提出和研究了布爾向量數(shù)據(jù)模式分類中的關(guān)鍵問(wèn)題,并將研究結(jié)果應(yīng)用于中醫(yī)學(xué)診斷量表研制當(dāng)中。對(duì)布爾向量模式分類中的相似系數(shù)、降維以及權(quán)重這三個(gè)關(guān)鍵問(wèn)題進(jìn)行了系統(tǒng)地研究。為后續(xù)進(jìn)一步研究針對(duì)布爾向量數(shù)據(jù)的模式分類問(wèn)題完成了初步性的工作。論文主要工作和創(chuàng)新點(diǎn)總結(jié)如下:一、對(duì)布爾向量的相似系數(shù)及其性質(zhì)進(jìn)行了研究,并在此基礎(chǔ)上對(duì)目前常見(jiàn)的相似系數(shù)的性質(zhì)進(jìn)行了對(duì)比和分析,針對(duì)一些模式分類問(wèn)題中的相似系數(shù)選擇問(wèn)題,提出了多參數(shù)相似系數(shù)族及其優(yōu)化方法。通過(guò)真實(shí)數(shù)據(jù)的實(shí)驗(yàn)結(jié)果,驗(yàn)證了本文提出的相似系數(shù)族在布爾向量模式分類問(wèn)題的相似系數(shù)優(yōu)化中的有效性。二、對(duì)于布爾向量數(shù)據(jù)的降維從特征提取和特征選擇兩個(gè)方面進(jìn)行了研究:其一,根據(jù)布爾向量數(shù)據(jù)的特點(diǎn),提出和研究了基于分片求和的特征提取降維算法,通過(guò)理論分析和真實(shí)數(shù)據(jù)實(shí)驗(yàn),驗(yàn)證了本文方法的有效性;其二,針對(duì)兩類互斥問(wèn)題、多類非互斥問(wèn)題,分別提出了基于布爾向量相似系數(shù)的過(guò)濾式和混合式特征選擇降維算法,通過(guò)真實(shí)數(shù)據(jù)的實(shí)驗(yàn)結(jié)果,驗(yàn)證了這些算法在解決這兩類問(wèn)題時(shí)的有效性。三、在對(duì)現(xiàn)有特征權(quán)重方法研究的基礎(chǔ)上,針對(duì)k-NN特征權(quán)重算法計(jì)算量大速度慢的缺點(diǎn),提出了改進(jìn)算法... 

【文章來(lái)源】:北京交通大學(xué)北京市 211工程院校 教育部直屬院校

【文章頁(yè)數(shù)】:138 頁(yè)

【學(xué)位級(jí)別】:博士

【部分圖文】:

布爾向量數(shù)據(jù)模式分類關(guān)鍵問(wèn)題及中醫(yī)診斷量表研制


均勻分布時(shí)布爾向量樣本對(duì)之間的距離期望與維數(shù)m的關(guān)系

概率分布,布爾向量,范數(shù),值分布


幾ble1.1ProbabilityofBinomialdistributions}月},012…k…。一1尹,,(每)。了即!币弧瓹廠尸,!币,…心尸‘!币弧匆,。則列向量月的入范數(shù)的期望為E(x;)一nP’,方差a(x:)一行面。對(duì)于隨機(jī)變量每各個(gè)可能取值的相應(yīng)概率可以用表l.l進(jìn)行計(jì)算,但如果.1中的表達(dá)式逐個(gè)計(jì)算的工作量很大,因此對(duì)于隨機(jī)變量每各個(gè)可能取值率一般使用下面的式(l.2)進(jìn)行計(jì)算。則當(dāng)。固定等于10,p=0.2、0.5、0的概率分布如圖1.3所示;當(dāng)p固定等于0.2,n=5、10、20時(shí)對(duì)應(yīng)的概圖1.4所示。由此圖1.3及1.4可見(jiàn),布爾向量的八范數(shù)值的分布不但與中1的出現(xiàn)概率有關(guān),并且與布爾向量的維數(shù)m有關(guān)。夕,(k+l)=n一kk+1P,’一’P,L叼(1.2)

均勻分布,失真率,概率,樣本


圖3.4.樣本失真率:、失真概率p。,隨分片長(zhǎng)度l的變化情.3.4TrendofsamPlesdistortion公anddistortionProbabilityP。withPiecinglengthl多個(gè)分片組合樣地,首先假設(shè)樣本集按圖3.2的模式服從均勻分布(即樣本集從二項(xiàng)分布),并且假設(shè)樣本矩陣的屬性之間(即列向量之間)相面我們對(duì)于單個(gè)分片內(nèi)的失真率、失真概率及隨分片長(zhǎng)度不同了分析。因?yàn)椴紶栂蛄烤仃嚦3橄∈杈仃,所以我們不妨設(shè)1的個(gè)數(shù)都小于某個(gè)值t(即t=max,(ll戈}};)),則對(duì)于高維。下面我們將對(duì)稀疏布爾向量樣本集,對(duì)多個(gè)分片組合成的情形分片長(zhǎng)度為l二2(不妨設(shè)m可以被l整除,若不能整除可進(jìn)行如操作,此處不再贅述)。顯然,此時(shí)分片數(shù):=m/l=m/2。對(duì)于,如圖3.5所示,當(dāng)且僅當(dāng),兩個(gè)樣本對(duì)分別為【0,l]和【1,0]時(shí),為2分0,此時(shí)完全失真。因?yàn)闃颖炯䦶木鶆蚍植,則對(duì)于該

【參考文獻(xiàn)】:
期刊論文
[1]文本層次分類中特征項(xiàng)權(quán)重算法的比較研究[J]. 譚金波.  情報(bào)雜志. 2007(09)
[2]粒度世界拓?fù)浣Y(jié)構(gòu)的理論研究[J]. 蒙祖強(qiáng),史忠植.  控制與決策. 2007(09)
[3]基于PSO面向K近鄰分類的特征權(quán)重學(xué)習(xí)算法[J]. 任江濤,卓曉嵐,許盛燦,印鑒.  計(jì)算機(jī)科學(xué). 2007(05)
[4]高維索引機(jī)制中的降維方法綜述[J]. 吳玲達(dá),賀玲,蔡益朝.  計(jì)算機(jī)應(yīng)用研究. 2006(12)
[5]高維空間中數(shù)據(jù)的相似性度量[J]. 賀玲,吳玲達(dá),蔡益朝.  數(shù)學(xué)的實(shí)踐與認(rèn)識(shí). 2006(09)
[6]循證醫(yī)學(xué)與實(shí)驗(yàn)診斷學(xué)[J]. 梁勤.  中國(guó)實(shí)驗(yàn)診斷學(xué). 2006(03)
[7]最小距離分類器的改進(jìn)算法——加權(quán)最小距離分類器[J]. 任靖,李春平.  計(jì)算機(jī)應(yīng)用. 2005(05)
[8]基于SVM的特征加權(quán)KNN算法[J]. 陳振洲,李磊,姚正安.  中山大學(xué)學(xué)報(bào)(自然科學(xué)版). 2005(01)
[9]文本自動(dòng)分類中特征權(quán)重算法的改進(jìn)研究[J]. 徐鳳亞,羅振聲.  計(jì)算機(jī)工程與應(yīng)用. 2005(01)
[10]基于Relief的組合式特征選擇[J]. 張麗新,王家廞,趙雁南,楊澤紅.  復(fù)旦學(xué)報(bào)(自然科學(xué)版). 2004(05)



本文編號(hào):3257270

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/projectlw/xtxlw/3257270.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶edf74***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com