基于模糊聚類的多核支持向量機(jī)研究及其應(yīng)用
發(fā)布時(shí)間:2020-11-14 00:09
支持向量機(jī)作為機(jī)器學(xué)習(xí)的研究方法之一,已得到了深入研究和廣泛應(yīng)用,由于基于單核函數(shù)的支持向量機(jī)已不適應(yīng)于復(fù)雜的大規(guī)模數(shù)據(jù)處理,因此多核支持向量機(jī)成為研究熱點(diǎn)。本文介紹了多核支持向量機(jī)的原理,以及多核支持向量機(jī)的研究成果,并在加權(quán)多核支持向量機(jī)聚類的基礎(chǔ)上,先針對(duì)特征的來(lái)源選取合適的核函數(shù),再針對(duì)不同的特征來(lái)源對(duì)各個(gè)核函數(shù)進(jìn)行線性擬合,提出了基于模糊聚類的多核支持向量機(jī)算法。實(shí)驗(yàn)結(jié)果分析表明,基于模糊聚類的簡(jiǎn)化多核支持向量機(jī)能顯著提高多核支持向量機(jī)的學(xué)習(xí)效率,尤其是在大規(guī)模訓(xùn)練數(shù)據(jù)集上效果尤為明顯。模糊C均值聚類算法(FCM)是數(shù)據(jù)聚類分析的主要流行算法之一,為了解決傳統(tǒng)的FCM算法對(duì)于非歐式結(jié)構(gòu)的數(shù)據(jù)聚類結(jié)果不理想的問(wèn)題,已經(jīng)有多種解決方案。本文首先依據(jù)特征來(lái)源選取核函數(shù),對(duì)應(yīng)特征集形成了核函數(shù)集。為了更好的進(jìn)行聚類,針對(duì)核函數(shù)集的權(quán)重,采取自適應(yīng)的特征加權(quán)FCM算法確定之。在目標(biāo)函數(shù)中引入核函數(shù)集,形成了一種新的基于核函數(shù)的模糊C均值聚類算法(KFCM),其通過(guò)借助核函數(shù)重新構(gòu)造新的目標(biāo)函數(shù),進(jìn)而獲取更好的聚類效果。心電圖(ECG)是診斷心臟疾病、評(píng)價(jià)心臟功能的主要依據(jù)之一。本文采用KFCM算法,對(duì)ECG信號(hào)進(jìn)行分析。本文中的心電圖數(shù)據(jù)均采集于MIT-BIH心律失常標(biāo)準(zhǔn)數(shù)據(jù)庫(kù),且對(duì)原始的心電數(shù)據(jù)進(jìn)行校準(zhǔn)基線漂移和去除高頻噪聲的預(yù)處理。一般的心電圖數(shù)據(jù)都是高維數(shù)據(jù),其中包含許多的冗余信息,不利于數(shù)據(jù)的聚類。為了提高聚類效果:一方面,通過(guò)相關(guān)性分析的方法進(jìn)行數(shù)據(jù)預(yù)處理;另一方面,通過(guò)提取原始心電圖數(shù)據(jù)的特征值對(duì)數(shù)據(jù)做降維處理。流行學(xué)習(xí)是數(shù)據(jù)非線性降維的主要方法之一,本文嘗試采用了流行學(xué)習(xí)中的局部線性嵌入算法(LLE)對(duì)進(jìn)過(guò)預(yù)處理的心電數(shù)據(jù)進(jìn)行了降維。為了比較降維效果,同時(shí)也用經(jīng)典的主成分分析法(PCA)對(duì)數(shù)據(jù)進(jìn)行了降維,然后對(duì)二種方法降維后的心電數(shù)據(jù)分別用FCM算法和新的KFCM算法進(jìn)行了聚類,并對(duì)聚類效果和計(jì)算量做了比較和分析。從實(shí)驗(yàn)結(jié)果來(lái)看,LLE算法對(duì)心電數(shù)據(jù)的特征提取并沒(méi)有PCA算法效果好,且KFCM算法受核函數(shù)及其參數(shù)選擇的影響,聚類效果也沒(méi)有FCM算法穩(wěn)定和優(yōu)異,但KFCM的計(jì)算量比FCM要小很多,能夠更快的得到聚類結(jié)果,其結(jié)果較好。
【學(xué)位單位】:武漢紡織大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位年份】:2019
【中圖分類】:R540.41;TP181;TP311.13;TN911.7
【部分圖文】:
2.1 心電圖簡(jiǎn)介ECG 是心臟產(chǎn)生的電信號(hào)的記錄。它通過(guò)變化的連續(xù)記錄反映了心肌中的循環(huán)電生理事件。 這是一種非侵入性的有關(guān)心臟的有用信息,評(píng)估功能,診斷和治療計(jì)劃的臨床試驗(yàn)。心電圖是在世界上使用最廣泛的測(cè)試之一。在正常人體中,潛在的變化首先在心臟收縮之前發(fā)生,并且心電圖(ECG)變化從心臟的開(kāi)始開(kāi)始,即竇房結(jié)。根據(jù)一定的路線和時(shí)間表,它依次傳遞到心房和心室,這使整個(gè)心臟興奮。因此,在每個(gè)心動(dòng)周期中,心臟各部位的激發(fā)的電變化及其時(shí)間順序,方向和路徑具有一定的規(guī)律性。放置在身體一部分中的體表電極可以記錄在 ECG 曲線上,稱為 ECG。ECG 通常使用 ECG 采集儀器(例如 ECG 監(jiān)測(cè)器)來(lái)記錄人類心臟電位的變化并將其應(yīng)用于臨床心臟監(jiān)測(cè)/診斷可見(jiàn)圖形記錄。在心電圖中,一組連續(xù)發(fā)生的 P 波,QRS 波群,T 波和 U 波表示完整的心動(dòng)周期(也稱為心跳),心電圖由重復(fù)的心動(dòng)周期組成(文獻(xiàn)[1])。關(guān)于 ECG 的最重要信息集中在 P 波,QRS 波和 T 波上。這些信息主要包含:P- QRS- T 波的振幅、 P波間期、 PR 間期、 PR 段、 QRS 間期、 ST 段、ST 間隔,T 波間隔,QT 間隔和計(jì)算這些間隔所需的 P-QRS-T 邊界點(diǎn)位置,如圖 2.1 所示,圖 2.2 是實(shí)際收縮前的情況。
如圖 2.1 所示,圖 2.2 是實(shí)際收縮前的情況。圖 2.1 心電圖波形示意圖2.2 心電圖特征選取及特征提取ECG 的有效帶寬和足夠的采樣率是非常關(guān)鍵的兩個(gè)特征。 盡管對(duì)處理過(guò)程沒(méi)有任何影響,但在機(jī)器記錄信號(hào)時(shí)確定記錄 ECG 的采樣率。 因此,需要重點(diǎn)關(guān)注,使用適當(dāng)?shù)牟蓸勇。選用 250 Hz 而不是 500 Hz 的采樣率不會(huì)導(dǎo)致顯著差異,但是如果降低到 125Hz,濾除信號(hào)的頻率成分的現(xiàn)象變得非常嚴(yán)重,并且心電圖的峰值和振幅都會(huì)顯著的降低。
…, ,并且令U = , ,…, 。tep4: 求得高維樣本數(shù)據(jù) 所對(duì)應(yīng)的低維坐標(biāo) ∈ := ( ), = 1,2,…, 聚類分析 聚類分析的概念類分析是數(shù)據(jù)挖掘的重要方法。因此,我們需要根據(jù)各自的特征對(duì)大量樣分類。然聚類也可以在分類中發(fā)揮作用,但它與大多數(shù)分類不同。大多數(shù)分類方法,即人們預(yù)先確定某些事物的分類標(biāo)準(zhǔn)或每個(gè)類別的標(biāo)準(zhǔn)。然后對(duì)這些,以確定該項(xiàng)目的分類標(biāo)準(zhǔn)或每個(gè)類別的標(biāo)準(zhǔn)是或多或少主觀的。聚類分類似的基礎(chǔ)上劃分給定的數(shù)據(jù)集。這種劃分應(yīng)滿足以下兩個(gè)特性:1) 類內(nèi)相似性:屬于同一類的數(shù)據(jù)應(yīng)盡可能相似。2) 類間相異性:屬于不同類的數(shù)據(jù)應(yīng)盡可能相異。圖 3.1 是一個(gè)簡(jiǎn)單聚類
【參考文獻(xiàn)】
本文編號(hào):2882820
【學(xué)位單位】:武漢紡織大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位年份】:2019
【中圖分類】:R540.41;TP181;TP311.13;TN911.7
【部分圖文】:
2.1 心電圖簡(jiǎn)介ECG 是心臟產(chǎn)生的電信號(hào)的記錄。它通過(guò)變化的連續(xù)記錄反映了心肌中的循環(huán)電生理事件。 這是一種非侵入性的有關(guān)心臟的有用信息,評(píng)估功能,診斷和治療計(jì)劃的臨床試驗(yàn)。心電圖是在世界上使用最廣泛的測(cè)試之一。在正常人體中,潛在的變化首先在心臟收縮之前發(fā)生,并且心電圖(ECG)變化從心臟的開(kāi)始開(kāi)始,即竇房結(jié)。根據(jù)一定的路線和時(shí)間表,它依次傳遞到心房和心室,這使整個(gè)心臟興奮。因此,在每個(gè)心動(dòng)周期中,心臟各部位的激發(fā)的電變化及其時(shí)間順序,方向和路徑具有一定的規(guī)律性。放置在身體一部分中的體表電極可以記錄在 ECG 曲線上,稱為 ECG。ECG 通常使用 ECG 采集儀器(例如 ECG 監(jiān)測(cè)器)來(lái)記錄人類心臟電位的變化并將其應(yīng)用于臨床心臟監(jiān)測(cè)/診斷可見(jiàn)圖形記錄。在心電圖中,一組連續(xù)發(fā)生的 P 波,QRS 波群,T 波和 U 波表示完整的心動(dòng)周期(也稱為心跳),心電圖由重復(fù)的心動(dòng)周期組成(文獻(xiàn)[1])。關(guān)于 ECG 的最重要信息集中在 P 波,QRS 波和 T 波上。這些信息主要包含:P- QRS- T 波的振幅、 P波間期、 PR 間期、 PR 段、 QRS 間期、 ST 段、ST 間隔,T 波間隔,QT 間隔和計(jì)算這些間隔所需的 P-QRS-T 邊界點(diǎn)位置,如圖 2.1 所示,圖 2.2 是實(shí)際收縮前的情況。
如圖 2.1 所示,圖 2.2 是實(shí)際收縮前的情況。圖 2.1 心電圖波形示意圖2.2 心電圖特征選取及特征提取ECG 的有效帶寬和足夠的采樣率是非常關(guān)鍵的兩個(gè)特征。 盡管對(duì)處理過(guò)程沒(méi)有任何影響,但在機(jī)器記錄信號(hào)時(shí)確定記錄 ECG 的采樣率。 因此,需要重點(diǎn)關(guān)注,使用適當(dāng)?shù)牟蓸勇。選用 250 Hz 而不是 500 Hz 的采樣率不會(huì)導(dǎo)致顯著差異,但是如果降低到 125Hz,濾除信號(hào)的頻率成分的現(xiàn)象變得非常嚴(yán)重,并且心電圖的峰值和振幅都會(huì)顯著的降低。
…, ,并且令U = , ,…, 。tep4: 求得高維樣本數(shù)據(jù) 所對(duì)應(yīng)的低維坐標(biāo) ∈ := ( ), = 1,2,…, 聚類分析 聚類分析的概念類分析是數(shù)據(jù)挖掘的重要方法。因此,我們需要根據(jù)各自的特征對(duì)大量樣分類。然聚類也可以在分類中發(fā)揮作用,但它與大多數(shù)分類不同。大多數(shù)分類方法,即人們預(yù)先確定某些事物的分類標(biāo)準(zhǔn)或每個(gè)類別的標(biāo)準(zhǔn)。然后對(duì)這些,以確定該項(xiàng)目的分類標(biāo)準(zhǔn)或每個(gè)類別的標(biāo)準(zhǔn)是或多或少主觀的。聚類分類似的基礎(chǔ)上劃分給定的數(shù)據(jù)集。這種劃分應(yīng)滿足以下兩個(gè)特性:1) 類內(nèi)相似性:屬于同一類的數(shù)據(jù)應(yīng)盡可能相似。2) 類間相異性:屬于不同類的數(shù)據(jù)應(yīng)盡可能相異。圖 3.1 是一個(gè)簡(jiǎn)單聚類
【參考文獻(xiàn)】
相關(guān)期刊論文 前5條
1 張興福;黃少濱;;自適應(yīng)近鄰的局部線性嵌入算法[J];哈爾濱工程大學(xué)學(xué)報(bào);2012年04期
2 曾山;同小軍;桑農(nóng);李蓉?zé)?;基于對(duì)應(yīng)分析的冗余模糊C均值聚類算法研究[J];華中科技大學(xué)學(xué)報(bào)(自然科學(xué)版);2012年02期
3 顧亞祥;丁世飛;;支持向量機(jī)研究進(jìn)展[J];計(jì)算機(jī)科學(xué);2011年02期
4 丁世飛;齊丙娟;譚紅艷;;支持向量機(jī)理論與算法研究綜述[J];電子科技大學(xué)學(xué)報(bào);2011年01期
5 王麗蘋;董軍;;心電圖模式分類方法研究進(jìn)展與分析[J];中國(guó)生物醫(yī)學(xué)工程學(xué)報(bào);2010年06期
相關(guān)碩士學(xué)位論文 前2條
1 黃榮;統(tǒng)計(jì)方法在由心電圖判別疾病中的應(yīng)用[D];華東師范大學(xué);2014年
2 謝秋玲;應(yīng)用于心電圖分類的KNN和SVM分類器研究[D];華東師范大學(xué);2004年
本文編號(hào):2882820
本文鏈接:http://sikaile.net/linchuangyixuelunwen/2882820.html
最近更新
教材專著