天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于樣本與特征學(xué)習(xí)的帕金森語(yǔ)音數(shù)據(jù)挖掘方法研究

發(fā)布時(shí)間:2020-04-06 06:34
【摘要】:帕金森病(Parkinson's Disease,PD)是一種人類中樞神經(jīng)系統(tǒng)退行性疾病,如果在發(fā)病早期就能及時(shí)確診和干預(yù),絕大多數(shù)PD患者病情發(fā)展能夠得到有效延緩甚至停止。因此PD的早期無(wú)創(chuàng)診斷具有重大現(xiàn)實(shí)的意義;谡Z(yǔ)音數(shù)據(jù)挖掘PD分類應(yīng)用研究近年來(lái)開(kāi)始受到人們關(guān)注,其具有的無(wú)損、快速、遠(yuǎn)程、性價(jià)比、便捷等優(yōu)點(diǎn)使其成為目前國(guó)內(nèi)外研究熱點(diǎn)和難點(diǎn)。樣本和特征學(xué)習(xí)是PD分類算法中重要部分,但現(xiàn)有相關(guān)研究還存在如下關(guān)鍵問(wèn)題有待解決。1)PD語(yǔ)音樣本是通過(guò)采集多種語(yǔ)音片段獲取的,部分語(yǔ)音樣本不能較好的表征患者與健康者之間的本質(zhì)差異,并且樣本采集中會(huì)引入隨機(jī)噪聲,干擾分類器性能。因此如何優(yōu)選最優(yōu)樣本以實(shí)現(xiàn)滿意的分類正確率和穩(wěn)定性是一大難題,F(xiàn)有方法較少考慮樣本優(yōu)選對(duì)PD分類的影響,顯著影響了分類算法性能提高。2)帕金森語(yǔ)音樣本特征是由病理學(xué)家的先驗(yàn)知識(shí)獲取的,具有明顯的物理意義,但是特征間具有較大的冗余性,且表征PD病變的能力尚不令人滿意,需要研究特征的高效變換方法,以獲得分類能力強(qiáng)的高層特征,F(xiàn)階段大部分研究并沒(méi)有考慮特征之間的非線性關(guān)系,類別表征能力有限。圍繞解決上述問(wèn)題,本文探索研究基于分類與回歸樹(shù)(Classification and Regression Trees,CART)的樣本學(xué)習(xí)、基于深度信念網(wǎng)絡(luò)(Deep Belief Network,DBN)的特征學(xué)習(xí)等理論和方法,創(chuàng)新現(xiàn)有PD語(yǔ)音數(shù)據(jù)挖掘方法,提高分類準(zhǔn)確性。本文主要工作和貢獻(xiàn)如下:(1)提出了一種基于CART樣本優(yōu)選的PD語(yǔ)音數(shù)據(jù)分類方法。首先,根據(jù)PD語(yǔ)音數(shù)據(jù)樣本,采用基尼指數(shù)作為評(píng)價(jià)指標(biāo),獲取最佳分割特征及分割值,使得數(shù)據(jù)集不確定度減少最多,依次構(gòu)建左右子樹(shù);其次,為防止模型過(guò)擬合,通過(guò)調(diào)節(jié)CART葉節(jié)點(diǎn)樣本數(shù)量來(lái)控制模型復(fù)雜度,實(shí)現(xiàn)模型最佳性能。最后,將葉節(jié)點(diǎn)中樣本較多的那一類作為葉節(jié)點(diǎn)類別,排除其他類別樣本,從而選擇出最佳樣本集,實(shí)現(xiàn)對(duì)樣本的優(yōu)選。(2)在第一個(gè)工作的基礎(chǔ)上,進(jìn)一步提出了一種基于CART和集成學(xué)習(xí)的PD語(yǔ)音數(shù)據(jù)分類方法。首先,根據(jù)CART算法優(yōu)選出最優(yōu)樣本集,作為后續(xù)模型訓(xùn)練基礎(chǔ);其次,采用隨機(jī)森林(Random Forest,RF)、支持向量機(jī)(Support Vector Machine,SVM)和超限學(xué)習(xí)機(jī)(Extreme Learning Machine,ELM)作為基分類器,分別對(duì)新樣本集建模,對(duì)測(cè)試集預(yù)測(cè)標(biāo)簽。最后,采用投票法實(shí)現(xiàn)三個(gè)基分類器的決策層融合,獲得最終預(yù)測(cè)結(jié)果。(3)提出了一種基于DBN特征學(xué)習(xí)的PD語(yǔ)音數(shù)據(jù)分類方法。首先,構(gòu)建DBN特征提取網(wǎng)絡(luò),將每個(gè)受限玻爾茲曼機(jī)(Restricted Boltzmann Machine,RBM)輸出作為新的重構(gòu)特征;其次,將原始特征集送入DBN網(wǎng)絡(luò)中,使用對(duì)比散度算法分別訓(xùn)練每個(gè)RBM,擬合網(wǎng)絡(luò)參數(shù),非線性組合輸入特征,將RBM輸出作為最優(yōu)特征集;最后,使用RF算法對(duì)新特征建模分類。本文研究有助于揭示樣本和特征學(xué)習(xí)與PD語(yǔ)音數(shù)據(jù)分類之間的相關(guān)關(guān)系,為基于CART的樣本學(xué)習(xí)和基于DBN的特征學(xué)習(xí)的PD語(yǔ)音數(shù)據(jù)分類研究奠定相關(guān)理論基礎(chǔ)和方法依據(jù),對(duì)推進(jìn)PD語(yǔ)音數(shù)據(jù)分類診斷,避免高風(fēng)險(xiǎn)人群和患者往返醫(yī)院的不便和安全隱患,具有重要的理論意義和實(shí)用價(jià)值。
【學(xué)位授予單位】:重慶大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2018
【分類號(hào)】:TN912.3;TP18

【參考文獻(xiàn)】

相關(guān)期刊論文 前1條

1 張春霞;姬楠楠;王冠偉;;受限波爾茲曼機(jī)[J];工程數(shù)學(xué)學(xué)報(bào);2015年02期

相關(guān)博士學(xué)位論文 前1條

1 張擎;基于機(jī)器學(xué)習(xí)方法的若干生物特征識(shí)別關(guān)鍵問(wèn)題研究[D];山東大學(xué);2015年

,

本文編號(hào):2616154

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/wltx/2616154.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶590fc***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com