基于相似性度量的醫(yī)學數(shù)據(jù)補缺與分類方法研究
【學位單位】:合肥工業(yè)大學
【學位級別】:碩士
【學位年份】:2019
【中圖分類】:R-05;TP181
【部分圖文】:
合肥工業(yè)大學碩士學位論文第二章 變量定義及基礎(chǔ)知識言章首先對本課題中涉及的數(shù)據(jù)的結(jié)構(gòu)進行描述,為了更好的解釋和說明流程,將對本文中出現(xiàn)的符號進行統(tǒng)一的規(guī)范和描述,在接下來的章節(jié)中數(shù)據(jù)結(jié)構(gòu)、變量和符號將會遵循本章的格式。此外,本章將詳細介紹本文醫(yī)學數(shù)據(jù)集,并對本文中涉及算法的統(tǒng)計方法評價指標進行統(tǒng)一列出。據(jù)結(jié)構(gòu)及變量定義
以本問題的求解方式分兩種情況:如果 rank( ))=K,此時求出: = [W π SKcT T W π SKcTπ (SKcT)Tπ WT k(Gc(£ §T))<K,此時的最小二乘解由如下公式求出: = = [W π SKcT T W π SKcTπ (SKcT)Tπ WT cTπ (SKcT)T 是 SKcTπ (SKcT)T 的偽逆矩陣,但是當 rank(SK價于 SKcTπ (SKcT)T ,從而獲取了線性組合系數(shù) 。從而 ij= π W π SKm法完成了對 ij的填補,可對下一個缺失數(shù)據(jù)進行補缺操作同一待補數(shù)據(jù)集,每次對缺失值的填補可能會對屬性間的關(guān),在大多數(shù)情況下,這種影響的效果是微乎其微的,因此本聯(lián)度的計算只需要進行一次即可。當然,我們也可以選擇每據(jù)集的屬性關(guān)聯(lián)度矩陣進行更新,但這樣無疑會增加算法補數(shù)據(jù)集的實際情況靈活變通。程圖
圖 4.2 NACC 數(shù)據(jù)集在不同缺失比例下補缺算法的分類精度4.2 Classification accuracy of imputation algorithms for NACC data with differenmissing proportions這種有效性同樣保持在了土耳其 Bilkent University 心律失常數(shù)據(jù)集上,在 們提及了該數(shù)據(jù)集是混合型數(shù)據(jù)集,而本實驗選擇將該數(shù)據(jù)集分成了離散集(數(shù)據(jù)量為 542*73)和連續(xù)型數(shù)據(jù)集(數(shù)據(jù)量為 542*263)分別處理,離據(jù)集可用數(shù)據(jù)補缺的分類精度來衡量算法性能,如圖 4.3 所示:
【參考文獻】
相關(guān)期刊論文 前10條
1 朱彥;徐俊;朱玲;崔蒙;;主要發(fā)達國家醫(yī)療健康大數(shù)據(jù)政策分析[J];中華醫(yī)學圖書情報雜志;2015年10期
2 喬巖;王偉;;大數(shù)據(jù)在醫(yī)療領(lǐng)域的應(yīng)用[J];健康管理;2014年07期
3 楊龍頻;周林;陳陽陽;楊龍麟;;依托無線物聯(lián)網(wǎng)技術(shù)的實時醫(yī)療健康監(jiān)測系統(tǒng)[J];中國衛(wèi)生信息管理雜志;2013年06期
4 高明;;基于數(shù)據(jù)挖掘技術(shù)的疾病預(yù)防控制評估研究[J];醫(yī)學信息(上旬刊);2011年03期
5 劉卓;;K-最鄰近算法在文本自動分類中的應(yīng)用[J];蘇州市職業(yè)大學學報;2010年02期
6 李希強;王笛;陸舍銘;任卓英;董學暢;繆明明;;皮爾遜相關(guān)系數(shù)與UPLC相結(jié)合研究煙用香精香料指紋圖譜[J];精細化工;2008年05期
7 左森;郭曉松;萬敬;周召發(fā);;多項式核函數(shù)SVM快速分類算法[J];計算機工程;2007年06期
8 劉寶生;閆莉萍;周東華;;幾種經(jīng)典相似性度量的比較研究[J];計算機應(yīng)用研究;2006年11期
9 趙倩,胡越黎,曹家麟;基于支持向量機的皮膚顯微圖像識別[J];上海大學學報(自然科學版);2005年01期
10 汪輝,皮道映,孫優(yōu)賢;支持向量機在線訓練算法及其應(yīng)用[J];浙江大學學報(工學版);2004年12期
相關(guān)博士學位論文 前1條
1 姚衛(wèi)新;智能數(shù)據(jù)分析中異常數(shù)據(jù)的集成化管理方法研究[D];復(fù)旦大學;2004年
相關(guān)碩士學位論文 前3條
1 楊亞超;基于SVM和結(jié)構(gòu)性MRI數(shù)據(jù)的AD病程分類研究[D];山西醫(yī)科大學;2016年
2 嚴德春;基因微陣列數(shù)據(jù)的分析算法[D];蘇州大學;2012年
3 程曉蘭;決策樹分類算法及其應(yīng)用[D];大連交通大學;2008年
本文編號:2844342
本文鏈接:http://sikaile.net/yixuelunwen/yiyuanguanlilunwen/2844342.html