基于監(jiān)督學(xué)習(xí)分類算法的中醫(yī)診療辨證分型方法研究
發(fā)布時(shí)間:2021-06-08 04:43
多標(biāo)簽分類問題是數(shù)據(jù)挖掘領(lǐng)域的一個(gè)重要分支,因其應(yīng)用領(lǐng)域的廣泛被人們熟知,也是大數(shù)據(jù)時(shí)代的研究熱點(diǎn)。傳統(tǒng)中醫(yī)癥狀-證型的辨證論治思想在中醫(yī)界并未達(dá)成共識(shí),各家仍以經(jīng)驗(yàn)為主,主觀性較強(qiáng)。為了科學(xué)化處理醫(yī)師的診斷經(jīng)驗(yàn),將診療數(shù)據(jù)訓(xùn)練成一個(gè)客觀的診斷模型,將多標(biāo)簽分類技術(shù)應(yīng)用于中醫(yī)失眠辨證分型研究當(dāng)中。希望該方法能夠幫到臨床醫(yī)者,凸顯其價(jià)值。中醫(yī)病案本身具有異質(zhì)性、多樣性、冗余性等特點(diǎn),為了客觀公正的描述患者病情癥狀,有必要對(duì)病案癥狀信息進(jìn)行分級(jí)量化處理,并按照多標(biāo)簽數(shù)據(jù)規(guī)格記錄整理,以備訓(xùn)練算法模型。算法模型采用改進(jìn)KNN算法的多標(biāo)簽分類模型,并將多標(biāo)簽算法進(jìn)行分類討論,詳細(xì)闡述各個(gè)算法的原理和步驟,并比較各算法之間的優(yōu)缺點(diǎn),為了驗(yàn)證該算法的適用數(shù)據(jù)集范圍,將該算法運(yùn)用到不同數(shù)據(jù)集領(lǐng)域當(dāng)中,以證明該算法的普適性、高效性。針對(duì)傳統(tǒng)的KNN算法學(xué)習(xí)的是周圍相似數(shù)據(jù)分布情況,而貝葉斯方法學(xué)習(xí)的是數(shù)據(jù)的全局分布情況這一問題,將KNN與貝葉斯方法相結(jié)合,即多標(biāo)簽K近鄰算法(ML-KNN),這樣既很好的繼承了二者的優(yōu)點(diǎn),又能克服因樣本數(shù)據(jù)不均衡帶來的影響。然而ML-KNN算法并沒有考慮到:在樣本空間中...
【文章來源】:內(nèi)蒙古科技大學(xué)內(nèi)蒙古自治區(qū)
【文章頁數(shù)】:57 頁
【學(xué)位級(jí)別】:碩士
【部分圖文】:
數(shù)據(jù)挖掘七大類
內(nèi)蒙古科技大學(xué)碩士學(xué)位論文133基于數(shù)據(jù)挖掘的中醫(yī)病案處理3.1數(shù)據(jù)挖掘數(shù)據(jù)挖掘(DataMining)是利用現(xiàn)代化專業(yè)技術(shù)對(duì)大規(guī)模數(shù)據(jù)集進(jìn)行篩癬提取并抽象,建立算法模型,為我們所用。按照主要功能將數(shù)據(jù)挖掘分為以下七類:如圖3.1;數(shù)據(jù)挖掘領(lǐng)域匯集了多個(gè)交叉學(xué)科,如圖3.2;數(shù)據(jù)挖掘的一般步驟如圖3.3。圖3.1數(shù)據(jù)挖掘七大類圖3.2數(shù)據(jù)挖掘領(lǐng)域圖3.3數(shù)據(jù)挖掘一般步驟信息學(xué)科機(jī)器學(xué)習(xí)模式識(shí)別數(shù)據(jù)庫技術(shù)AI神經(jīng)網(wǎng)絡(luò)信息檢索數(shù)據(jù)可視化數(shù)理統(tǒng)計(jì)社會(huì)學(xué)科零售業(yè)臨床醫(yī)學(xué)金融業(yè)生物醫(yī)學(xué)保險(xiǎn)業(yè)預(yù)防醫(yī)學(xué)電信業(yè)市場(chǎng)營(yíng)銷數(shù)據(jù)挖掘
內(nèi)蒙古科技大學(xué)碩士學(xué)位論文15其中男性938例(38.97%),平均年齡(44.16±14.54)歲;女性1469例(61.03%),平均年齡(48.70±12.74)歲。經(jīng)過統(tǒng)計(jì),單證候病例1520例,占總病例的63.15%,兼證病例770例,占31.99%,其中三證合見病例117例,占4.86%,每個(gè)病例有24個(gè)屬性。如下圖3.4所示,自變量和因變量分別為,以及不同證型對(duì)應(yīng)癥狀群如圖3.5所示。圖3.4失眠癥的變量圖3.5失眠癥的五種證型由于中醫(yī)病例特點(diǎn),癥狀描述多摻雜醫(yī)師主觀感受,為了客觀科學(xué)的描述癥狀表現(xiàn),有必要將專業(yè)化的中醫(yī)描述轉(zhuǎn)化成數(shù)字語言。例如,二分類變量‘健忘’,有健忘現(xiàn)象數(shù)字化為1,沒有健忘現(xiàn)象數(shù)字化為0,這里需要說明一點(diǎn),將中醫(yī)描述轉(zhuǎn)化為數(shù)字語言,需把有序和無序變量都按無序處理。又如多分類變量‘便況’,將無明顯癥狀量化為0,便秘狀況量化為1,便溏狀況量化為2等。如表3.1所示為不同癥狀對(duì)應(yīng)量化值。表3.2樣本數(shù)據(jù)統(tǒng)計(jì)證型肝火擾心證痰火擾心證心脾兩虛證心腎不交證心膽氣虛證總計(jì)數(shù)量9853016992331892407本次實(shí)驗(yàn)的訓(xùn)練數(shù)據(jù)集和測(cè)試數(shù)據(jù)集都采用該2407例病例數(shù)據(jù)。詳細(xì)樣本數(shù)據(jù)統(tǒng)計(jì)以及量化病例數(shù)據(jù)分別如下表3.2、表3.3所示。
【參考文獻(xiàn)】:
期刊論文
[1]圖像多標(biāo)簽學(xué)習(xí)的研究概述[J]. 袁夢(mèng)奇,鮑秉坤. 南京信息工程大學(xué)學(xué)報(bào)(自然科學(xué)版). 2019(06)
[2]基于深度雙向分類器鏈的多標(biāo)簽新聞分類算法[J]. 胡天磊,王皓波,尹文棟. 浙江大學(xué)學(xué)報(bào)(工學(xué)版). 2019(11)
[3]基于3種數(shù)據(jù)挖掘模型分析16618例含附子中成藥的處方用藥規(guī)律[J]. 陳俊麒,吳俊標(biāo),林華,胡黎,鄧廣海,賴瀟瀟,羅懿妮. 中國(guó)實(shí)驗(yàn)方劑學(xué)雜志. 2020(03)
[4]結(jié)合標(biāo)簽相關(guān)性和不均衡性的多標(biāo)簽學(xué)習(xí)模型[J]. 姜思羽,鐘曉玲,邱少健,宋恒杰. 哈爾濱工業(yè)大學(xué)學(xué)報(bào). 2019(01)
[5]基于遷移學(xué)習(xí)的多標(biāo)簽圖像標(biāo)注[J]. 秦瑩華,李菲菲,陳虬. 電子科技. 2018(08)
[6]基于多標(biāo)簽學(xué)習(xí)的卷積神經(jīng)網(wǎng)絡(luò)的圖像標(biāo)注方法[J]. 高耀東,侯凌燕,楊大利. 計(jì)算機(jī)應(yīng)用. 2017(01)
[7]國(guó)內(nèi)中醫(yī)住院病案首頁質(zhì)量分析與影響因素初探[J]. 謝佳東,趙玉鳳,胡孔法,李國(guó)正,劉保延. 中國(guó)中醫(yī)藥信息雜志. 2016(12)
[8]一種多標(biāo)簽隨機(jī)均衡采樣算法[J]. 李思豪,陳福才,黃瑞陽. 計(jì)算機(jī)應(yīng)用研究. 2017(10)
[9]失眠與抑郁關(guān)系2008-2013年研究進(jìn)展及存在問題[J]. 張繼輝,劉亞平,潘集陽. 中國(guó)心理衛(wèi)生雜志. 2015(02)
[10]基于數(shù)據(jù)挖掘的名老中醫(yī)經(jīng)驗(yàn)傳承研究述評(píng)[J]. 吳嘉瑞,唐仕歡,郭位先,張曉朦,張冰. 中國(guó)中藥雜志. 2014(04)
博士論文
[1]基于本體數(shù)據(jù)庫的多標(biāo)簽預(yù)測(cè)模型及生物醫(yī)藥數(shù)據(jù)挖掘研究[D]. 程翔.東華大學(xué) 2017
[2]基于數(shù)據(jù)庫挖掘的經(jīng)方治療臺(tái)灣人失眠與抑郁癥的研究[D]. 陳懿琳.北京中醫(yī)藥大學(xué) 2016
[3]面向互聯(lián)網(wǎng)應(yīng)用的不平衡數(shù)據(jù)分類技術(shù)研究[D]. 李虎.國(guó)防科學(xué)技術(shù)大學(xué) 2016
[4]多醫(yī)師辨證論治失眠有效治療方藥的發(fā)現(xiàn)研究[D]. 江麗杰.中國(guó)中醫(yī)科學(xué)院 2014
[5]面向非均衡數(shù)據(jù)集的機(jī)器學(xué)習(xí)及在地學(xué)數(shù)據(jù)處理中的應(yīng)用[D]. 谷瓊.中國(guó)地質(zhì)大學(xué) 2009
[6]文本分類技術(shù)與應(yīng)用研究[D]. 郝秀蘭.復(fù)旦大學(xué) 2008
[7]基于多標(biāo)簽學(xué)習(xí)的圖像語義自動(dòng)標(biāo)注研究[D]. 王梅.復(fù)旦大學(xué) 2008
碩士論文
[1]基于集成學(xué)習(xí)的中醫(yī)病案數(shù)據(jù)挖掘方法研究[D]. 張守賓.青島科技大學(xué) 2018
[2]基于數(shù)據(jù)挖掘的張珍玉先生診療不寐證治規(guī)律研究[D]. 楊晗.山東中醫(yī)藥大學(xué) 2017
[3]553例陰虛不寐臨床資料分析與證治規(guī)律探討[D]. 于成.山東中醫(yī)藥大學(xué) 2017
[4]面向?qū)嶓w信息挖掘的多標(biāo)簽學(xué)習(xí)算法研究[D]. 李思豪.解放軍信息工程大學(xué) 2017
[5]基于情感的多標(biāo)簽個(gè)性化音樂分類技術(shù)的研究與實(shí)現(xiàn)[D]. 谷炫志.浙江大學(xué) 2016
[6]基于數(shù)據(jù)挖掘的中醫(yī)診斷智能信息化技術(shù)研究[D]. 董國(guó)華.青島科技大學(xué) 2015
[7]多標(biāo)簽分類算法的研究及其在中醫(yī)診斷帕金森領(lǐng)域的應(yīng)用[D]. 方銘.南京大學(xué) 2015
[8]名老中醫(yī)經(jīng)驗(yàn)傳承中的數(shù)據(jù)挖掘技術(shù)研究[D]. 肖光磊.南京理工大學(xué) 2008
本文編號(hào):3217721
【文章來源】:內(nèi)蒙古科技大學(xué)內(nèi)蒙古自治區(qū)
【文章頁數(shù)】:57 頁
【學(xué)位級(jí)別】:碩士
【部分圖文】:
數(shù)據(jù)挖掘七大類
內(nèi)蒙古科技大學(xué)碩士學(xué)位論文133基于數(shù)據(jù)挖掘的中醫(yī)病案處理3.1數(shù)據(jù)挖掘數(shù)據(jù)挖掘(DataMining)是利用現(xiàn)代化專業(yè)技術(shù)對(duì)大規(guī)模數(shù)據(jù)集進(jìn)行篩癬提取并抽象,建立算法模型,為我們所用。按照主要功能將數(shù)據(jù)挖掘分為以下七類:如圖3.1;數(shù)據(jù)挖掘領(lǐng)域匯集了多個(gè)交叉學(xué)科,如圖3.2;數(shù)據(jù)挖掘的一般步驟如圖3.3。圖3.1數(shù)據(jù)挖掘七大類圖3.2數(shù)據(jù)挖掘領(lǐng)域圖3.3數(shù)據(jù)挖掘一般步驟信息學(xué)科機(jī)器學(xué)習(xí)模式識(shí)別數(shù)據(jù)庫技術(shù)AI神經(jīng)網(wǎng)絡(luò)信息檢索數(shù)據(jù)可視化數(shù)理統(tǒng)計(jì)社會(huì)學(xué)科零售業(yè)臨床醫(yī)學(xué)金融業(yè)生物醫(yī)學(xué)保險(xiǎn)業(yè)預(yù)防醫(yī)學(xué)電信業(yè)市場(chǎng)營(yíng)銷數(shù)據(jù)挖掘
內(nèi)蒙古科技大學(xué)碩士學(xué)位論文15其中男性938例(38.97%),平均年齡(44.16±14.54)歲;女性1469例(61.03%),平均年齡(48.70±12.74)歲。經(jīng)過統(tǒng)計(jì),單證候病例1520例,占總病例的63.15%,兼證病例770例,占31.99%,其中三證合見病例117例,占4.86%,每個(gè)病例有24個(gè)屬性。如下圖3.4所示,自變量和因變量分別為,以及不同證型對(duì)應(yīng)癥狀群如圖3.5所示。圖3.4失眠癥的變量圖3.5失眠癥的五種證型由于中醫(yī)病例特點(diǎn),癥狀描述多摻雜醫(yī)師主觀感受,為了客觀科學(xué)的描述癥狀表現(xiàn),有必要將專業(yè)化的中醫(yī)描述轉(zhuǎn)化成數(shù)字語言。例如,二分類變量‘健忘’,有健忘現(xiàn)象數(shù)字化為1,沒有健忘現(xiàn)象數(shù)字化為0,這里需要說明一點(diǎn),將中醫(yī)描述轉(zhuǎn)化為數(shù)字語言,需把有序和無序變量都按無序處理。又如多分類變量‘便況’,將無明顯癥狀量化為0,便秘狀況量化為1,便溏狀況量化為2等。如表3.1所示為不同癥狀對(duì)應(yīng)量化值。表3.2樣本數(shù)據(jù)統(tǒng)計(jì)證型肝火擾心證痰火擾心證心脾兩虛證心腎不交證心膽氣虛證總計(jì)數(shù)量9853016992331892407本次實(shí)驗(yàn)的訓(xùn)練數(shù)據(jù)集和測(cè)試數(shù)據(jù)集都采用該2407例病例數(shù)據(jù)。詳細(xì)樣本數(shù)據(jù)統(tǒng)計(jì)以及量化病例數(shù)據(jù)分別如下表3.2、表3.3所示。
【參考文獻(xiàn)】:
期刊論文
[1]圖像多標(biāo)簽學(xué)習(xí)的研究概述[J]. 袁夢(mèng)奇,鮑秉坤. 南京信息工程大學(xué)學(xué)報(bào)(自然科學(xué)版). 2019(06)
[2]基于深度雙向分類器鏈的多標(biāo)簽新聞分類算法[J]. 胡天磊,王皓波,尹文棟. 浙江大學(xué)學(xué)報(bào)(工學(xué)版). 2019(11)
[3]基于3種數(shù)據(jù)挖掘模型分析16618例含附子中成藥的處方用藥規(guī)律[J]. 陳俊麒,吳俊標(biāo),林華,胡黎,鄧廣海,賴瀟瀟,羅懿妮. 中國(guó)實(shí)驗(yàn)方劑學(xué)雜志. 2020(03)
[4]結(jié)合標(biāo)簽相關(guān)性和不均衡性的多標(biāo)簽學(xué)習(xí)模型[J]. 姜思羽,鐘曉玲,邱少健,宋恒杰. 哈爾濱工業(yè)大學(xué)學(xué)報(bào). 2019(01)
[5]基于遷移學(xué)習(xí)的多標(biāo)簽圖像標(biāo)注[J]. 秦瑩華,李菲菲,陳虬. 電子科技. 2018(08)
[6]基于多標(biāo)簽學(xué)習(xí)的卷積神經(jīng)網(wǎng)絡(luò)的圖像標(biāo)注方法[J]. 高耀東,侯凌燕,楊大利. 計(jì)算機(jī)應(yīng)用. 2017(01)
[7]國(guó)內(nèi)中醫(yī)住院病案首頁質(zhì)量分析與影響因素初探[J]. 謝佳東,趙玉鳳,胡孔法,李國(guó)正,劉保延. 中國(guó)中醫(yī)藥信息雜志. 2016(12)
[8]一種多標(biāo)簽隨機(jī)均衡采樣算法[J]. 李思豪,陳福才,黃瑞陽. 計(jì)算機(jī)應(yīng)用研究. 2017(10)
[9]失眠與抑郁關(guān)系2008-2013年研究進(jìn)展及存在問題[J]. 張繼輝,劉亞平,潘集陽. 中國(guó)心理衛(wèi)生雜志. 2015(02)
[10]基于數(shù)據(jù)挖掘的名老中醫(yī)經(jīng)驗(yàn)傳承研究述評(píng)[J]. 吳嘉瑞,唐仕歡,郭位先,張曉朦,張冰. 中國(guó)中藥雜志. 2014(04)
博士論文
[1]基于本體數(shù)據(jù)庫的多標(biāo)簽預(yù)測(cè)模型及生物醫(yī)藥數(shù)據(jù)挖掘研究[D]. 程翔.東華大學(xué) 2017
[2]基于數(shù)據(jù)庫挖掘的經(jīng)方治療臺(tái)灣人失眠與抑郁癥的研究[D]. 陳懿琳.北京中醫(yī)藥大學(xué) 2016
[3]面向互聯(lián)網(wǎng)應(yīng)用的不平衡數(shù)據(jù)分類技術(shù)研究[D]. 李虎.國(guó)防科學(xué)技術(shù)大學(xué) 2016
[4]多醫(yī)師辨證論治失眠有效治療方藥的發(fā)現(xiàn)研究[D]. 江麗杰.中國(guó)中醫(yī)科學(xué)院 2014
[5]面向非均衡數(shù)據(jù)集的機(jī)器學(xué)習(xí)及在地學(xué)數(shù)據(jù)處理中的應(yīng)用[D]. 谷瓊.中國(guó)地質(zhì)大學(xué) 2009
[6]文本分類技術(shù)與應(yīng)用研究[D]. 郝秀蘭.復(fù)旦大學(xué) 2008
[7]基于多標(biāo)簽學(xué)習(xí)的圖像語義自動(dòng)標(biāo)注研究[D]. 王梅.復(fù)旦大學(xué) 2008
碩士論文
[1]基于集成學(xué)習(xí)的中醫(yī)病案數(shù)據(jù)挖掘方法研究[D]. 張守賓.青島科技大學(xué) 2018
[2]基于數(shù)據(jù)挖掘的張珍玉先生診療不寐證治規(guī)律研究[D]. 楊晗.山東中醫(yī)藥大學(xué) 2017
[3]553例陰虛不寐臨床資料分析與證治規(guī)律探討[D]. 于成.山東中醫(yī)藥大學(xué) 2017
[4]面向?qū)嶓w信息挖掘的多標(biāo)簽學(xué)習(xí)算法研究[D]. 李思豪.解放軍信息工程大學(xué) 2017
[5]基于情感的多標(biāo)簽個(gè)性化音樂分類技術(shù)的研究與實(shí)現(xiàn)[D]. 谷炫志.浙江大學(xué) 2016
[6]基于數(shù)據(jù)挖掘的中醫(yī)診斷智能信息化技術(shù)研究[D]. 董國(guó)華.青島科技大學(xué) 2015
[7]多標(biāo)簽分類算法的研究及其在中醫(yī)診斷帕金森領(lǐng)域的應(yīng)用[D]. 方銘.南京大學(xué) 2015
[8]名老中醫(yī)經(jīng)驗(yàn)傳承中的數(shù)據(jù)挖掘技術(shù)研究[D]. 肖光磊.南京理工大學(xué) 2008
本文編號(hào):3217721
本文鏈接:http://sikaile.net/shoufeilunwen/mpalunwen/3217721.html
最近更新
教材專著