基于Hadoop的中醫(yī)病案數據挖掘系統(tǒng)研究與設計
發(fā)布時間:2017-12-20 22:08
本文關鍵詞:基于Hadoop的中醫(yī)病案數據挖掘系統(tǒng)研究與設計 出處:《青島科技大學》2017年碩士論文 論文類型:學位論文
更多相關文章: 中醫(yī)數據挖掘并行化 Apriori算法并行化 K近鄰算法 Webservice技術
【摘要】:現代科學技術的進步與發(fā)展,加快了醫(yī)學信息的數字化,醫(yī)療系統(tǒng)包括中醫(yī)系統(tǒng)也在快速的健全和完備,隨之而來的是中醫(yī)病案數據量的急劇突增,如何利用這海量的中醫(yī)藥數據來防控疾病,診斷疾病,提供優(yōu)化方案,輔助診治,是當前業(yè)內專家高度關注的課題。傳統(tǒng)單機平臺下對大數據集的挖掘處理常受困于數據存儲和計算空間不足的窘境,其計算效率無法明顯提高。在此背景下,本文提出了基于Hadoop平臺的兩種中醫(yī)數據挖掘方案來處理龐大的中醫(yī)數據,采用并行化Apriori算法對中藥、癥狀和證型混合數據進行挖掘;采用并行化K近鄰分類算法對未知的癥狀群進行分類,預測其歸屬證型。同時基于Hadoop平臺搭建了中醫(yī)病案數據挖掘系統(tǒng),主要研究內容如下。首先對兩種經典數據挖掘算法進行并行化改造,針對Apriori算法并行計算過程中會產生大量鍵值對以及節(jié)點IO頻繁讀寫等不足之處,設計優(yōu)化方案,借助Hbase存儲中間過程數據,同時以迭代組合遞歸的方式代替?zhèn)鹘y(tǒng)的自連接方式來產生候選項集,從而有效的提高迭代計算速率,加速頻繁項集的產生;對K近鄰算法進行并行化設計,對癥狀等級量化取值,并歸一化處理,減少由于癥狀域值不同對距離計算的影響,進而更加客觀的對癥狀組進行分類。然后在搭建好的Hadoop2.0集群中,利用并行化改造后的Apriori算法,對中醫(yī)哮喘病案數據進行挖掘分析,獲得了中藥配伍規(guī)律、用藥與證型、癥狀的配伍規(guī)律以及癥狀與證型之間關聯關系,同時基于KNN分類算法對癥狀群進行預測歸屬的證型。實驗結果表明,其挖掘結果與理論基本匹配,具有一定的實際指導意義。最后系統(tǒng)借助Webservice技術,實現以Hadoop集群作為服務端,以Swing技術構建客戶端界面進行交互的C/S架構方案,建立基于Hadoop的中醫(yī)病案挖掘系統(tǒng)。該系統(tǒng)主要集成了集群配置、病案數據管理和數據挖掘三大功能模塊。通過對系統(tǒng)的各個功能模塊的測試,結果表明該系統(tǒng)具有良好的交互性和較完備的功能。
【學位授予單位】:青島科技大學
【學位級別】:碩士
【學位授予年份】:2017
【分類號】:R249;TP311.13
【參考文獻】
中國期刊全文數據庫 前10條
1 張建英;何建成;;大數據在中醫(yī)學中應用的可行性分析與展望[J];中華中醫(yī)藥雜志;2017年01期
2 夏中尚;杜正彩;鄧家剛;李楊;韋林W,
本文編號:1313577
本文鏈接:http://sikaile.net/shoufeilunwen/mpalunwen/1313577.html
最近更新
教材專著