基于Couchbase數(shù)據(jù)庫醫(yī)療數(shù)據(jù)管理系統(tǒng)的研究與實(shí)現(xiàn)
【圖文】:
圖 2.2 醫(yī)療領(lǐng)域關(guān)系型數(shù)據(jù)庫使用占比以上三種數(shù)據(jù)庫也都存在各自的缺點(diǎn),它們的共同缺點(diǎn)就是,對非結(jié)構(gòu)化數(shù)化數(shù)據(jù)的處理能力不足。此外,MySql 和 Sqlserver 的動(dòng)態(tài)擴(kuò)展能力有限,當(dāng)定程度時(shí),系統(tǒng)內(nèi)存空間將是一個(gè)難以解決的難題;Oracle 數(shù)據(jù)庫雖然有數(shù)能力,但是步驟較為繁瑣,并且需要的技術(shù)含量較高。顯然,繼續(xù)使用關(guān)系型數(shù)據(jù)庫來存儲醫(yī)療數(shù)據(jù),無法滿足存儲海量異構(gòu)醫(yī)療,這時(shí)候就需要選用 NOSQL 數(shù)據(jù)庫來解決這個(gè)問題。當(dāng)下市面上流行的非庫有很多,需要選擇一款最合適的來作為醫(yī)療數(shù)據(jù)管理系統(tǒng)的數(shù)據(jù)庫。當(dāng)下系型數(shù)據(jù)庫主要有 HBase、Redis、MongoDB、Couchbase、Cassandra,它們點(diǎn)如表 2.1 所示。表 2.1 主流 NOSQL 對比庫 優(yōu)點(diǎn) 缺點(diǎn)ase容量大,一張表能夠容納上億行,上百萬列;能搜到所需的歷史版本數(shù)據(jù);可簡單地實(shí)現(xiàn)開發(fā)時(shí)所需依賴較多、配置較麻煩,缺乏規(guī)范化文檔;占用內(nèi)存很大,讀取性能不高。
圖 2.5 各算法耗時(shí)對比圖表 2.2 和圖 2.5 可知,在進(jìn)行對比的 4 種關(guān)聯(lián)規(guī)則算法中,F(xiàn)P-growth 算法較之算法處理數(shù)據(jù)的速度最快,也最為平穩(wěn),所以系統(tǒng)將選擇 FP-growth 算法來挖據(jù)中的關(guān)聯(lián)規(guī)則。但是當(dāng) FP-growth 在面大數(shù)據(jù)量時(shí),算法所生成的 FP 樹就特致 FP 樹根本無法放進(jìn)內(nèi)存而不能對目標(biāo)數(shù)據(jù)集進(jìn)行頻繁項(xiàng)集挖掘,此外,在下,兩次掃描磁盤對算法執(zhí)行效率和系統(tǒng)性能都有影響。所以,本文提出一種枝 FP-growth 算法,用其分析醫(yī)療數(shù)據(jù)之間的關(guān)聯(lián)規(guī)則。章小結(jié)章首先分析當(dāng)下醫(yī)療系統(tǒng)使用數(shù)據(jù)庫的使用情況,并根據(jù)醫(yī)療數(shù)據(jù)的存儲需求Couchbase 數(shù)據(jù)庫存儲數(shù)據(jù);然后分析當(dāng)下流行的大數(shù)據(jù)處理框架,根據(jù)需求,, Hadoop 來處理海量醫(yī)療數(shù)據(jù);最后介紹關(guān)聯(lián)規(guī)則的相關(guān)概念,并對比分析常則算法,決定采用 FP-growth 算法來挖掘醫(yī)療數(shù)據(jù)之間的關(guān)聯(lián)規(guī)則,但是傳統(tǒng)owth 的效率仍不理想,所以本文在之后將提出一種改進(jìn)的剪枝 FP-growth 算法。
【學(xué)位授予單位】:西安科技大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2018
【分類號】:R197.3;TP311.52
【參考文獻(xiàn)】
相關(guān)期刊論文 前8條
1 ;上海區(qū)域衛(wèi)生信息化實(shí)踐經(jīng)驗(yàn)[J];中國信息界(e醫(yī)療);2014年03期
2 周光華;辛英;張雅潔;胡婷;李岳峰;;醫(yī)療衛(wèi)生領(lǐng)域大數(shù)據(jù)應(yīng)用探討[J];中國衛(wèi)生信息管理雜志;2013年04期
3 申德榮;于戈;王習(xí)特;聶鐵錚;寇月;;支持大數(shù)據(jù)管理的NoSQL系統(tǒng)研究綜述[J];軟件學(xué)報(bào);2013年08期
4 高漢松;肖凌;許德瑋;桑梓勤;;基于云計(jì)算的醫(yī)療大數(shù)據(jù)挖掘平臺[J];醫(yī)學(xué)信息學(xué)雜志;2013年05期
5 秦延斌;夏書劍;;基于數(shù)據(jù)挖掘的醫(yī)院診療系統(tǒng)的研究[J];科技信息;2012年11期
6 陳俊;陳孝威;;基于Hadoop建立云計(jì)算系統(tǒng)[J];貴州大學(xué)學(xué)報(bào)(自然科學(xué)版);2011年03期
7 周軼男;王宇;;Hadoop文件系統(tǒng)性能分析[J];電子技術(shù);2011年05期
8 蘭聰花;劉洋;唐占紅;;AprioriTid挖掘頻繁項(xiàng)集算法的改進(jìn)[J];計(jì)算機(jī)應(yīng)用與軟件;2010年03期
相關(guān)碩士學(xué)位論文 前10條
1 李若晨;基于并行的Apriori數(shù)據(jù)挖掘算法的研究[D];吉林大學(xué);2017年
2 丁晶晶;MapReduce框架下的任務(wù)調(diào)度算法研究[D];南京理工大學(xué);2017年
3 Alladoumbaye Ngueilbaye(阿拉杜);健康醫(yī)療系統(tǒng)的數(shù)據(jù)挖掘研究[D];哈爾濱工業(yè)大學(xué);2016年
4 婁書青;并行FP-growth關(guān)聯(lián)規(guī)則算法研究[D];電子科技大學(xué);2016年
5 周羿陽;基于Hadoop的醫(yī)療輔助診斷系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D];東華大學(xué);2016年
6 戴
本文編號:2644171
本文鏈接:http://sikaile.net/yixuelunwen/yiyuanguanlilunwen/2644171.html