天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于Hadoop的醫(yī)保數(shù)據(jù)挖掘研究

發(fā)布時(shí)間:2021-11-13 13:57
  伴隨計(jì)算機(jī)和互聯(lián)網(wǎng)的廣泛應(yīng)用,人類產(chǎn)生、創(chuàng)造的數(shù)據(jù)量呈現(xiàn)出爆炸式的增長(zhǎng),我國已經(jīng)成為全球數(shù)據(jù)總量最大,數(shù)據(jù)類型最豐富的國家之一。與此同時(shí),人類也是數(shù)據(jù)的使用者,如何將數(shù)據(jù)進(jìn)行相應(yīng)的處理,使其轉(zhuǎn)化成為有用的信息已經(jīng)成為當(dāng)前機(jī)器學(xué)習(xí)領(lǐng)域一項(xiàng)重要的研究?jī)?nèi)容,由此數(shù)據(jù)挖掘技術(shù)應(yīng)運(yùn)而生。醫(yī)療保險(xiǎn)作為社保最重要的一部分,同時(shí)也是人們生活的基本保障,充分利用每天產(chǎn)生的海量醫(yī)保數(shù)據(jù),并對(duì)其進(jìn)行數(shù)據(jù)挖掘,發(fā)現(xiàn)數(shù)據(jù)之間存在的聯(lián)系,對(duì)提供疾病的臨床支持和科學(xué)決策、改善醫(yī)療治療效果以及輔助政策的定制和修改等都有實(shí)際意義。目前,國內(nèi)外許多研究人員將數(shù)據(jù)挖掘技術(shù)應(yīng)用于醫(yī)保數(shù)據(jù)的研究工作中,包括醫(yī)療費(fèi)用的分析、醫(yī)保欺詐的識(shí)別、相關(guān)疾病的合理用藥、醫(yī)保系統(tǒng)的管理等。本文提出利用數(shù)據(jù)挖掘相關(guān)技術(shù)對(duì)不同的醫(yī)保數(shù)據(jù)分別進(jìn)行分析和預(yù)測(cè)兩個(gè)實(shí)驗(yàn),對(duì)心腦血管疾病數(shù)據(jù)進(jìn)行探索分析得到心血管疾病與某些屬性特征的內(nèi)在關(guān)聯(lián)。對(duì)糖尿病的血糖值進(jìn)行預(yù)測(cè),通過特征工程來不斷更新候選的數(shù)據(jù)集,再經(jīng)過訓(xùn)練得到學(xué)習(xí)能力較好的預(yù)測(cè)模型,通過交叉驗(yàn)證,以均方誤差作為模型的評(píng)判標(biāo)準(zhǔn),并得到血糖的預(yù)測(cè)值,提高預(yù)測(cè)的準(zhǔn)確率。對(duì)數(shù)據(jù)的分析和預(yù)測(cè)是在普通計(jì)算機(jī)上... 

【文章來源】:沈陽工業(yè)大學(xué)遼寧省

【文章頁數(shù)】:58 頁

【學(xué)位級(jí)別】:碩士

【部分圖文】:

基于Hadoop的醫(yī)保數(shù)據(jù)挖掘研究


MapReduce架構(gòu)圖

結(jié)構(gòu)圖,結(jié)構(gòu)圖,數(shù)據(jù)挖掘


沈陽工業(yè)大學(xué)碩士學(xué)位論文10構(gòu)如圖2.5所示。圖2.5Hadoop項(xiàng)目結(jié)構(gòu)圖Fig.2.5Hadoopprojectstructurediagram(1)Pig:在Hadoop集群上運(yùn)行,是數(shù)據(jù)分析和評(píng)價(jià)的工具,它可以轉(zhuǎn)換數(shù)據(jù)分析的請(qǐng)求,提供了編程接口,進(jìn)行分布式運(yùn)算。(2)Hive:作為Hadoop基礎(chǔ)上的數(shù)據(jù)庫,提供了與結(jié)構(gòu)化查詢語句相同的查詢功能,向HDFS中添加數(shù)據(jù)并進(jìn)行統(tǒng)計(jì)分析操作,將SQL語句轉(zhuǎn)換一系列MapReduce作用并運(yùn)行。(3)ZooKeeper:分布式的情況下為了確保一致性而提供協(xié)調(diào)服務(wù),支持存儲(chǔ)、協(xié)調(diào)、維護(hù)、共享等。(4)HBase:主要用于數(shù)據(jù)挖掘,是開源的、面向列的存儲(chǔ)模型分布式數(shù)據(jù)庫,可以與MapReduce協(xié)同使用[20]。(5)Chukwa:作為一個(gè)開源的分布式數(shù)據(jù)集合系統(tǒng),將數(shù)據(jù)文件保存于HDFS中,以供操作。(6)Avor:作為數(shù)據(jù)序列化系統(tǒng),主要負(fù)責(zé)數(shù)據(jù)通信功能中數(shù)據(jù)的編碼,方便數(shù)據(jù)的傳輸,支持二進(jìn)制和動(dòng)態(tài)數(shù)據(jù)。2.2數(shù)據(jù)挖掘技術(shù)2.2.1數(shù)據(jù)挖掘的簡(jiǎn)介數(shù)據(jù)挖掘(DataMining-DM),就是從海量的數(shù)據(jù)之中使用一定的方法獲取有價(jià)值的信息,可以作為知識(shí)發(fā)現(xiàn)的一個(gè)過程,也可以看作是信息技術(shù)自然發(fā)展的結(jié)果[21]。目前,數(shù)據(jù)挖掘技術(shù)已經(jīng)得到各界的廣泛應(yīng)用并且技術(shù)日益成熟,同時(shí)該技術(shù)有很強(qiáng)的綜合交叉性,對(duì)于它的學(xué)習(xí)涉及到的科目有很多,包括機(jī)器學(xué)習(xí)、高級(jí)數(shù)據(jù)庫技術(shù)、識(shí)別模式、統(tǒng)計(jì)學(xué)、數(shù)據(jù)可視化分析、計(jì)算機(jī)網(wǎng)絡(luò)等多個(gè)學(xué)科。2.2.2數(shù)據(jù)挖掘的步驟MapReduceHDFSZooKeeperCoreAvroPigChukwaHiveHBase

直方圖,數(shù)據(jù)挖掘,目標(biāo)數(shù)據(jù),步驟


第2章相關(guān)技術(shù)綜述11數(shù)據(jù)挖掘能夠?qū)崿F(xiàn)與用戶于知識(shí)庫之間的交互。將得到的知識(shí)轉(zhuǎn)化為有趣易懂的模式呈現(xiàn)給用戶,而且還可以作為新知識(shí)存儲(chǔ)在知識(shí)庫中以備接下來使用。數(shù)據(jù)挖掘的過程可大致分為如下三個(gè)部分:數(shù)據(jù)準(zhǔn)備、數(shù)據(jù)挖掘、結(jié)果的表達(dá)和解釋[22]。具體過程如圖2.6所示。圖2.6數(shù)據(jù)挖掘的步驟Fig.2.6Stepsofdatamining(1)數(shù)據(jù)準(zhǔn)備1)數(shù)據(jù)收集:確定需要解決的問題類別,是回歸問題還是分類問題。接下來需要確定的挖掘主題或數(shù)據(jù)分析對(duì)象,通過相關(guān)數(shù)據(jù)庫、公開數(shù)據(jù)集的網(wǎng)站等其它數(shù)據(jù)源抽取數(shù)據(jù)。2)數(shù)據(jù)清理:對(duì)不完整、含噪聲、不一致的數(shù)據(jù)進(jìn)行統(tǒng)一的處理,以便提供良好的數(shù)據(jù)質(zhì)量,優(yōu)化挖掘效果。3)數(shù)據(jù)集成:將多個(gè)來源的數(shù)據(jù)進(jìn)行合并,并將數(shù)據(jù)存儲(chǔ)一致化的過程。4)數(shù)據(jù)規(guī)約:通過簡(jiǎn)化表示數(shù)據(jù)集來減少數(shù)據(jù)的維度,以此可以提高數(shù)據(jù)分析的精確度,加快數(shù)據(jù)計(jì)算的效率。5)數(shù)據(jù)變換和離散化:為了符合數(shù)據(jù)挖掘的各種形式,需要通過聚集、光滑、數(shù)據(jù)規(guī)范化等方法變換數(shù)據(jù)的形式;通過直方圖、聚類、分箱操作等方法將數(shù)據(jù)離散化。(2)數(shù)據(jù)挖掘根據(jù)不同的數(shù)據(jù),選擇合適的工具進(jìn)行分析,比如統(tǒng)計(jì)方法、分類、聚類、關(guān)聯(lián)規(guī)則、時(shí)序模式或者智能推薦等,可以使用其中一種、多種算法組合或算法之間的對(duì)比進(jìn)行數(shù)據(jù)分析或建模。(3)結(jié)果表達(dá)和解釋1)模式評(píng)估:就是驗(yàn)證數(shù)據(jù)挖掘結(jié)果或模型的準(zhǔn)確性。2)知識(shí)表示:將挖掘的結(jié)果轉(zhuǎn)化為結(jié)論性的文字或直觀的圖表等展示給用戶;根結(jié)果表達(dá)和解釋數(shù)據(jù)挖掘數(shù)據(jù)集成數(shù)據(jù)選擇預(yù)處理InformationKnowledge目標(biāo)數(shù)據(jù)預(yù)處理后的數(shù)據(jù)數(shù)據(jù)源數(shù)據(jù)源數(shù)據(jù)數(shù)據(jù)準(zhǔn)備數(shù)據(jù)挖掘結(jié)果的表達(dá)和解釋

【參考文獻(xiàn)】:
期刊論文
[1]基于LightGBM的血壓檢測(cè)方法研究[J]. 吳紹武,續(xù)育茹.  生物醫(yī)學(xué)工程研究. 2019(03)
[2]基于自適應(yīng)PSO的改進(jìn)K-means算法及其在電子病歷聚類分析應(yīng)用[J]. 沐燕舟,丁衛(wèi)平,高峰,余利國,張瓊.  計(jì)算機(jī)與數(shù)字工程. 2019(08)
[3]中國心血管疾病防治的成果及展望[J]. 歐麗.  中國實(shí)用醫(yī)藥. 2019(23)
[4]中國人群血脂異常流行趨勢(shì)和治療控制現(xiàn)狀[J]. 趙冬.  中華心血管病雜志. 2019 (05)
[5]機(jī)器學(xué)習(xí)算法在糖尿病預(yù)測(cè)中的應(yīng)用[J]. 賀其,趙崗,菊云霞,周薏嵐,李敏,董琪,趙凱.  貴州大學(xué)學(xué)報(bào)(自然科學(xué)版). 2019(02)
[6]ICU患者急性腎損傷發(fā)生風(fēng)險(xiǎn)的LightGBM預(yù)測(cè)模型[J]. 張淵,馮聰,李開源,張政波,曹德森,黎檀實(shí).  解放軍醫(yī)學(xué)院學(xué)報(bào). 2019(04)
[7]《中國心血管病報(bào)告2018》概要[J]. 胡盛壽,高潤(rùn)霖,劉力生,朱曼璐,王文,王擁軍,吳兆蘇,李惠君,顧東風(fēng),楊躍進(jìn),鄭哲,陳偉偉.  中國循環(huán)雜志. 2019(03)
[8]我國醫(yī)療保險(xiǎn)制度發(fā)展四十年:進(jìn)程、經(jīng)驗(yàn)與展望[J]. 仇雨臨,王昭茜.  華中師范大學(xué)學(xué)報(bào)(人文社會(huì)科學(xué)版). 2019(01)
[9]中國2型糖尿病防治指南(2017年版)[J]. Chinese Diabetes Society;.  中國實(shí)用內(nèi)科雜志. 2018(04)
[10]基于XGBoost算法的2型糖尿病精準(zhǔn)預(yù)測(cè)模型研究[J]. 張洪俠,郭賀,王金霞,徐巖艷,呂斌,閆東,常佳,胡光瑞,王雪,李洪軍,劉天戟,李燕林,趙志強(qiáng),牛曉強(qiáng).  中國實(shí)驗(yàn)診斷學(xué). 2018(03)

碩士論文
[1]基于LightGBM的居民出行方式選擇模型及應(yīng)用研究[D]. 范德祥.華中科技大學(xué) 2018
[2]基于Hadoop的數(shù)據(jù)挖掘算法研究與實(shí)現(xiàn)[D]. 何健偉.北京郵電大學(xué) 2015
[3]基于Hadoop平臺(tái)的醫(yī)保數(shù)據(jù)挖掘[D]. 梁瑜.東北大學(xué) 2012



本文編號(hào):3493144

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3493144.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶0de16***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com
亚洲最新中文字幕在线视频| 91亚洲国产—区=区a| 伊人久久青草地综合婷婷| 国产午夜精品亚洲精品国产| 亚洲中文字幕高清乱码毛片| 在线观看国产午夜福利| 亚洲品质一区二区三区| 婷婷亚洲综合五月天麻豆| 国产欧美日韩综合精品二区| 日韩精品一区二区亚洲| 人妻亚洲一区二区三区| 日韩精品毛片视频免费看| 成人你懂的在线免费视频| 免费人妻精品一区二区三区久久久 | 欧美亚洲另类久久久精品| 国产精品视频一区二区秋霞| 国产日韩欧美在线播放| 免费观看一区二区三区黄片| 国产又粗又猛又长又大| 婷婷伊人综合中文字幕| 日本熟妇五十一区二区三区| 国产一区欧美一区日本道| 国产精品人妻熟女毛片av久久| 夫妻性生活一级黄色录像| 搡老熟女老女人一区二区| 欧美日韩国产免费看黄片| 又色又爽又无遮挡的视频 | 中国一区二区三区不卡| 爱在午夜降临前在线观看| 亚洲精品国男人在线视频| 欧美日韩亚洲国产综合网| 亚洲另类女同一二三区| 草草草草在线观看视频| 日本一本不卡免费视频| 色涩一区二区三区四区| 成人国产激情福利久久| 国产丝袜女优一区二区三区| 91亚洲熟女少妇在线观看| 婷婷色国产精品视频一区| 久久精品国产99国产免费| 国产免费成人激情视频|