基于醫(yī)保業(yè)務(wù)的規(guī)則執(zhí)行優(yōu)化及應(yīng)用
【學(xué)位授予單位】:電子科技大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2019
【分類號(hào)】:R197.1;F842.6;TP311.13
【圖文】:
圖 2-2 Rete 算法網(wǎng)絡(luò)結(jié)構(gòu)2.3 MapReduceMapReduce 是谷歌在 2004 年提出的一種并行編程模型,它具有易用且功能強(qiáng)大的優(yōu)點(diǎn),其開(kāi)源實(shí)現(xiàn)的 Hadoop 已經(jīng)廣泛應(yīng)用于許多大數(shù)據(jù)領(lǐng)域[23]。MapReduce是一個(gè)并行庫(kù),它的并行原理是將數(shù)據(jù)切片并分布在多個(gè) Map 節(jié)點(diǎn)上,并行處理后的中間結(jié)果經(jīng)過(guò) Shuffle 后,執(zhí)行 Reduce 操作匯總各自的結(jié)果以形成最終結(jié)果[24]。MapReduce 在處理大量數(shù)據(jù)計(jì)算方面是較為流行的分布式并行編程模型,它提供較為簡(jiǎn)便的使用性,并支持負(fù)載均衡和容錯(cuò)等。MapReduce 不需要編程人員掌握分布式并行編程的底層技術(shù)細(xì)節(jié),也能較簡(jiǎn)便的將應(yīng)用程序運(yùn)行于分布式系統(tǒng)上,完成海量數(shù)據(jù)的計(jì)算[25]。MapReduce 高度抽象并行計(jì)算過(guò)程為 Map 函數(shù)和 Reduce 函數(shù)。采用“分而治之”的思想,數(shù)據(jù)集被預(yù)先拆分為多個(gè)獨(dú)立的分片(split),分片被分配到多個(gè)Map工作節(jié)點(diǎn)并行地處理并產(chǎn)生中間結(jié)果,而后中間結(jié)果在Reduce 工作節(jié)點(diǎn)匯總。
第三章 基于醫(yī)保費(fèi)用數(shù)據(jù)的分類規(guī)則提取樣本錯(cuò)誤分類導(dǎo)致的代價(jià),用代價(jià)矩陣(Cost Matrix)來(lái)表示不同誤分類的成本。在代價(jià)矩陣中,錯(cuò)誤的將 i 類分類為 j 類的代價(jià)定義為 C(i, j),正確分類時(shí)即 i=j,此時(shí) C(i, j)=0。對(duì)于本文對(duì)應(yīng)的二分類問(wèn)題,通過(guò)提高少數(shù)類(Minority)誤分類為多數(shù)類(Majority)的代價(jià),即 C(Minority, Majority) < C(Majority, Minority),避免算法傾向于多數(shù)類的分類結(jié)果。除了隨機(jī)過(guò)采樣,SMOTE(Synthetic Sampling with Data Generation)也是一種過(guò)采樣方法,它基于現(xiàn)有的少數(shù)類之間的特征空間相似度來(lái)生成一些數(shù)據(jù),使得少數(shù)類和多數(shù)類樣本趨于平衡。例如下圖 3-3(a)所示了典型的不平衡數(shù)據(jù)分布,其中星形和圓形分別代表少數(shù)類和多數(shù)類的樣本,圖中設(shè)置 K 個(gè)近鄰的數(shù)量被設(shè)置為K = 6。圖 3-3(b)表示沿著選定的樣本 和隨機(jī)選定的相鄰樣本 之間創(chuàng)建連線,然后在該連線上隨機(jī)選擇一點(diǎn)作為新產(chǎn)生的少數(shù)類樣本,如圖中由菱形形狀所示。SMOTE 通過(guò)以上步驟不斷生成少數(shù)類樣本,和同樣是增加少數(shù)類樣本的隨機(jī)過(guò)采樣相比能夠防止過(guò)擬合,同時(shí)也避免欠采樣導(dǎo)致缺失有價(jià)值的信息。同時(shí),SMOTE 方法也存在容易過(guò)泛化、數(shù)據(jù)重疊等弊端。
【參考文獻(xiàn)】
相關(guān)期刊論文 前10條
1 金維剛;;城鄉(xiāng)居民醫(yī)保整合及其發(fā)展趨勢(shì)[J];中國(guó)醫(yī)療保險(xiǎn);2016年03期
2 李亞子;尤斌;;醫(yī)療保險(xiǎn)騙保特征分析[J];中國(guó)社會(huì)保障;2015年02期
3 陳帥均;蔣平;吳欽章;;基于代價(jià)模型的RETE優(yōu)化算法[J];光電工程;2014年07期
4 顧小東;高陽(yáng);;Rete算法:研究現(xiàn)狀與挑戰(zhàn)[J];計(jì)算機(jī)科學(xué);2012年11期
5 張桂剛;;一種海量規(guī)則模式匹配方法[J];計(jì)算機(jī)科學(xué);2012年01期
6 丁淵;;規(guī)則引擎技術(shù)分析及在電信計(jì)費(fèi)系統(tǒng)中的應(yīng)用[J];郵電設(shè)計(jì)技術(shù);2011年07期
7 李丹實(shí);;使用SQL Server2005構(gòu)建數(shù)據(jù)挖掘應(yīng)用程序[J];煤炭技術(shù);2011年07期
8 郭海鋒;;計(jì)算思維及開(kāi)源WEKA在人工智能教學(xué)中的應(yīng)用[J];長(zhǎng)春師范學(xué)院學(xué)報(bào);2011年06期
9 鄂旭;邵良杉;張毅智;楊芳;李晗;楊佳欣;;一種基于粗糙集理論的規(guī)則提取方法[J];計(jì)算機(jī)科學(xué);2011年01期
10 潘超;古輝;;本體推理機(jī)及應(yīng)用[J];計(jì)算機(jī)系統(tǒng)應(yīng)用;2010年09期
相關(guān)碩士學(xué)位論文 前7條
1 尚爾路;規(guī)則自動(dòng)生成技術(shù)研究及其在醫(yī)保審核中的應(yīng)用[D];電子科技大學(xué);2017年
2 彭超;面向稅務(wù)稽查系統(tǒng)的規(guī)則引擎研究與設(shè)計(jì)[D];上海交通大學(xué);2015年
3 張?chǎng)?一種Rete算法的改進(jìn)方法[D];哈爾濱工程大學(xué);2014年
4 顧小東;基于RETE算法的大規(guī)模規(guī)則推理引擎研究與應(yīng)用[D];南京大學(xué);2013年
5 李華;智能化通信網(wǎng)絡(luò)綜合管理技術(shù)[D];電子科技大學(xué);2011年
6 童毅;規(guī)則引擎中模式匹配算法及規(guī)則引擎應(yīng)用的研究[D];北京郵電大學(xué);2010年
7 劉巖;FSRL模糊推理機(jī)的設(shè)計(jì)與實(shí)現(xiàn)[D];天津大學(xué);2009年
本文編號(hào):2723412
本文鏈接:http://sikaile.net/yixuelunwen/yiyuanguanlilunwen/2723412.html