數(shù)據(jù)挖掘技術(shù)在醫(yī)療保險領(lǐng)域的應(yīng)用研究
第 1 章 引 言
1.1 研究背景
...............
1.2 研究目的和意義
本文研究的目的主要是通過分析和研究江西省城鎮(zhèn)居民基本醫(yī)療保險基金支付和單病種費用支出情況,發(fā)現(xiàn)可能存在的風(fēng)險,提出建議,并希望為人社大數(shù)據(jù)挖掘及應(yīng)用探索道路。因此本課題研究具有以下三個方面的意義:1)能有效推進醫(yī)療保險信息化建設(shè)。社保行業(yè)的信息化建設(shè)工作已經(jīng)開展十幾年,尤其是醫(yī)保領(lǐng)域已經(jīng)建立起了成熟的信息系統(tǒng),并積累了海量的業(yè)務(wù)數(shù)據(jù)。而目前數(shù)據(jù)倉庫、數(shù)據(jù)挖掘等技術(shù)的應(yīng)用和研究在社保領(lǐng)域并不多,在江西省也才剛剛起步,因此將數(shù)據(jù)挖掘技術(shù)應(yīng)用于醫(yī)保領(lǐng)域,加強醫(yī)保監(jiān)控及決策過程的信息化,對推動人社部門信息化建設(shè)具有非常重要的現(xiàn)實意義。
...............
第 2 章 相關(guān)技術(shù)背景概述
2.1 數(shù)據(jù)倉庫理論概述
數(shù)據(jù)倉庫(Data Warehouse,簡稱“DW”)的概念是由數(shù)據(jù)倉庫之父比爾·恩門(Bill Inmon)于 1990 年提出,他在其出版的“Building the Data Warehouse”(《建立數(shù)據(jù)倉庫》)一書中提出了數(shù)據(jù)倉庫的定義[22], 并被廣泛接受。數(shù)據(jù)倉庫是面向主題的(Subject Oriented)、集成的(Integrated)、相對穩(wěn)定的(Non-Volatile)、反映歷史變化(Time Variant)的數(shù)據(jù)集合[26],它的作用主要是用來支持管理決策,,與操作型的數(shù)據(jù)庫有所不同,它是面向分析型的數(shù)據(jù)處理技術(shù),他通過集成多個異構(gòu)的數(shù)據(jù)源,按照決策主題重組,建立新的數(shù)據(jù)模型,且存儲的數(shù)據(jù)不能修改。數(shù)據(jù)倉庫主要的功能是通過數(shù)據(jù)倉庫理論的資料儲存架構(gòu)將聯(lián)機事務(wù)處理(OLTP)累積的大量資料進行系統(tǒng)分析整理,使聯(lián)機分析處理(OLAP)、數(shù)據(jù)挖掘(Data Mining)等分析方法更加順暢進行,來支持決策支持系統(tǒng)(DSS)和主管資訊系統(tǒng)(EIS)的創(chuàng)建,讓決策者從大量資料中快速有效的分析出有價值的信息。
...............
2.2 OLAP 技術(shù)概述
OLAP (on-line analytical processing) 聯(lián)機分析處理[26],這一概念是 1993 年由 E.F.Codd 提出的。上個世紀 60 年代末 Codd 的關(guān)系型數(shù)據(jù)模型提出后,關(guān)系型的數(shù)據(jù)庫和 OLTP 技術(shù)(on-line transaction processing)快速發(fā)展,數(shù)據(jù)庫中的數(shù)據(jù)量也日漸龐大,人們對信息的需求也在不斷提高,管理人員對數(shù)據(jù)的查詢需求變得越來越復(fù)雜,OLTP 技術(shù)已不能滿足用戶的需求,因此數(shù)據(jù)倉庫和 OLAP技術(shù)的產(chǎn)生得到了越來越廣泛的應(yīng)用。OLAP 是在數(shù)據(jù)倉庫的平臺上,對特定主體的聯(lián)機數(shù)據(jù)進行的訪問及分析。通過多種可能、多種角度對信息的進行觀察,實現(xiàn)快速、穩(wěn)定、交互性地存取,并將分析和查詢結(jié)果通過直觀的方式多維度、多中數(shù)據(jù)綜合展現(xiàn),使得用戶對數(shù)據(jù)進行深入觀察和了解。簡而言之,OLAP 既共享多維信息的快速分析。它是跨部門的、面向主題的,主要具有五個特性,即快速性、可分析性、多維性、信息性和共享性等。
...............
第 3 章 醫(yī)療保險系統(tǒng)和數(shù)據(jù)挖掘的工具介紹................14
3.1 整體分析設(shè)計 .................14
3.2 工具選擇 ................15
第 4 章 醫(yī)療保險數(shù)據(jù)挖掘的工程實踐過程..................17
4.1 數(shù)據(jù)倉庫的模型設(shè)計.................17
4.2 數(shù)據(jù)倉庫的構(gòu)建 ................20
第 4 章 醫(yī)療保險數(shù)據(jù)挖掘的工程實踐過程
4.1 數(shù)據(jù)倉庫的模型設(shè)計
構(gòu)建數(shù)據(jù)倉庫之前,要對江西省醫(yī)保業(yè)務(wù)進行分析,詳細調(diào)研原始數(shù)據(jù)的內(nèi)容和類型,明確數(shù)據(jù)倉庫的研究主題及與主題有關(guān)的數(shù)據(jù)信息。通過調(diào)研分析,了解到江西省在醫(yī)保基金費用的支出上,主要關(guān)心在定點藥店的藥品出售及醫(yī)院的醫(yī)療費用方面,因此選擇了兩個主題進行數(shù)據(jù)倉庫的設(shè)計與分析。(1) 城鎮(zhèn)居民醫(yī)療保險基金支付主題:從參保信息中選擇年齡、性別、個人身份、時間、醫(yī)療機構(gòu)類別等維度,具體分析城鎮(zhèn)居民的醫(yī)療保險中基金支付的主要構(gòu)成情況,發(fā)現(xiàn)參保人員在使用醫(yī)保基金進行就醫(yī)購藥時是否有隱藏的或未知的違規(guī)行為;(2) 城鎮(zhèn)居民醫(yī)療保險單病種醫(yī)療費用支出主題:主要包括參保人員的病種發(fā)病的情況及醫(yī)療費用基金支付情況等多個方面。因此,該主題從時間、性別、年齡、病種、費用等維度,分析當(dāng)前各病種發(fā)病情況,得出單病種需要支付的大概費用及是否存在過度治療等。
...............
4.2 數(shù)據(jù)倉庫的構(gòu)建
在確定數(shù)據(jù)倉庫主題和各主題相關(guān)信息后,開始建立數(shù)據(jù)倉庫,事實表和維度表是主要的創(chuàng)建內(nèi)容。在本文中我們使用了 Oracle Warehouse Builder(OWB)軟件來進行數(shù)據(jù)倉庫的創(chuàng)建,并對各個表的構(gòu)建過程進行了系統(tǒng)的分析研究。在通過 OWB 創(chuàng)建服務(wù)器時,要以管理員身份運行 RepositoryAssistant 程序來進行 OWB 工作區(qū)的創(chuàng)建。主要工作是創(chuàng)建 OWB 用戶名和密碼,定義表的存儲空間及選擇基本的語言,用來儲存數(shù)據(jù)倉庫元數(shù)據(jù)。
...............
結(jié)論
本文以江西省社會保險系統(tǒng)中的醫(yī)療保險數(shù)據(jù)為研究對象,在了解社保相關(guān)業(yè)務(wù)及政策,尤其是醫(yī)療保險特點的基礎(chǔ)上,對數(shù)據(jù)倉庫、OLAP 和數(shù)據(jù)挖掘等相關(guān)技術(shù)進行了分析和學(xué)習(xí),選擇了社保業(yè)務(wù)部門比較關(guān)心的城鎮(zhèn)居民醫(yī)療保險基金支付和單病種醫(yī)療費用支出這兩個主題,進行數(shù)據(jù)倉庫設(shè)計及OLAP 、數(shù)據(jù)挖掘的研究。通過本文的研究挖掘出某些人群基金支付的的大概費用、幾個單病種合理醫(yī)療費用的范圍,這為社;鸨O(jiān)管部門、醫(yī)保業(yè)務(wù)管理部門提供了一定幫助,為下一步合理使用基金制定政策提供了可靠依據(jù)。本文的主要研究內(nèi)容包括以下幾方面:(1)對數(shù)據(jù)倉庫、OLAP 技術(shù)、數(shù)據(jù)挖掘等核心技術(shù)進行了研究,基于江西省醫(yī)保數(shù)據(jù),完成了城鎮(zhèn)居民醫(yī)療保險基金支付和城鎮(zhèn)居民單病種醫(yī)療費用支出兩大主題數(shù)據(jù)倉庫的模型設(shè)計和構(gòu)建。
參考文獻(略)
本文編號:583199
本文鏈接:http://sikaile.net/wenshubaike/kjzx/583199.html