審計(jì)監(jiān)測(cè)指標(biāo)發(fā)現(xiàn)與提取技術(shù)研究與應(yīng)用
本文關(guān)鍵詞:審計(jì)監(jiān)測(cè)指標(biāo)發(fā)現(xiàn)與提取技術(shù)研究與應(yīng)用
更多相關(guān)文章: 社會(huì)保障審計(jì) 監(jiān)測(cè)指標(biāo) 聚類(lèi) 關(guān)聯(lián)規(guī)則 最小規(guī)則覆蓋集
【摘要】:數(shù)據(jù)挖掘是機(jī)器學(xué)習(xí)領(lǐng)域重要的技術(shù)之一,也是知識(shí)發(fā)現(xiàn)的一個(gè)重要過(guò)程。其目的就是從大量的、不完全的、有噪聲的、模糊的、隨機(jī)的數(shù)據(jù)中提取或挖掘隱含在其中的、人們事先不知道的、但又是潛在有用的信息和知識(shí)。現(xiàn)有計(jì)算機(jī)審計(jì)方法零散,均是人工手動(dòng)處理和分類(lèi),且社保審計(jì)監(jiān)測(cè)指標(biāo)的發(fā)現(xiàn)和提取工作也是人工手動(dòng)進(jìn)行,使得審計(jì)經(jīng)驗(yàn)的共享程度比較低,為審計(jì)工作者帶來(lái)了諸多不便。 本文在總結(jié)數(shù)據(jù)挖掘技術(shù)的國(guó)內(nèi)外研究現(xiàn)狀和研究成果的基礎(chǔ)上,介紹了數(shù)據(jù)挖掘相關(guān)技術(shù)和理論知識(shí),特別是關(guān)聯(lián)規(guī)則分析技術(shù)和聚類(lèi)分析技術(shù);針對(duì)現(xiàn)有社保審計(jì)詞庫(kù)的不足,使用新詞的識(shí)別算法,給出了社保審計(jì)詞庫(kù)的動(dòng)態(tài)更新過(guò)程;并在此基礎(chǔ)之上,以社會(huì)保險(xiǎn)審計(jì)方法集為實(shí)驗(yàn)數(shù)據(jù)集,針對(duì)聚類(lèi)算法中經(jīng)典k-均值算法的兩大缺陷,首次給出了關(guān)聯(lián)規(guī)則分析技術(shù)中最小規(guī)則覆蓋集的概念,,并提出了基于最小規(guī)則覆蓋集的K-均值改進(jìn)算法,有效地改善了聚類(lèi)效果,并成功應(yīng)用于審計(jì)監(jiān)測(cè)指標(biāo)發(fā)現(xiàn)和提取過(guò)程中,從而進(jìn)一步研究社保審計(jì)監(jiān)測(cè)指標(biāo)的發(fā)現(xiàn)和提取方法;審計(jì)監(jiān)測(cè)指標(biāo)發(fā)現(xiàn)和提取系統(tǒng)也應(yīng)運(yùn)而生,為后期的審計(jì)工作奠定了良好的基礎(chǔ)。
【關(guān)鍵詞】:社會(huì)保障審計(jì) 監(jiān)測(cè)指標(biāo) 聚類(lèi) 關(guān)聯(lián)規(guī)則 最小規(guī)則覆蓋集
【學(xué)位授予單位】:哈爾濱工程大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2012
【分類(lèi)號(hào)】:F239.1;TP311.13
【目錄】:
- 摘要5-6
- Abstract6-9
- 第1章 緒論9-14
- 1.1 研究背景及意義9-10
- 1.1.1 研究背景9
- 1.1.2 研究意義9-10
- 1.2 國(guó)內(nèi)外研究現(xiàn)狀10-12
- 1.2.1 基于聚類(lèi)的關(guān)聯(lián)規(guī)則分析技術(shù)10
- 1.2.2 基于關(guān)聯(lián)規(guī)則的聚類(lèi)分析技術(shù)10-11
- 1.2.3 文本聚類(lèi)分析技術(shù)11
- 1.2.4 關(guān)聯(lián)規(guī)則分析技術(shù)11-12
- 1.3 論文組織結(jié)構(gòu)12-14
- 1.3.1 論文主要研究?jī)?nèi)容12-13
- 1.3.2 論文內(nèi)容安排13-14
- 第2章 數(shù)據(jù)挖掘相關(guān)理論14-19
- 2.1 數(shù)據(jù)挖掘技術(shù)14-16
- 2.2 關(guān)聯(lián)規(guī)則分析技術(shù)16
- 2.3 聚類(lèi)分析技術(shù)16-18
- 2.3.1 聚類(lèi)分析技術(shù)16-17
- 2.3.2 聚類(lèi)效果評(píng)估指數(shù)17-18
- 2.4 本章小結(jié)18-19
- 第3章 社保審計(jì)領(lǐng)域詞庫(kù)的動(dòng)態(tài)更新19-25
- 3.1 社保審計(jì)領(lǐng)域詞庫(kù)構(gòu)建19-20
- 3.2 社保審計(jì)領(lǐng)域詞庫(kù)動(dòng)態(tài)更新過(guò)程20-22
- 3.3 社保領(lǐng)域新詞識(shí)別算法22-24
- 3.4 本章小結(jié)24-25
- 第4章 審計(jì)監(jiān)測(cè)指標(biāo)的發(fā)現(xiàn)和提取25-47
- 4.1 k-均值算法及其局限性25-27
- 4.1.1 k-均值算法作為基礎(chǔ)算法的原因25-26
- 4.1.2 k-均值算法的局限性26-27
- 4.2 基于最小規(guī)則覆蓋集的 k-均值算法改進(jìn)27-34
- 4.2.1 基于最小規(guī)則覆蓋集的 k-均值改進(jìn)算法28-31
- 4.2.2 改進(jìn)算法舉例31-34
- 4.3 審計(jì)監(jiān)測(cè)指標(biāo)發(fā)現(xiàn)和提取過(guò)程及實(shí)驗(yàn)分析34-46
- 4.3.1 實(shí)驗(yàn)數(shù)據(jù)集35-36
- 4.3.2 審計(jì)方法文本分詞36-37
- 4.3.3 審計(jì)方法空間向量表示37-39
- 4.3.4 審計(jì)方法相似度函數(shù)定義39-40
- 4.3.5 關(guān)聯(lián)規(guī)則分析40-43
- 4.3.6 聚類(lèi)分析43-45
- 4.3.7 審計(jì)監(jiān)測(cè)指標(biāo)的發(fā)現(xiàn)與提取45-46
- 4.4 本章小結(jié)46-47
- 第5章 系統(tǒng)設(shè)計(jì)47-56
- 5.1 概要設(shè)計(jì)47-49
- 5.2 詳細(xì)設(shè)計(jì)49-51
- 5.3 系統(tǒng)工作流程及模塊功能設(shè)計(jì)51-55
- 5.3.1 審計(jì)方法導(dǎo)入模塊52-53
- 5.3.2 審計(jì)方法分詞模塊53
- 5.3.3 詞頻統(tǒng)計(jì)模塊53-54
- 5.3.4 審計(jì)方法聚類(lèi)分析模塊54-55
- 5.3.5 審計(jì)監(jiān)測(cè)指標(biāo)發(fā)現(xiàn)和提取模塊55
- 5.4 本章小結(jié)55-56
- 結(jié)論56-57
- 參考文獻(xiàn)57-61
- 攻讀碩士學(xué)位期間發(fā)表的論文和取得的科研成果61-63
- 致謝63
【參考文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前10條
1 馬莉;杜鵑;;一種生成最小關(guān)聯(lián)規(guī)則集的算法[J];電腦知識(shí)與技術(shù);2011年03期
2 蔡勇智;;未登錄詞識(shí)別算法的改進(jìn)[J];福建電腦;2006年03期
3 王慧;鄭濤;張建嶺;;基于聚類(lèi)的關(guān)聯(lián)規(guī)則算法在刑事犯罪行為分析中的應(yīng)用[J];中國(guó)人民公安大學(xué)學(xué)報(bào)(自然科學(xué)版);2010年03期
4 阮備軍,朱揚(yáng)勇;基于商品分類(lèi)信息的關(guān)聯(lián)規(guī)則聚類(lèi)[J];計(jì)算機(jī)研究與發(fā)展;2004年02期
5 宋威;楊炳儒;徐章艷;高靜;;一種改進(jìn)的頻繁閉項(xiàng)集挖掘算法[J];計(jì)算機(jī)研究與發(fā)展;2008年02期
6 梁成軍;虞麗娟;王繼紅;;網(wǎng)球技戰(zhàn)術(shù)關(guān)聯(lián)分析數(shù)據(jù)挖掘研究[J];計(jì)算機(jī)工程與應(yīng)用;2012年07期
7 龍昊;馮劍琳;李曲;;R-means:以關(guān)聯(lián)規(guī)則為簇中心的文本聚類(lèi)[J];計(jì)算機(jī)科學(xué);2005年09期
8 馬光志,崔榮曉;基于覆蓋運(yùn)算挖掘最小規(guī)則集[J];計(jì)算機(jī)工程與科學(xué);2005年06期
9 曲守寧;王欽;鄒燕;朱強(qiáng);;基于關(guān)聯(lián)規(guī)則的文本聚類(lèi)算法的研究[J];計(jì)算機(jī)應(yīng)用研究;2008年04期
10 王清毅,蔡智,鄒翔,蔡慶生;部分?jǐn)?shù)據(jù)缺失環(huán)境下的知識(shí)發(fā)現(xiàn)方法[J];軟件學(xué)報(bào);2001年10期
本文編號(hào):1047972
本文鏈接:http://sikaile.net/guanlilunwen/shenjigli/1047972.html