面向銀行信貸分析的關(guān)聯(lián)規(guī)則挖掘算法研究
發(fā)布時間:2021-05-18 02:39
近年來,隨著社會的發(fā)展,銀行業(yè)務(wù)呈多樣化,個人信貸業(yè)務(wù)逐漸興起,盈利空間非常大。目前,大部分銀行主要依靠工作人員根據(jù)自己的經(jīng)驗對客戶進(jìn)行評估來決定是否放貸,這其中主觀性很強(qiáng),對評估結(jié)果有一定的影響。如果能夠通過數(shù)據(jù)科學(xué)地分析出哪些人在銀行交易中信用度較高,那么就可以對這些人進(jìn)行放貸,進(jìn)而增加銀行收益。在眾多挖掘算法中,Apriori算法被人們使用的最多,近些年已被應(yīng)用于對各行各業(yè)數(shù)據(jù)的挖掘研究。在Apriori算法的運(yùn)行過程中,它是存在一些缺點(diǎn)的。其一是在數(shù)據(jù)庫掃描方面,會進(jìn)行多次掃描,這無疑會增加I/O開銷。其二,在自鏈接過程中產(chǎn)生的候選項集過多,算法運(yùn)行時間長。其三,Apriori算法是串行算法,無法滿足大數(shù)據(jù)的挖掘。本文分析了改進(jìn)的AprioriTid算法,然后分析該算法的不足,提出對項集約減和排序的改進(jìn)算法AprioriCut。該算法只掃描一次數(shù)據(jù)庫并能減少數(shù)據(jù)集,減少數(shù)據(jù)集的遍歷,還能夠減少候選項集的個數(shù),避免無用的候選項集的產(chǎn)生。本文首先介紹了選題背景與意義,然后對研究所能用到的相關(guān)理論知識進(jìn)行了詳細(xì)介紹。接著研究介紹了 Apriori算法原理。隨后,...
【文章來源】:大連海事大學(xué)遼寧省 211工程院校
【文章頁數(shù)】:62 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
Abstract
1 緒論
1.1 選題背景和意義
1.2 國內(nèi)外研究現(xiàn)狀
1.2.1 銀行信用數(shù)據(jù)分析研究現(xiàn)狀
1.2.2 數(shù)據(jù)挖掘與關(guān)聯(lián)規(guī)則挖掘研究現(xiàn)狀
1.3 論文主要內(nèi)容
1.4 論文工作安排
2 相關(guān)理論與技術(shù)分析
2.1 數(shù)據(jù)挖掘相關(guān)理論
2.1.1 數(shù)據(jù)挖掘定義
2.1.2 數(shù)據(jù)挖掘的過程
2.1.3 數(shù)據(jù)挖掘主要方法
2.2 Hadoop分布式平臺
2.2.1 Hadoop簡介
2.2.2 Hadoop優(yōu)點(diǎn)
2.3 HDFS分布式存儲系統(tǒng)
2.4 MapReduce分布式計算框架
2.4.1 MapReduce編程模型
2.4.2 MapReduce工作流程
2.5 小結(jié)
3 Apriori算法分析與改進(jìn)
3.1 Apriori算法
3.1.1 Apriori算法概述
3.1.2 Apriori算法的基本概念
3.1.3 Apriori算法的基本思想
3.1.4 Apriori算法的實(shí)現(xiàn)
3.2 Apriori改進(jìn)算法
3.2.1 Apriori算法存在的問題
3.2.2 AprioriTid算法
3.2.3 Apriori_Cut算法原理
3.2.4 Apriori_Cut算法實(shí)現(xiàn)
3.2.5 Apriori_Cut算法實(shí)例
3.3 小結(jié)
4 算法的并行化
4.1 Apriori算法運(yùn)行大數(shù)據(jù)的缺點(diǎn)
4.2 Hadoop平臺下的Apriori算法
4.3 Hadoop平臺下的AprioriTid算法
4.4 Hadoop平臺下的Apriori_Cut算法
4.5 小結(jié)
5 算法實(shí)驗分析
5.1 實(shí)驗環(huán)境搭建
5.1.1 實(shí)驗環(huán)境
5.1.2 Hadoop平臺搭建
5.2 不同數(shù)據(jù)規(guī)模下的算法實(shí)驗
5.3 不同支持度下的算法實(shí)驗
5.4 小結(jié)
6 并行化Apriori_Cut算法在銀行信貸分析中的應(yīng)用
6.1 研究過程模型
6.2 數(shù)據(jù)預(yù)處理
6.2.1 數(shù)據(jù)的來源
6.2.2 數(shù)據(jù)預(yù)處理
6.3 數(shù)據(jù)挖掘與結(jié)果分析
6.4 小結(jié)
結(jié)論
參考文獻(xiàn)
致謝
作者簡歷及攻讀碩士學(xué)位期間的科研成果
【參考文獻(xiàn)】:
期刊論文
[1]Trajectory Big Data Processing Based on Frequent Activity[J]. Amina Belhassena,Hongzhi Wang. Tsinghua Science and Technology. 2019(03)
[2]Foundation Study on Wireless Big Data: Concept, Mining, Learning and Practices[J]. Jinkang Zhu,Chen Gong,Sihai Zhang,Ming Zhao,Wuyang Zhou. 中國通信. 2018(12)
[3]大數(shù)據(jù)時代下數(shù)據(jù)挖掘技術(shù)的應(yīng)用[J]. 劉銘,呂丹,安永燦. 科技導(dǎo)報. 2018(09)
[4]基于大數(shù)據(jù)的關(guān)聯(lián)規(guī)則Apriori算法的研究與改進(jìn)[J]. 王倬,李丹. 圖書情報工作. 2016(S2)
[5]一種改進(jìn)的挖掘關(guān)聯(lián)規(guī)則Apriori算法[J]. 王志春. 電腦知識與技術(shù). 2015(34)
[6]關(guān)聯(lián)規(guī)則挖掘中Apriori算法的研究與改進(jìn)[J]. 崔貫勛,李梁,王柯柯,茍光磊,鄒航. 計算機(jī)應(yīng)用. 2010(11)
[7]分布式數(shù)據(jù)挖掘在銀行信用風(fēng)險評估中的應(yīng)用[J]. 張毅. 科學(xué)時代. 2009(01)
[8]對關(guān)聯(lián)規(guī)則挖掘Apriori算法的進(jìn)一步改進(jìn)[J]. 朱祥玉,侯德文,陳希. 信息技術(shù)與信息化. 2005(06)
[9]挖掘基于醫(yī)療圖像的關(guān)聯(lián)規(guī)則診斷乳腺癌[J]. 蔣良孝,蔡之華. 計算機(jī)工程與應(yīng)用. 2003(20)
碩士論文
[1]基于粗糙集理論的商業(yè)銀行信用風(fēng)險評估研究[D]. 錢佳麗.南京郵電大學(xué) 2018
[2]Apriori改進(jìn)算法在教學(xué)評價中的應(yīng)用[D]. 鄭麗生.華僑大學(xué) 2015
[3]云計算環(huán)境下基于Apriori算法的氣象數(shù)據(jù)關(guān)聯(lián)規(guī)則分析研究[D]. 黃鈞晟.南京信息工程大學(xué) 2015
[4]數(shù)據(jù)挖掘在銀行信用風(fēng)險管理中的應(yīng)用及實(shí)證研究[D]. 崔毅.電子科技大學(xué) 2010
[5]基于數(shù)據(jù)挖掘的銀行信用評分系統(tǒng)研究[D]. 陳靚.遼寧師范大學(xué) 2006
本文編號:3192950
【文章來源】:大連海事大學(xué)遼寧省 211工程院校
【文章頁數(shù)】:62 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
Abstract
1 緒論
1.1 選題背景和意義
1.2 國內(nèi)外研究現(xiàn)狀
1.2.1 銀行信用數(shù)據(jù)分析研究現(xiàn)狀
1.2.2 數(shù)據(jù)挖掘與關(guān)聯(lián)規(guī)則挖掘研究現(xiàn)狀
1.3 論文主要內(nèi)容
1.4 論文工作安排
2 相關(guān)理論與技術(shù)分析
2.1 數(shù)據(jù)挖掘相關(guān)理論
2.1.1 數(shù)據(jù)挖掘定義
2.1.2 數(shù)據(jù)挖掘的過程
2.1.3 數(shù)據(jù)挖掘主要方法
2.2 Hadoop分布式平臺
2.2.1 Hadoop簡介
2.2.2 Hadoop優(yōu)點(diǎn)
2.3 HDFS分布式存儲系統(tǒng)
2.4 MapReduce分布式計算框架
2.4.1 MapReduce編程模型
2.4.2 MapReduce工作流程
2.5 小結(jié)
3 Apriori算法分析與改進(jìn)
3.1 Apriori算法
3.1.1 Apriori算法概述
3.1.2 Apriori算法的基本概念
3.1.3 Apriori算法的基本思想
3.1.4 Apriori算法的實(shí)現(xiàn)
3.2 Apriori改進(jìn)算法
3.2.1 Apriori算法存在的問題
3.2.2 AprioriTid算法
3.2.3 Apriori_Cut算法原理
3.2.4 Apriori_Cut算法實(shí)現(xiàn)
3.2.5 Apriori_Cut算法實(shí)例
3.3 小結(jié)
4 算法的并行化
4.1 Apriori算法運(yùn)行大數(shù)據(jù)的缺點(diǎn)
4.2 Hadoop平臺下的Apriori算法
4.3 Hadoop平臺下的AprioriTid算法
4.4 Hadoop平臺下的Apriori_Cut算法
4.5 小結(jié)
5 算法實(shí)驗分析
5.1 實(shí)驗環(huán)境搭建
5.1.1 實(shí)驗環(huán)境
5.1.2 Hadoop平臺搭建
5.2 不同數(shù)據(jù)規(guī)模下的算法實(shí)驗
5.3 不同支持度下的算法實(shí)驗
5.4 小結(jié)
6 并行化Apriori_Cut算法在銀行信貸分析中的應(yīng)用
6.1 研究過程模型
6.2 數(shù)據(jù)預(yù)處理
6.2.1 數(shù)據(jù)的來源
6.2.2 數(shù)據(jù)預(yù)處理
6.3 數(shù)據(jù)挖掘與結(jié)果分析
6.4 小結(jié)
結(jié)論
參考文獻(xiàn)
致謝
作者簡歷及攻讀碩士學(xué)位期間的科研成果
【參考文獻(xiàn)】:
期刊論文
[1]Trajectory Big Data Processing Based on Frequent Activity[J]. Amina Belhassena,Hongzhi Wang. Tsinghua Science and Technology. 2019(03)
[2]Foundation Study on Wireless Big Data: Concept, Mining, Learning and Practices[J]. Jinkang Zhu,Chen Gong,Sihai Zhang,Ming Zhao,Wuyang Zhou. 中國通信. 2018(12)
[3]大數(shù)據(jù)時代下數(shù)據(jù)挖掘技術(shù)的應(yīng)用[J]. 劉銘,呂丹,安永燦. 科技導(dǎo)報. 2018(09)
[4]基于大數(shù)據(jù)的關(guān)聯(lián)規(guī)則Apriori算法的研究與改進(jìn)[J]. 王倬,李丹. 圖書情報工作. 2016(S2)
[5]一種改進(jìn)的挖掘關(guān)聯(lián)規(guī)則Apriori算法[J]. 王志春. 電腦知識與技術(shù). 2015(34)
[6]關(guān)聯(lián)規(guī)則挖掘中Apriori算法的研究與改進(jìn)[J]. 崔貫勛,李梁,王柯柯,茍光磊,鄒航. 計算機(jī)應(yīng)用. 2010(11)
[7]分布式數(shù)據(jù)挖掘在銀行信用風(fēng)險評估中的應(yīng)用[J]. 張毅. 科學(xué)時代. 2009(01)
[8]對關(guān)聯(lián)規(guī)則挖掘Apriori算法的進(jìn)一步改進(jìn)[J]. 朱祥玉,侯德文,陳希. 信息技術(shù)與信息化. 2005(06)
[9]挖掘基于醫(yī)療圖像的關(guān)聯(lián)規(guī)則診斷乳腺癌[J]. 蔣良孝,蔡之華. 計算機(jī)工程與應(yīng)用. 2003(20)
碩士論文
[1]基于粗糙集理論的商業(yè)銀行信用風(fēng)險評估研究[D]. 錢佳麗.南京郵電大學(xué) 2018
[2]Apriori改進(jìn)算法在教學(xué)評價中的應(yīng)用[D]. 鄭麗生.華僑大學(xué) 2015
[3]云計算環(huán)境下基于Apriori算法的氣象數(shù)據(jù)關(guān)聯(lián)規(guī)則分析研究[D]. 黃鈞晟.南京信息工程大學(xué) 2015
[4]數(shù)據(jù)挖掘在銀行信用風(fēng)險管理中的應(yīng)用及實(shí)證研究[D]. 崔毅.電子科技大學(xué) 2010
[5]基于數(shù)據(jù)挖掘的銀行信用評分系統(tǒng)研究[D]. 陳靚.遼寧師范大學(xué) 2006
本文編號:3192950
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/3192950.html
最近更新
教材專著