基于多源數(shù)據(jù)關(guān)聯(lián)分析的關(guān)鍵技術(shù)應(yīng)用研究
發(fā)布時(shí)間:2021-06-26 08:21
關(guān)聯(lián)分析作為一門發(fā)現(xiàn)大量數(shù)據(jù)之間有趣的關(guān)聯(lián)關(guān)系的重要技術(shù)。目前已經(jīng)被應(yīng)用到商業(yè)、電信、金融、農(nóng)業(yè)、醫(yī)療等領(lǐng)域,并取得了良好的效果。而當(dāng)前機(jī)動(dòng)車數(shù)量的增加已經(jīng)導(dǎo)致各類交通事故的頻繁發(fā)生,針對(duì)已發(fā)生事故的關(guān)聯(lián)分析并根據(jù)關(guān)聯(lián)規(guī)則進(jìn)行事故預(yù)測(cè)可以為相關(guān)部門提供信息來(lái)更大程度的避免交通事故的發(fā)生。本文工作的目的是研究一種效率更高的關(guān)聯(lián)規(guī)則挖掘算法,建立一個(gè)在不平衡數(shù)據(jù)集下也能保證其準(zhǔn)確率的關(guān)聯(lián)分析預(yù)測(cè)模型,并將模型應(yīng)用于交通事故預(yù)測(cè)中。論文的主要工作內(nèi)容包括如下幾點(diǎn):(1)提出一種改進(jìn)的關(guān)聯(lián)分類規(guī)則挖掘算法。本文提出了一種改進(jìn)的等價(jià)類規(guī)則樹(shù)結(jié)構(gòu)來(lái)進(jìn)行關(guān)聯(lián)規(guī)則挖掘,基于等價(jià)類規(guī)則樹(shù)利用先驗(yàn)思想和diffset策略實(shí)現(xiàn)對(duì)規(guī)則的深度剪枝,從而縮短算法的運(yùn)行時(shí)間。(2)提出了一種基于多源數(shù)據(jù)的關(guān)聯(lián)分析預(yù)測(cè)模型。本文采用多種度量與多準(zhǔn)則決策算法(ELECTRE TRI)結(jié)合的方法進(jìn)行規(guī)則篩選,提出一種改進(jìn)的Laplace度量進(jìn)行規(guī)則排序,采用數(shù)據(jù)庫(kù)覆蓋法進(jìn)行數(shù)據(jù)覆蓋,獲取強(qiáng)關(guān)聯(lián)規(guī)則,從而構(gòu)建一種能應(yīng)用于不平衡數(shù)據(jù)的關(guān)聯(lián)分析預(yù)測(cè)模型。(3)將模型應(yīng)用于實(shí)際的交通事故預(yù)測(cè)中并設(shè)計(jì)實(shí)現(xiàn)交通事故預(yù)測(cè)系統(tǒng),對(duì)預(yù)測(cè)結(jié)...
【文章來(lái)源】:電子科技大學(xué)四川省 211工程院校 985工程院校 教育部直屬院校
【文章頁(yè)數(shù)】:82 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
010年-2018年我國(guó)民用汽車保有
電子科技大學(xué)碩士學(xué)位論文4圖1-12010年-2018年我國(guó)民用汽車保有在調(diào)查中,據(jù)估計(jì)每年全世界范圍內(nèi)估計(jì)有120萬(wàn)人死亡和5000萬(wàn)人受傷。道路基礎(chǔ)設(shè)施不佳造成的因果關(guān)系和傷害的近似估計(jì)是人類面臨的巨大挑戰(zhàn)。為了解決該問(wèn)題,在計(jì)算科學(xué)中,可以針對(duì)不同場(chǎng)景采用數(shù)據(jù)挖掘模型。在任何車輛事故中,都會(huì)研究駕駛員的行為,道路基礎(chǔ)設(shè)施以及天氣情況的可能性,這些因素可能與不同的事故事件有關(guān)。研究和分析事故數(shù)據(jù)的主要問(wèn)題是混合異構(gòu)環(huán)境和數(shù)據(jù)分段,使其廣泛用于解決事故問(wèn)題。圖1-22008年-2018年我國(guó)汽車和機(jī)動(dòng)車駕駛?cè)藬?shù)趨勢(shì)圖
第一章緒論5圖1-3影響事故發(fā)生的因素?cái)?shù)據(jù)挖掘是一種用于處理大型和復(fù)雜數(shù)據(jù)集的計(jì)算技術(shù),在科學(xué)和管理的各個(gè)領(lǐng)域中應(yīng)用非常廣泛。它可以用于欺詐識(shí)別和更多科學(xué)案例以及事故嚴(yán)重性問(wèn)題中。數(shù)據(jù)挖掘技術(shù)被認(rèn)為是分析交通事故嚴(yán)重性問(wèn)題并找出其背后因素的可靠技術(shù)。道路交通事故造成的后果是很嚴(yán)重的,很多時(shí)候,在某些因素的影響下發(fā)生交通事故事件更為常見(jiàn),而關(guān)聯(lián)規(guī)則挖掘有助于確定交通事故背后的因素,為預(yù)防交通事故提供決策支持。G.Janani提出了一種K-means算法的擴(kuò)展[28]。這種擴(kuò)展的基于k均值的算法包括具有數(shù)值和分類值的分類域。k均值算法使用簡(jiǎn)單的匹配相異性度量來(lái)處理分類對(duì)象,其中擴(kuò)展的k均值算法使用模式替換聚類方法,并在聚類過(guò)程中使用基于頻率的方法更新模式以最小化聚類成本函數(shù)。Sachin等人通過(guò)使用K-模式聚類技術(shù)和關(guān)聯(lián)規(guī)則挖掘,為2009年和2014年發(fā)生的印度德拉敦道路交通事故提出了一個(gè)框架。結(jié)合使用這些技術(shù)對(duì)結(jié)果進(jìn)行分析,得出的結(jié)論是,如果不進(jìn)行細(xì)分,結(jié)果將更加有效的生成關(guān)聯(lián)規(guī)則[29]。S.Krishnaven使用一些分類模型來(lái)預(yù)測(cè)尼日利亞交通事故中的傷害,并比較了樸素貝葉斯貝葉斯分類器[30]。這項(xiàng)研究使用了基于人工神經(jīng)網(wǎng)絡(luò)的方法和決策樹(shù)方法進(jìn)行數(shù)據(jù)分析來(lái)減少高速公路上的交通事故。在論文中將數(shù)據(jù)分類為連續(xù)和分類數(shù)據(jù),其中使用人工神經(jīng)網(wǎng)絡(luò)技術(shù)分析連續(xù)數(shù)據(jù),并使用決策樹(shù)技術(shù)分析分類數(shù)據(jù)。結(jié)果表明,決策樹(shù)方法以較低的錯(cuò)誤率和較高的準(zhǔn)確率優(yōu)于人工神經(jīng)網(wǎng)絡(luò)。這項(xiàng)研究基于輪胎爆裂,失控和超速導(dǎo)致事故的三個(gè)最重要原因。該研究使用了1995年至2000年的交通事故記錄,共417670例。他們將其應(yīng)用于從美
【參考文獻(xiàn)】:
期刊論文
[1]A data mining approach to characterize road accident locations[J]. Sachin Kumar,Durga Toshniwal. Journal of Modern Transportation. 2016(01)
[2]增量關(guān)聯(lián)規(guī)則挖掘研究綜述[J]. 張步忠,江克勤,張玉州. 小型微型計(jì)算機(jī)系統(tǒng). 2016(01)
[3]基于項(xiàng)權(quán)值變化和SCCI框架的加權(quán)正負(fù)關(guān)聯(lián)規(guī)則挖掘[J]. 黃名選,黃發(fā)良,嚴(yán)小衛(wèi),蘭慧紅. 控制與決策. 2015(10)
碩士論文
[1]基于關(guān)聯(lián)規(guī)則和用戶喜好程度的綜合電子商務(wù)推薦系統(tǒng)的研究[D]. 張同啟.北京郵電大學(xué) 2015
本文編號(hào):3250991
【文章來(lái)源】:電子科技大學(xué)四川省 211工程院校 985工程院校 教育部直屬院校
【文章頁(yè)數(shù)】:82 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
010年-2018年我國(guó)民用汽車保有
電子科技大學(xué)碩士學(xué)位論文4圖1-12010年-2018年我國(guó)民用汽車保有在調(diào)查中,據(jù)估計(jì)每年全世界范圍內(nèi)估計(jì)有120萬(wàn)人死亡和5000萬(wàn)人受傷。道路基礎(chǔ)設(shè)施不佳造成的因果關(guān)系和傷害的近似估計(jì)是人類面臨的巨大挑戰(zhàn)。為了解決該問(wèn)題,在計(jì)算科學(xué)中,可以針對(duì)不同場(chǎng)景采用數(shù)據(jù)挖掘模型。在任何車輛事故中,都會(huì)研究駕駛員的行為,道路基礎(chǔ)設(shè)施以及天氣情況的可能性,這些因素可能與不同的事故事件有關(guān)。研究和分析事故數(shù)據(jù)的主要問(wèn)題是混合異構(gòu)環(huán)境和數(shù)據(jù)分段,使其廣泛用于解決事故問(wèn)題。圖1-22008年-2018年我國(guó)汽車和機(jī)動(dòng)車駕駛?cè)藬?shù)趨勢(shì)圖
第一章緒論5圖1-3影響事故發(fā)生的因素?cái)?shù)據(jù)挖掘是一種用于處理大型和復(fù)雜數(shù)據(jù)集的計(jì)算技術(shù),在科學(xué)和管理的各個(gè)領(lǐng)域中應(yīng)用非常廣泛。它可以用于欺詐識(shí)別和更多科學(xué)案例以及事故嚴(yán)重性問(wèn)題中。數(shù)據(jù)挖掘技術(shù)被認(rèn)為是分析交通事故嚴(yán)重性問(wèn)題并找出其背后因素的可靠技術(shù)。道路交通事故造成的后果是很嚴(yán)重的,很多時(shí)候,在某些因素的影響下發(fā)生交通事故事件更為常見(jiàn),而關(guān)聯(lián)規(guī)則挖掘有助于確定交通事故背后的因素,為預(yù)防交通事故提供決策支持。G.Janani提出了一種K-means算法的擴(kuò)展[28]。這種擴(kuò)展的基于k均值的算法包括具有數(shù)值和分類值的分類域。k均值算法使用簡(jiǎn)單的匹配相異性度量來(lái)處理分類對(duì)象,其中擴(kuò)展的k均值算法使用模式替換聚類方法,并在聚類過(guò)程中使用基于頻率的方法更新模式以最小化聚類成本函數(shù)。Sachin等人通過(guò)使用K-模式聚類技術(shù)和關(guān)聯(lián)規(guī)則挖掘,為2009年和2014年發(fā)生的印度德拉敦道路交通事故提出了一個(gè)框架。結(jié)合使用這些技術(shù)對(duì)結(jié)果進(jìn)行分析,得出的結(jié)論是,如果不進(jìn)行細(xì)分,結(jié)果將更加有效的生成關(guān)聯(lián)規(guī)則[29]。S.Krishnaven使用一些分類模型來(lái)預(yù)測(cè)尼日利亞交通事故中的傷害,并比較了樸素貝葉斯貝葉斯分類器[30]。這項(xiàng)研究使用了基于人工神經(jīng)網(wǎng)絡(luò)的方法和決策樹(shù)方法進(jìn)行數(shù)據(jù)分析來(lái)減少高速公路上的交通事故。在論文中將數(shù)據(jù)分類為連續(xù)和分類數(shù)據(jù),其中使用人工神經(jīng)網(wǎng)絡(luò)技術(shù)分析連續(xù)數(shù)據(jù),并使用決策樹(shù)技術(shù)分析分類數(shù)據(jù)。結(jié)果表明,決策樹(shù)方法以較低的錯(cuò)誤率和較高的準(zhǔn)確率優(yōu)于人工神經(jīng)網(wǎng)絡(luò)。這項(xiàng)研究基于輪胎爆裂,失控和超速導(dǎo)致事故的三個(gè)最重要原因。該研究使用了1995年至2000年的交通事故記錄,共417670例。他們將其應(yīng)用于從美
【參考文獻(xiàn)】:
期刊論文
[1]A data mining approach to characterize road accident locations[J]. Sachin Kumar,Durga Toshniwal. Journal of Modern Transportation. 2016(01)
[2]增量關(guān)聯(lián)規(guī)則挖掘研究綜述[J]. 張步忠,江克勤,張玉州. 小型微型計(jì)算機(jī)系統(tǒng). 2016(01)
[3]基于項(xiàng)權(quán)值變化和SCCI框架的加權(quán)正負(fù)關(guān)聯(lián)規(guī)則挖掘[J]. 黃名選,黃發(fā)良,嚴(yán)小衛(wèi),蘭慧紅. 控制與決策. 2015(10)
碩士論文
[1]基于關(guān)聯(lián)規(guī)則和用戶喜好程度的綜合電子商務(wù)推薦系統(tǒng)的研究[D]. 張同啟.北京郵電大學(xué) 2015
本文編號(hào):3250991
本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3250991.html
最近更新
教材專著