天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 管理論文 > 項目管理論文 >

基于深度神經(jīng)網(wǎng)絡(luò)的數(shù)據(jù)挖掘算法及其應(yīng)用研究

發(fā)布時間:2021-11-19 13:01
  在當(dāng)今的大數(shù)據(jù)和人工智能時代,數(shù)據(jù)、算法和算力尤為重要。從海量數(shù)據(jù)中設(shè)計算法挖掘出“數(shù)據(jù)關(guān)聯(lián)”后的知識,可視化其價值,這是數(shù)據(jù)挖掘研究的核心。在數(shù)據(jù)挖掘算法中,神經(jīng)網(wǎng)絡(luò)在分析處理文本、圖像、音頻等數(shù)字信息中,是一種行之有效的數(shù)據(jù)分析、處理方法;诖,本論文主要研究基于深度神經(jīng)網(wǎng)絡(luò)的數(shù)據(jù)挖掘算法以及數(shù)據(jù)挖掘算法在特定領(lǐng)域下的工程應(yīng)用。主要工作概括如下:(1)神經(jīng)網(wǎng)絡(luò)的可解釋性研究論文重點關(guān)注神經(jīng)網(wǎng)絡(luò)理論中的可解釋性,主要分析了可解釋性的主流研究方法和模型;谖谋痉诸惾蝿(wù),以fastText模型為基礎(chǔ),設(shè)計了具有結(jié)構(gòu)可解釋性質(zhì)的拓展網(wǎng)絡(luò)NNF。通過對比fastText和NNF在相同任務(wù)上的表現(xiàn),發(fā)現(xiàn)NNF在各方面表現(xiàn)良好,具有一定的應(yīng)用價值。(2)基于深度神經(jīng)網(wǎng)絡(luò)的數(shù)據(jù)挖掘算法研究論文主要研究了TextCNN文本分類算法、FP-Growth關(guān)聯(lián)規(guī)則算法和LDA聚類算法。論文從TextCNN模型結(jié)構(gòu)的角度分析,得出了其處理分類任務(wù)時的特點。并通過在特定數(shù)據(jù)集上訓(xùn)練并測試TextCNN,有效證明了TextCNN的應(yīng)用效果。同時,通過在相同數(shù)據(jù)集下對比分析fastText、NNF和TextC... 

【文章來源】:電子科技大學(xué)四川省 211工程院校 985工程院校 教育部直屬院校

【文章頁數(shù)】:93 頁

【學(xué)位級別】:碩士

【部分圖文】:

基于深度神經(jīng)網(wǎng)絡(luò)的數(shù)據(jù)挖掘算法及其應(yīng)用研究


(d),本文著重基于神經(jīng)網(wǎng)絡(luò)的數(shù)據(jù)挖掘算法,以文本分類任務(wù)為目標,研究一種以fastText[4]模型為基礎(chǔ)的新型神經(jīng)網(wǎng)絡(luò)NNF及其可解釋性

激活函數(shù),圖像,線性模型,神經(jīng)網(wǎng)絡(luò)


電子科技大學(xué)碩士學(xué)位論文82.1.2深度神經(jīng)網(wǎng)絡(luò)的特點誠然,與日俱增的數(shù)據(jù)量、模型規(guī)模以及輸出結(jié)果精度成就了深度神經(jīng)網(wǎng)絡(luò)的成功應(yīng)用和大規(guī)模普及。深度神經(jīng)網(wǎng)絡(luò)特點可主要歸結(jié)如下:非線性變換。諸如矩陣分解、分解機、稀疏線性模型之類的常規(guī)方法本質(zhì)上是線性模型,而作為這些傳統(tǒng)模型基礎(chǔ)的線性假設(shè)往往過于簡單,并極大地限制其建模的表達性。與線性模型相反,深度神經(jīng)網(wǎng)絡(luò)能夠利用諸如sigmoid、tanh和relu等激活函數(shù)對數(shù)據(jù)進行非線性建模,如圖2-2所示。圖2-2三種典型的激活函數(shù)圖像示意(a)Sigmoid函數(shù):k-e11;(b)tanh函數(shù):kke1e122;(c)ReLU函數(shù):)0()0(0kkk(c)(a)(b)

網(wǎng)絡(luò)結(jié)構(gòu)圖,網(wǎng)絡(luò)結(jié)構(gòu),子網(wǎng)絡(luò),模型


第三章神經(jīng)網(wǎng)絡(luò)及其可解釋性25子網(wǎng)絡(luò)對應(yīng)負責(zé)一個特定的子任務(wù),該模型在功能和結(jié)構(gòu)上都是可區(qū)分的;(3)與隨機森林不同,該模型具有更強的可擴展性,且基于fastText模型的特點,該模型可快速解決文本數(shù)據(jù)的分類問題;(4)一旦模型完成了訓(xùn)練,一個可解釋的機制就已經(jīng)存在了,因為各類別信息在各子網(wǎng)絡(luò)中,均被很好地分開了。應(yīng)該注意到,之前發(fā)布的一些類似的模型有不同的訓(xùn)練方式。例如,這些模型將首先對數(shù)據(jù)進行多個循環(huán)的洗牌和子采樣,然后基于這些子數(shù)據(jù)集建立每個神經(jīng)網(wǎng)絡(luò),這對可解釋模型來說是一個災(zāi)難。由于訓(xùn)練數(shù)據(jù)混亂,無法區(qū)分它在每個網(wǎng)絡(luò)中學(xué)到了什么。此外,投票機制使得預(yù)測過程更加混亂,甚至可能因為隨機子樣本而導(dǎo)致非常冗長的結(jié)果。3.2.4實驗結(jié)果及分析實驗選取了THUCNews的一個子集進行訓(xùn)練和測試。使用了其中的八個類別,每個分類下有6500條短文本數(shù)據(jù)。劃分訓(xùn)練集為5000*8,驗證集為500*8,測試集為1000*8。如圖3-4(a)和3-4(c)所示,在相同的數(shù)據(jù)集下,NNF比fastText有更高的隱含層輸入層輸出層子網(wǎng)絡(luò)1......隱含層輸入層輸出層子網(wǎng)絡(luò)2隱含層輸入層輸出層子網(wǎng)絡(luò)N圖3-3NNF網(wǎng)絡(luò)結(jié)構(gòu)

【參考文獻】:
期刊論文
[1]A Survey about Algorithms Utilized by Focused Web Crawler[J]. Yong-Bin Yu,Shi-Lei Huang,Nyima Tashi,Huan Zhang,Fei Lei,Lin-Yang Wu.  Journal of Electronic Science and Technology. 2018(02)
[2]數(shù)據(jù)挖掘中分類算法綜述[J]. 李玲俐.  重慶師范大學(xué)學(xué)報(自然科學(xué)版). 2011(04)



本文編號:3505095

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/guanlilunwen/xiangmuguanli/3505095.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶35e98***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com