海量非結(jié)構(gòu)化物聯(lián)網(wǎng)數(shù)據(jù)深度挖掘算法研究
發(fā)布時間:2021-04-12 23:10
由于物聯(lián)網(wǎng)數(shù)據(jù)量的激增,傳統(tǒng)的數(shù)據(jù)挖掘算法對數(shù)據(jù)挖掘效果差,為了提高數(shù)據(jù)挖掘處理效果,提出對海量非結(jié)構(gòu)化物聯(lián)網(wǎng)數(shù)據(jù)深度挖掘算法研究。依靠CR運算進行模糊系統(tǒng)的構(gòu)建,以T-S神經(jīng)網(wǎng)絡(luò)樣本搭建神經(jīng)網(wǎng)絡(luò)描述,對物聯(lián)網(wǎng)數(shù)據(jù)進行輸入和輸出后,依靠模糊系統(tǒng)邏輯構(gòu)建物聯(lián)網(wǎng)數(shù)據(jù)的粗糙集,對粗糙集進行屬性約減。實驗結(jié)果表明,通過采用本文算法進行數(shù)據(jù)挖掘后,生成的物聯(lián)網(wǎng)數(shù)據(jù)XML文檔簇密度值更大,證明本文算法進行數(shù)據(jù)挖掘時數(shù)據(jù)之間的界線更清晰,挖掘效果更好。
【文章來源】:電子設(shè)計工程. 2020,28(16)
【文章頁數(shù)】:5 頁
【部分圖文】:
深度挖掘算法開發(fā)流程
目前數(shù)據(jù)挖掘需要分析物聯(lián)網(wǎng)數(shù)據(jù)類型,由于粗糙集對物聯(lián)網(wǎng)數(shù)據(jù)信息進行知識獲取時可以對信息進行分辨,因此數(shù)據(jù)理論的離散化需要獲取數(shù)據(jù)的引入信息,從而獲取信息階段性結(jié)果[16]。利用當前物聯(lián)網(wǎng)數(shù)據(jù)特征構(gòu)建數(shù)據(jù)集合也就是最小特征子集。數(shù)據(jù)約減過程如圖2所示。在粗糙集理論中,數(shù)據(jù)屬性的度量一般需要物聯(lián)網(wǎng)標志化數(shù)據(jù)信息。在進行完整的知識表達屬性刪除和增減后,如果當前數(shù)據(jù)屬性的分類結(jié)果變化較大,說明該屬性有重要的表達特征。此外可根據(jù)屬性的表達確定當前屬性的鞠策度。設(shè)當前決策信息表達式為:S={U,C?D,V,F},對于任意的特征屬性集來說,可從當前屬性R中提取屬性自己P。二者的屬性差距越大說明物聯(lián)網(wǎng)數(shù)據(jù)的分類影響力越大。當P為單屬性時,可以定義其屬性。
通過測試生成數(shù)據(jù)集IBM,針對當前測試數(shù)據(jù)集XML文檔生成非時序性XML文檔,隨機模擬操作后進行數(shù)據(jù)挖掘。選擇數(shù)據(jù)項簇密度為實驗指標,進行對比實驗。簇密度代表當前挖掘數(shù)據(jù)之間的平均密度值,這個值越大說明挖掘數(shù)據(jù)之間的簇關(guān)系越清晰。對比結(jié)果如圖3所示。實驗選擇了6組數(shù)據(jù)進行對比,經(jīng)過數(shù)據(jù)整理后可以看出,此次設(shè)計的挖掘算法其密度值均大于其他挖掘算法。證明本文算法數(shù)據(jù)挖掘的聚類和準確度更高,處理效果更有效。
本文編號:3134144
【文章來源】:電子設(shè)計工程. 2020,28(16)
【文章頁數(shù)】:5 頁
【部分圖文】:
深度挖掘算法開發(fā)流程
目前數(shù)據(jù)挖掘需要分析物聯(lián)網(wǎng)數(shù)據(jù)類型,由于粗糙集對物聯(lián)網(wǎng)數(shù)據(jù)信息進行知識獲取時可以對信息進行分辨,因此數(shù)據(jù)理論的離散化需要獲取數(shù)據(jù)的引入信息,從而獲取信息階段性結(jié)果[16]。利用當前物聯(lián)網(wǎng)數(shù)據(jù)特征構(gòu)建數(shù)據(jù)集合也就是最小特征子集。數(shù)據(jù)約減過程如圖2所示。在粗糙集理論中,數(shù)據(jù)屬性的度量一般需要物聯(lián)網(wǎng)標志化數(shù)據(jù)信息。在進行完整的知識表達屬性刪除和增減后,如果當前數(shù)據(jù)屬性的分類結(jié)果變化較大,說明該屬性有重要的表達特征。此外可根據(jù)屬性的表達確定當前屬性的鞠策度。設(shè)當前決策信息表達式為:S={U,C?D,V,F},對于任意的特征屬性集來說,可從當前屬性R中提取屬性自己P。二者的屬性差距越大說明物聯(lián)網(wǎng)數(shù)據(jù)的分類影響力越大。當P為單屬性時,可以定義其屬性。
通過測試生成數(shù)據(jù)集IBM,針對當前測試數(shù)據(jù)集XML文檔生成非時序性XML文檔,隨機模擬操作后進行數(shù)據(jù)挖掘。選擇數(shù)據(jù)項簇密度為實驗指標,進行對比實驗。簇密度代表當前挖掘數(shù)據(jù)之間的平均密度值,這個值越大說明挖掘數(shù)據(jù)之間的簇關(guān)系越清晰。對比結(jié)果如圖3所示。實驗選擇了6組數(shù)據(jù)進行對比,經(jīng)過數(shù)據(jù)整理后可以看出,此次設(shè)計的挖掘算法其密度值均大于其他挖掘算法。證明本文算法數(shù)據(jù)挖掘的聚類和準確度更高,處理效果更有效。
本文編號:3134144
本文鏈接:http://sikaile.net/kejilunwen/wltx/3134144.html
最近更新
教材專著