營(yíng)銷數(shù)據(jù)清洗及治理方法的研究及應(yīng)用
發(fā)布時(shí)間:2021-09-17 03:29
數(shù)據(jù)清洗是數(shù)據(jù)分析的基礎(chǔ),高質(zhì)量的數(shù)據(jù)才能分析出更有價(jià)值的信息。電力營(yíng)銷業(yè)務(wù)數(shù)據(jù)中的免費(fèi)用電數(shù)據(jù),存在非常多的歸類標(biāo)簽,如是否有效、有效日期、時(shí)間、重復(fù)次數(shù)、關(guān)聯(lián)用戶數(shù)、重復(fù)類型、年度拆分等,需要采用多種數(shù)據(jù)處理方法,對(duì)數(shù)據(jù)中的不一致性、缺失值、重復(fù)數(shù)據(jù)進(jìn)行處理,基于已有字段提取新的信息,得到高質(zhì)量的數(shù)據(jù),才能更精準(zhǔn)地支撐建模分析工作。本文就免費(fèi)電數(shù)據(jù)進(jìn)行清洗的流程、技術(shù),以及建模分析應(yīng)用展開(kāi)論述。
【文章來(lái)源】:信息技術(shù)與信息化. 2020,(07)
【文章頁(yè)數(shù)】:4 頁(yè)
【文章目錄】:
0 引言
1 存在的問(wèn)題
1.1 重復(fù)錄入
1.2 有效時(shí)間重疊
1.3 跨年折算
2 數(shù)據(jù)概況
3 關(guān)鍵技術(shù)
3.1 一致性檢查
3.2 缺失值處理
3.3 異常數(shù)據(jù)
3.4 重復(fù)數(shù)據(jù)
3.5 標(biāo)準(zhǔn)化、正則化
3.6 離散化
4 營(yíng)銷數(shù)據(jù)清洗
4.1 免費(fèi)電用戶數(shù)據(jù)清洗
4.2 免費(fèi)電量年度信息
4.2.1 將免費(fèi)電量信息按年度拆分
4.2.2 按用戶和年份匯總免費(fèi)電量信息
4.3 核算免費(fèi)電信息清洗
5 治理方法
5.1 錄入信息是否規(guī)范
5.1.1 免費(fèi)電量用戶存在多條有效免費(fèi)電量記錄
5.1.2 免費(fèi)電量用戶免費(fèi)電量值不為10度
5.1.3 同一證件對(duì)應(yīng)多個(gè)免費(fèi)電量用戶
5.2 免費(fèi)電扣減
6 總結(jié)
本文編號(hào):3397873
【文章來(lái)源】:信息技術(shù)與信息化. 2020,(07)
【文章頁(yè)數(shù)】:4 頁(yè)
【文章目錄】:
0 引言
1 存在的問(wèn)題
1.1 重復(fù)錄入
1.2 有效時(shí)間重疊
1.3 跨年折算
2 數(shù)據(jù)概況
3 關(guān)鍵技術(shù)
3.1 一致性檢查
3.2 缺失值處理
3.3 異常數(shù)據(jù)
3.4 重復(fù)數(shù)據(jù)
3.5 標(biāo)準(zhǔn)化、正則化
3.6 離散化
4 營(yíng)銷數(shù)據(jù)清洗
4.1 免費(fèi)電用戶數(shù)據(jù)清洗
4.2 免費(fèi)電量年度信息
4.2.1 將免費(fèi)電量信息按年度拆分
4.2.2 按用戶和年份匯總免費(fèi)電量信息
4.3 核算免費(fèi)電信息清洗
5 治理方法
5.1 錄入信息是否規(guī)范
5.1.1 免費(fèi)電量用戶存在多條有效免費(fèi)電量記錄
5.1.2 免費(fèi)電量用戶免費(fèi)電量值不為10度
5.1.3 同一證件對(duì)應(yīng)多個(gè)免費(fèi)電量用戶
5.2 免費(fèi)電扣減
6 總結(jié)
本文編號(hào):3397873
本文鏈接:http://sikaile.net/guanlilunwen/yingxiaoguanlilunwen/3397873.html
最近更新
教材專著