基于柔性統(tǒng)計(jì)系統(tǒng)的港口企業(yè)多維度統(tǒng)計(jì)模式構(gòu)建
【學(xué)位授予單位】:北京交通大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2011
【分類號(hào)】:F552.3
【圖文】:
根據(jù)數(shù)據(jù)質(zhì)量問題產(chǎn)生在單數(shù)據(jù)源還是多數(shù)據(jù)源以及問題出在模式層還是實(shí)例層,文獻(xiàn)[4】將數(shù)據(jù)質(zhì)量問題分為四類:單數(shù)據(jù)源模式層問題、單數(shù)據(jù)源實(shí)例層問題、多數(shù)據(jù)源模式層問題以及多數(shù)據(jù)源實(shí)例層問題。圖2.1展示了這種分類,并列出了每一類中典型的數(shù)據(jù)質(zhì)量問題。老鑫嘿矍…一差的模式設(shè)計(jì)}唯一值參照完整性拼寫錯(cuò)誤重復(fù)數(shù)據(jù)沖突數(shù)據(jù)一尸l、2實(shí)例級(jí)問題數(shù)據(jù)輸入錯(cuò)誤或不完整7妙曰入據(jù)題原單數(shù)問﨑命名沖突結(jié)構(gòu)沖突不一致的匯總?cè)氩灰恢碌臅r(shí)間選擇據(jù)源題數(shù)多問量數(shù)據(jù)質(zhì)題問一圖2.1數(shù)據(jù)質(zhì)量問題分類 Figure2.1CategoriesofDataQualitylssues單數(shù)據(jù)源中出現(xiàn)的問題在多數(shù)據(jù)源中會(huì)變得更加嚴(yán)重。另外,模式層次上出現(xiàn)的數(shù)據(jù)質(zhì)量問題也會(huì)在實(shí)例層次上有體現(xiàn)。模式層次上的數(shù)據(jù)質(zhì)量問題包括糟糕的模式設(shè)計(jì)、完整性約束定義的缺失、多個(gè)數(shù)據(jù)源之間異質(zhì)的數(shù)據(jù)模型、模式設(shè)計(jì)、命名沖突等。這部分?jǐn)?shù)據(jù)質(zhì)量問題可以通過改進(jìn)模式設(shè)計(jì)、進(jìn)行模式轉(zhuǎn)化和集成等方式來解決。實(shí)例層次上的數(shù)據(jù)質(zhì)量問題則在模式層次上不可見。(3)數(shù)據(jù)清洗目前,數(shù)據(jù)清洗沒有一個(gè)統(tǒng)一的定義。文獻(xiàn)【5]認(rèn)為數(shù)據(jù)清理是一個(gè)消除數(shù)據(jù)中的錯(cuò)誤和不一致,解決對(duì)象識(shí)別問題的過程。文獻(xiàn)[6J將其定義為相似重復(fù)記錄的合并和清理問題。狹義上的數(shù)據(jù)清洗特指在構(gòu)建數(shù)據(jù)倉(cāng)庫(kù)和實(shí)施數(shù)據(jù)挖掘前對(duì)源數(shù)據(jù)進(jìn)行處理,實(shí)現(xiàn)數(shù)據(jù)的準(zhǔn)確性、一致性、完整性、唯一性、有效性和適時(shí)性以適應(yīng)后續(xù)操作的過程。廣義上的數(shù)據(jù)清洗則指所有情況下對(duì)臟數(shù)據(jù)進(jìn)行處理來適應(yīng)相應(yīng)數(shù)據(jù)分析操作的過程。本文的研究基于企業(yè)的信息化建設(shè),研究的重點(diǎn)問題是如何提升信息系統(tǒng)中的數(shù)據(jù)質(zhì)量問題。故本文認(rèn)為:凡是有助于提升管理信息系統(tǒng)中的數(shù)據(jù)質(zhì)量問題?
數(shù)據(jù)清洗原理結(jié)構(gòu)圖
我國(guó)港口企業(yè)統(tǒng)計(jì)工作現(xiàn)狀進(jìn)行說明。下圖中,圖3.3是廣州港集團(tuán)信息系統(tǒng)組織結(jié)構(gòu)圖。廣州港集團(tuán)信息系統(tǒng)組織結(jié)構(gòu)中,包含廣州港集團(tuán)生產(chǎn)業(yè)務(wù)管理系統(tǒng)、財(cái)務(wù)管理系統(tǒng)、港區(qū)地理信息系統(tǒng)、人力資源管理系統(tǒng)等12部分、112個(gè)業(yè)務(wù)管理子系統(tǒng)【州,分為集團(tuán)級(jí)管理信息系統(tǒng)和子公司級(jí)管理信息系統(tǒng)。具有系統(tǒng)層次多、結(jié)構(gòu)清晰、數(shù)據(jù)存儲(chǔ)分散、業(yè)務(wù)
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 高磊;;零部件數(shù)據(jù)處理平臺(tái)研究[J];汽車零部件;2011年07期
2 吳勇靈;潘曉慧;楊潔;余長(zhǎng)青;;基于MC-S20T180NO教室人數(shù)統(tǒng)計(jì)系統(tǒng)的設(shè)計(jì)與研究[J];佳木斯大學(xué)學(xué)報(bào)(自然科學(xué)版);2011年04期
3 潘巍;李戰(zhàn)懷;聶艷明;陳群;;一種有效的多數(shù)據(jù)源RFID冗余數(shù)據(jù)清洗技術(shù)[J];西北工業(yè)大學(xué)學(xué)報(bào);2011年03期
4 李紅祥;方遜;;基于AIS的船舶交通流量統(tǒng)計(jì)方法研究[J];武漢理工大學(xué)學(xué)報(bào)(交通科學(xué)與工程版);2011年04期
5 張彥;李小明;張遠(yuǎn);劉明帥;;基于組態(tài)軟件的油泵實(shí)驗(yàn)臺(tái)數(shù)據(jù)統(tǒng)計(jì)系統(tǒng)的設(shè)計(jì)[J];現(xiàn)代制造技術(shù)與裝備;2011年04期
6 陳慧蕾;曹耀斐;;使用分布式數(shù)據(jù)整合平臺(tái)解決信息孤島問題的探討[J];珠江水運(yùn);2010年06期
7 黃始堅(jiān);;完善企業(yè)統(tǒng)計(jì)制度 促進(jìn)施工企業(yè)發(fā)展[J];企業(yè)科技與發(fā)展;2011年14期
8 吳華穩(wěn);王宇;龔利;;BOXI在鐵路統(tǒng)計(jì)中的應(yīng)用[J];鐵路計(jì)算機(jī)應(yīng)用;2011年08期
9 李京原;;車流監(jiān)測(cè)及全程調(diào)流系統(tǒng)的研究和思考[J];中國(guó)鐵路;2011年05期
10 劉少梅;;火電廠能源統(tǒng)計(jì)存在的問題及對(duì)策[J];中國(guó)新技術(shù)新產(chǎn)品;2011年17期
相關(guān)會(huì)議論文 前10條
1 俞榮華;郭志懋;田增平;周傲英;;一個(gè)可擴(kuò)展的數(shù)據(jù)清洗系統(tǒng)[A];第十八屆全國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(技術(shù)報(bào)告篇)[C];2001年
2 蔣勇青;楊奕虹;楊賀;;論數(shù)據(jù)清洗對(duì)信息檢索質(zhì)量的影響及清洗方法[A];2011年中國(guó)索引學(xué)會(huì)年會(huì)暨成立二十周年慶典論文集[C];2011年
3 馬昕;肖建東;范華勇;;綜合統(tǒng)計(jì)系統(tǒng)在紅鋼的應(yīng)用[A];中國(guó)計(jì)量協(xié)會(huì)冶金分會(huì)2011年會(huì)論文集[C];2011年
4 肖英治;陳紅;;帶數(shù)據(jù)清洗功能的數(shù)據(jù)預(yù)處理系統(tǒng)PW-ETL的設(shè)計(jì)與實(shí)現(xiàn)[A];第二十一屆中國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(研究報(bào)告篇)[C];2004年
5 李曉靜;谷峪;呂雁飛;王艷秋;于戈;;基于動(dòng)態(tài)事件概率模型的高效RFID數(shù)據(jù)清洗算法[A];第二十五屆中國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(二)[C];2008年
6 王妍;石鑫;宋寶燕;;基于偽事件的RFID數(shù)據(jù)清洗方法[A];第26屆中國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(B輯)[C];2009年
7 相文璽;宋杰;房強(qiáng);丁輝;鮑玉斌;于戈;;一種面向科學(xué)數(shù)據(jù)的通用排重模型[A];第二十五屆中國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(二)[C];2008年
8 倪志良;夏雨春;;計(jì)算機(jī)系統(tǒng)安全與計(jì)算機(jī)病毒防治的措施和策略[A];第六次全國(guó)計(jì)算機(jī)安全技術(shù)交流會(huì)論文集[C];1991年
9 唐廣泉;;六西格瑪管理在統(tǒng)計(jì)工作中的應(yīng)用研究[A];第三屆中國(guó)質(zhì)量學(xué)術(shù)論壇論文集[C];2008年
10 劉艷偉;陳戰(zhàn)友;趙慧娟;;ODBC技術(shù)在鋼筋表自動(dòng)生成與統(tǒng)計(jì)系統(tǒng)中的應(yīng)用[A];交通土建及結(jié)構(gòu)工程計(jì)算機(jī)應(yīng)用學(xué)術(shù)研討會(huì)論文集[C];2001年
相關(guān)重要報(bào)紙文章 前10條
1 本報(bào)記者 王青萍;統(tǒng)計(jì)系統(tǒng)貫徹落實(shí)科學(xué)發(fā)展觀要重點(diǎn)做好四方面工作[N];中國(guó)信息報(bào);2008年
2 記者 魏瑩;全區(qū)統(tǒng)計(jì)系統(tǒng)考評(píng)組觀摩考評(píng)我市統(tǒng)計(jì)工作[N];固原日?qǐng)?bào);2008年
3 王東明 記者 楊穎;鞍山統(tǒng)計(jì)系統(tǒng)獲兩項(xiàng)國(guó)家級(jí)榮譽(yù)[N];鞍山日?qǐng)?bào) ;2009年
4 徐維軍 宋艷芝;市統(tǒng)計(jì)局榮獲全國(guó)統(tǒng)計(jì)系統(tǒng)先進(jìn)集體[N];承德日?qǐng)?bào);2009年
5 通訊員徐風(fēng)華;州統(tǒng)計(jì)局榮獲“全國(guó)統(tǒng)計(jì)系統(tǒng)先進(jìn)集體”稱號(hào)[N];昌吉日?qǐng)?bào);2009年
6 本報(bào)記者 王璐瑤;統(tǒng)計(jì)系統(tǒng)積極推進(jìn)服務(wù)方式轉(zhuǎn)變[N];貴州日?qǐng)?bào);2009年
7 張作亭;濟(jì)南市統(tǒng)計(jì)系統(tǒng)文明機(jī)關(guān)創(chuàng)建活動(dòng)再獲佳績(jī)[N];濟(jì)南日?qǐng)?bào);2009年
8 記者 楊朝東;市統(tǒng)計(jì)局榮獲全國(guó)統(tǒng)計(jì)系統(tǒng)先進(jìn)集體稱號(hào)[N];通遼日?qǐng)?bào);2009年
9 劉建國(guó) 榮康勃;我市統(tǒng)計(jì)系統(tǒng)以“三創(chuàng)新”落實(shí)“三促進(jìn)”活動(dòng)[N];咸陽(yáng)日?qǐng)?bào);2009年
10 賈云霞;市統(tǒng)計(jì)局蟬聯(lián)全國(guó)統(tǒng)計(jì)系統(tǒng)先進(jìn)集體稱號(hào)[N];長(zhǎng)治日?qǐng)?bào);2009年
相關(guān)博士學(xué)位論文 前10條
1 常建龍;數(shù)據(jù)流聚類及電信數(shù)據(jù)流管理[D];復(fù)旦大學(xué);2008年
2 鄭向群;農(nóng)產(chǎn)品產(chǎn)地污染綜合知識(shí)挖掘系統(tǒng)的研究[D];天津大學(xué);2009年
3 劉波;XML數(shù)據(jù)智能管理若干關(guān)鍵技術(shù)研究[D];中南大學(xué);2008年
4 吳愛華;不一致數(shù)據(jù)的查詢處理[D];復(fù)旦大學(xué);2010年
5 李超鋒;Web使用挖掘關(guān)鍵技術(shù)研究[D];華中科技大學(xué);2007年
6 y囈黃
本文編號(hào):2752953
本文鏈接:http://sikaile.net/jingjilunwen/jtysjj/2752953.html