天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

CGSS數據質量評估體系建模及應用

發(fā)布時間:2024-05-18 00:54
  目前可查文獻對于數據質量的研究工作大部分圍繞政府官方數據庫、企業(yè)或機構內部數據庫展開,而對于非官方微觀數據庫的數據質量卻鮮有討論,但無可否認這些數據庫在學術研究、實證分析中均發(fā)揮著不可替代的作用。因此本文致力于研究CGSS數據質量,試圖在微觀數據庫質量研究方面做一些有益的嘗試,進而對國內微觀數據庫的建設起到正向的推動作用。本文的實證部分包括指標體系構建與最優(yōu)權重確定兩大模塊。在指標體系構建模塊中,通過對比各類已提出的數據質量評估指標體系,并針對CGSS數據庫的應用場景創(chuàng)造性增加了數據平衡性指標;最終構建了包含準確性、一致性、數據完整性、描述完備性、及時性、豐富性、可靠性與數據平衡性8個方面的CGSS數據質量評估體系。在最優(yōu)權重確定模塊中,通過權重賦值方法計算每個數據集的綜合質量得分,并借鑒文獻計量學中的學術跡方法來確定最優(yōu)權重;該方法既擺脫了主觀賦權法的人為因素影響,又因為不參與指標體系得分計算而避免了客觀賦權法對指標體系建立科學性的依賴。通過建模發(fā)現(xiàn),在CGSS項目公布的9個數據集中,數據質量得分超過0.6的數據集有三個,按照得分由大到小依次為CGSS2010、CGSS2015、CG...

【文章頁數】:99 頁

【學位級別】:碩士

【部分圖文】:

圖1-1數據類型分類圖

圖1-1數據類型分類圖

2制指明了前進目標;另一方面不斷加大統(tǒng)計執(zhí)法檢查力度,對于數據造假案件做到“發(fā)現(xiàn)一起、查處一起、曝光一起”。2018年底,國家統(tǒng)計局通報7起第三次農業(yè)普查數據造假典型案件,并對案件處理結果及時向社會公開,我國的統(tǒng)計數據質量監(jiān)測控制正向好發(fā)展。統(tǒng)計數據類型眾多,形式各異,概括的討論....


圖1-2CGSS歷年發(fā)文量②正是由于CGSS調查數據被各個學科廣泛使用,所以討論其數據存在的質量

圖1-2CGSS歷年發(fā)文量②正是由于CGSS調查數據被各個學科廣泛使用,所以討論其數據存在的質量

6成,CGSS2005、2006、2008通過調查公司完成,最終將學術網絡關系確定為CGSS收集數據的標準模式。以上兩點表明CGSS項目產出的數據在數據管理與影響范圍上具有的優(yōu)越性,屬于我國建設先進的非官方微觀數據庫,對其產出的數據質量進行研究對提高學術實證數據質量方面有著積極的....


圖1-3本文分析框架

圖1-3本文分析框架

景與研究意義,表明數據質量問題對模型結果的重要影響,同時指出當前微觀數據庫的廣泛使用與質量研究不足的現(xiàn)狀。最后介紹了本論文的研究辦法,引入文獻計量分析輔佐數據質量分析,并對全文的研究框架做出說明。第2章:主要介紹本文的模型理論,首先綜合已有文獻結論,明晰了本文對數據質量的定義,使....


圖2-1本文數據質量評估框架

圖2-1本文數據質量評估框架

17質出現(xiàn)頻次較高,可歸于數據質量評價的基本維度。其次,“可達性”、“安全性”、“可訪問性”、“溯源性”、“訪問安全性”、“可恢復性”、“安全性”、“隱私性”、“生命周期”、“可解釋性”等指標大都是在描述數據庫建設程度,這些指標是基于數據管理者的角度。與之相對,“切題性”、“相關....



本文編號:3976211

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3976211.html


Copyright(c)文論論文網All Rights Reserved | 網站地圖 |

版權申明:資料由用戶e36a6***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com