大數據與宏觀經濟分析研究綜述
本文關鍵詞:大數據與宏觀經濟分析研究綜述,由筆耕文化傳播整理發(fā)布。
當前位置:首頁 >> 互聯(lián)網 >> 大數據與宏觀經濟分析研究綜述
學 科 前 沿
大數據與宏觀經濟分析研究綜述
*
劉濤雄 徐曉飛
[ 內容提要] 大數據對宏觀經濟分析具有革命性的意義 。在大數據時代, 紛繁 復雜的數據實時可得,整個社會經濟產生了根本的變化 。大數據在宏觀經濟分 析應用中最活躍也是最重要的四個領域為: 宏觀經濟數據挖掘、 宏觀經濟預 測、宏
觀經濟分析技術和宏觀經濟政策 。本文對大數據背景下宏觀經濟數據挖 掘的來源和宏觀經濟預測方法進行了評述 ,探討了大數據分析技術如何將機器 。本文還研究 學習算法引入宏觀經濟分析,利用 LASSO 算法解決 “維數災難” 了大數據對宏觀經濟政策制定的影響 ,并在此基礎上對大數據背景下的中國宏 觀經濟分析提出了對策建議,認為政府應加大扶持力度,搭建平臺,及早建立 基于大數據的宏觀經濟分析模型 ,并加強學科和專業(yè)教育。 [ 關鍵詞] 大數據 宏觀經濟 數據挖掘 機器學習算法 預測
一、引言
隨著互聯(lián)網的普及,信息總量正以空 前的速度爆炸性增長,人類社會進入了一 ( 1PB = 1024TB , 1TB = 個以 “PB ” 1024GB ) 為單位的數據信息新時代, 即 大數據時代。大數據,是指巨大而多樣化 的數據集 ① ,這些數據的處理超出了目前 主流軟件的能力,因此必須改進處理數據
。 “大數據” 術語最早可以追溯到 的工具 Apache 公司的開源項目 Nutch ( 一個開源 軟件實現(xiàn)的搜索引擎 ) , 伴隨谷歌的 MapReduce ( 映 射 和 歸 約, 是 一 種 編 程 模 型,用于大規(guī)模數據 集 的 并 行 運 算 ) 和 GFS ( 可擴展的 Google 文件系統(tǒng) ) , 大數 據不僅代表著數據規(guī)模,而且包含了數據 ② 處理的速度。 目前一般認為, 大數據的 典型特點 可 以 用 “4V ” 即 大 量 化 ( Volume) 、快速化 ( Velocity ) 、 多樣化 ( Va-
* 本文為中國博士后科學基金面上項目 “大數據與宏觀經濟現(xiàn)時預測研究” ( 2014M560068 ) 的階段性成果。
— 57 —
國外理論動態(tài)·2015 年第 1 期 riety) 和價值化 ( Value ) 來 概 括。 一 是 數據體量巨大。據估計,人類至今生產的 所有印刷材料的數據量大約為 200PB , 而 歷史上全人類說過的所有的話的數據量大 約為 5EB ( 1EB = 1024PB ) 。 當前互聯(lián)網 上的數 據 以 每 年 50% 左 右 的 速 度 增 長, 人類 90% 以上的數據都是最近幾年產生 的,到 2013 年, 全球存儲的數據預計能 70 達到約 1. 2 ZB ( 等于 2 個字節(jié),約 10 億 TB) 。二是處理速度快。 在如此海量的數 據面前, 處理數據的效率就是企 業(yè) 的 生 命。社交媒介、移動設備、網上交易和網 絡設備更新的速度非常快,巨大的數據流 會導致傳統(tǒng)數據分析的軟硬件被淘汰 ,產 生從快速生成數據中實時獲取價值的專門 技術和數據分析系統(tǒng)。 三是數據 類 型 繁 多。構成大數據的信息類型來源不同 ,包 括網絡日志、音頻、視頻、圖片、地理位 置信息等。 其中大概只有約 10% 屬于結 構化數據適合整齊地進入相關數據庫的行 和列,其余 90% 是非結構化數據。 四是 價值密度低。價值密度的高低與數據總量 大小成反比。 例如, 一部 1 小時的視頻, 在連續(xù)不間斷監(jiān)控過程中,可能有用的數 據只占一兩秒時間。如何通過強大的機器 算法更 迅 速 地 完 成 數 據 的 價 值 “提 純 ” ③ 變得十分重要,也是數據挖掘的關鍵。 大數據正在深刻地影響著整個社會和 經濟的發(fā)展。從經濟分析的角度看,國際 上的大數據研究首先在行業(yè)研究 、商務分 析和企業(yè)應用層面快速發(fā)展,并逐漸影響 到經濟分析的各個領域。當前,在宏觀經 濟分析中如何充分利用大數據方法和技術 已經開始在國際上引起重視,從國內的情 況來看,將大數據與宏觀經濟聯(lián)系起來的 研究還鮮有見到,宏觀經濟政策制定者對 此也重視不夠,而這正是本綜述的目的和 — 58 — 意義所在。
二、大數據對宏觀經濟分析的革命性意義
大數據開啟了巨大的時代轉型,就宏 觀經濟分析而言,大數據時代帶來的轉變 是重大且具有革命意義的。首先,大數據 極大地拓寬了信息來源。大數據時代的重 大變化是海量的可得數據。傳統(tǒng)經濟分析 依靠的數據主要是樣本, 而在大 數 據 時 代,得到的數據可能就是總體本身,例如 就物價而言,每一筆在電子商務網站成交 的交易信息都能記錄在案。大而全的可得 數據對宏觀經濟分析是極其重要的 ,可以 準確了解宏觀經濟形勢,正確做出宏觀經 濟發(fā)展預測,合理制定宏觀經濟政策。這 些優(yōu)勢是傳統(tǒng)經濟分析方法無法想象和實 現(xiàn)的。 其次,大數據時代信息獲得的速度大 大提高,很多信息實時可得。傳統(tǒng)的經濟 分析主要依靠結構化數據,這些數據最明 顯的缺陷就是具有很強的時滯性。 例如, 政府公布的季度 GDP 往往會有 1 個月的 滯后期,而反映全面經濟社會狀況的統(tǒng)計 年鑒的滯后期會達到 3 個月左右,這對及 時了解宏觀經濟形勢、預測與預警都是非 常不利的。大數據時代信息產生和傳遞的 速度空前加快,如互聯(lián)網上的大量信息是 實時的,移動互聯(lián)網和物聯(lián)網使每個人隨 時隨地都可能制造數據。大數據經濟模型 可以充分利用數據的實時性,提高分析或 預測的時效性,為經濟預警和政策制定提 供最快速的資料和依據。 第三,大數據帶來宏觀經濟分析的方 法論變革。傳統(tǒng)的經濟計量模型建立在抽 樣統(tǒng)計學的基礎上,以假設檢驗為基本模 式。隨著信息量的極大拓展和處理信息能
學 科 前 沿 力的極大提高,經濟分析可能從樣本統(tǒng)計 時代走向總體普查時代。這一點對宏觀經 濟分析意義重大,因為宏觀經濟系統(tǒng)紛繁 復雜,如果能將對整體宏觀經濟變量的分 析建立在盡可能多的關于經濟主體行為的 信息以及其他諸多經濟變量的信息的基礎 上,甚至拋棄原有的假設檢驗的模式 ,無 疑將會極大地提高宏觀經濟分析的準確性 和可信度。同時,經典計量模型以因果檢 驗為核心,而大數據分析則往往將相關性 發(fā)掘作為首要任務。在復雜的宏觀經濟系 統(tǒng)中,當許多宏觀經濟中的因果關系往往 難以準確檢驗、 因果結論經常廣 受 質 疑 時,更重視可靠相關關系的發(fā)掘,充分利 用相關關系對于經濟預測、政策制定與評 估的作用,無疑為宏觀經濟分析打開了另 一片廣闊的空間。正因為如此,維克托· 邁爾 - 舍 恩 伯 格 ( Victor Mayer - Schonberger ) 與 肯 尼 思 · 庫 克 耶 ( Kenneth Cukier) 認為建立在相關關系分析基礎上 的預測是大數據的核心。 第四,大數據促進了宏觀經濟分析技 術的革新。傳統(tǒng)的分析技術基于關系型宏 觀經濟數據,而分析模型主要基于統(tǒng)計數 據,而大數據中的大量信息是非 結 構 化 的,數據的來源和形式復雜多樣。如互聯(lián) 網信息包 含 文 本、 圖 片、 影 音 等 多 種 形 式,在此狀況下進行宏觀經濟分析,有必 要借鑒計算機領域已經出現(xiàn)、但在現(xiàn)有經 濟領域還少有應用的數據處理技術 ,例如 機器學習。機器學習已經在圖像識別、語 音識別、自然語言處理、智能機器人等領 域取得了巨大成功,是當前進行大數據分 析的基本手段。此類技術在宏觀經濟領域 的應用會極大地提高經濟分析的能力 ,改 進分析結果、提升分析價值。另外,傳統(tǒng) 的經濟計量對海量數據難以分析 ,發(fā)展適 合大數據的分析模型是經濟計量面臨的重 ④ 大挑戰(zhàn)。 國際學術界和宏觀經濟政策制定者已 經意識到大數據對宏觀經濟分析的革命性 影響,將大數據的概念、方法、技術和宏 觀經濟分析結合起來的做法正逐步得到重 視,一些意義深遠的研究工作逐步興起。 綜合起來看,這些研究主要集中在宏觀經 濟數據挖掘、宏觀經濟預測、宏觀經濟分 析技術和宏觀經濟政策四個領域 。
三、宏觀經濟數據挖掘
數據挖掘正在成為一個熱門行業(yè) 。簡 單地說,數據挖掘就是大數據時代的統(tǒng)計 調查。隨著互聯(lián)網信息技術的逐步發(fā)展, 獲取的數據種類越來越多,數量越來越龐 大,更新速 度 越 來 越 快, 數 據 中 有 大 量 “噪聲” 存在。 顯然, 傳統(tǒng)的統(tǒng)計調查方 法不能適應大數據時代信息收集的需要, 比如在內容形式上,互聯(lián)網上的諸多信息 是以多媒體方式存在的,統(tǒng)計調查無從下 手; 面對海量信息,統(tǒng)計調查速度慢,效 率低。因此,充分依靠計算機進行信息收 集的各種新技術應 運 而 生, 被 稱 為 “數 。數據挖掘多在利用網絡爬蟲軟 據挖掘” 件的基礎上建立機器學習模型。其過程一 般包括: 先利用網絡爬蟲軟件將原始信息 從網上抓取下來; 然后通過一定方法對這 些數 據 進 行 清 洗, 將 大 量 內 容 無 用 的 “噪聲” 過濾掉, 保留值得加工的信息; 最后對剩下的內容進行加工提取 ,并轉化 為一定程度結構化的可用數據,如標準化 為時間序列等。這一過程已經成為大數據 方法中的標準程序之一。從宏觀經濟分析 的角度,根據信息來源的種類,數據挖掘 大體可分為兩類。 — 59 —
國外理論動態(tài)·2015 年第 1 期 第一類是對數量信息的收集整理 。這 一類工作要解決的問題是信息來源量大面 廣和快速更新的問題,比如麻省理工學院 10 億價格項目 ” ( The Billion Prices 的“ Project , BPP ) 。 研究團隊在經濟學家阿 爾伯托 · 卡瓦洛 ( Alberto Cavallo ) 和羅 伯托·瑞格本 ( Roberto Rigobon ) 的帶領 下,通過 “網絡抓取技術 ” ( web scraping) ,利用網上購物交易數據計算日常通 脹指數, 收 集 世 界 來 自 70 個 國 家、300 個零售商、 共 500 萬種在線商品的價格, 建立了通脹指數的日發(fā)布系統(tǒng)。相比傳統(tǒng) CPI 的月發(fā)布機制 ,“ 10 億價格項目 ” 僅 3 , 有 天的滯后期 幾乎實現(xiàn)了通貨膨脹的 實時預測。 第二類是對非數量信息的收集整理。 比如如何從文本、圖片、視頻等素材中挖 掘出結構化、數量化的信息。這類工作除 了要解決前述問題,還面臨將非結構化數 據轉化為結構化數據這一更困難的艱巨任 務。對一項典型的文本數據挖掘 工 作 而 言,假定任務是從日常的新聞報道中挖掘 出媒體對經濟的信心指數,那么基本過程 ⑤ 包括四步。 第一步是選取部分文本, 請 專業(yè)人士進行標注以便分類,如可分類為 “樂觀、中性、 悲觀 ” 三類, 同一個文本 可由三人分別標記,然后采取一定方法來 計算語料標注的一致性,只有通過,方能 被用于觀點分類。第二步是對文本進行特 征抽取和選擇,特征抽取方法包括基于規(guī) 則的特征抽取和基于統(tǒng)計的特征抽取 。第 三步是在特征抽取信息的基礎上建立分類 器,可同時考慮來源單位、作者身份、文 本性質這三類信息,對已標注文本通過機 器學習 ( 如采用支持向量機算法 ) 建立 分類器。第四步是將此分類器應用于分類 未標注文本,并將分類結果轉化為時間系 — 60 — 列數據。 數據挖掘是在借鑒眾多領域研究思想 的基礎上逐步發(fā)展的,借鑒了統(tǒng)計學的抽 樣估計、 人工智能和機器學習的 搜 索 算 法、建模技術和學習理論,還借鑒了信息 論、最優(yōu)化、可視化、信號處理和信息檢 索等思想。目前廣為接受的數據挖掘處理 模型是法耶德 ( Usama Fayyad) 等人設計 的多處理階段模型。 利用該模型 數 據 挖 掘,意在集中尋求數據挖掘過程中的可視 化方法,便于人機交互; 利用該模型也可 以增強對多媒體數據、文本數據和圖像數 據等各種非結構化或半結構化數據挖掘的 準確性。
四、大數據與宏觀經濟預測
大數據時代信息的實時和快速為及時 高效的預測提供了可能,信息的規(guī)模龐大 為準確合理的預測提供了機會。大數據背 景下的宏觀經濟預測將更加有效 、實用。 國際上利用大數據進行經濟分析與預 測取得了一定的進展。BPP 項目利用網上 購物交易數據計算日常通脹指數。 例如, BPP 的數據顯示, 在雷曼兄弟公司 2008 年 9 月倒閉后,大部分美國企業(yè)幾乎立刻 開始 削 減 價 格, 這 表 明 總 需 求 已 經 減 ⑥ 弱。 相比之下, 官方通脹機構公布的數 據直到當年 11 月,即在 10 月 CPI 數據公 布后,才對 通 貨 緊 縮 有 所 反 應。 崔 玄 英 ( Hyunyoung Choi ) 和瓦里安 ( Hal Varian ) 介紹了谷歌趨勢( Google Trends ) 如何可以 用來為預測當前經濟變量服務,發(fā)現(xiàn)失業(yè) 和相關福利的搜索可以提高對于失業(yè)救濟 ⑦ 首次申請時間的 預 測。 阿 斯 基 達 斯 ( N. Askitas ) 和 齊 默 爾 曼 ( K. F. Zimmermann) ⑧ 、 阿穆里 ( F. D'Amuri ) ⑨ 以 及 蘇 霍
學 科 前 沿
瑠 瑏 依( T. Suhoy) ? 也發(fā)現(xiàn), 互聯(lián)網搜索可以 預測德國、意大利和以色列有關勞動力市 場的狀況。 崔 玄 英 和 瓦 里 安 以 及 吳 ( L. Wu) 和布林約爾松 ( E. Brynjolfsson ) 發(fā)現(xiàn),
與住房有關的搜索可以改善傳統(tǒng)模式對美 瑡 瑏 ? 國住房銷售的預測。 韋博( G. K. Webb) 認 , “止贖權” 的檢索次數和取消抵押品 為 贖回權的實際數目是美國住房市場問題的 瑢 瑏 ? 一個早期預警。 麥凱倫( N. McLaren) 和山 波霍格 ( R. Shanbhogue ) 檢 驗 了 在 線 搜 索 對英國就業(yè)和住房市場預測活動的重要 性,指出包含因特網搜索的模型提高了預 瑣 瑏 ? 測效果。 利用大數據對宏觀經濟進行預測最重 要的方面當屬宏觀經濟的現(xiàn)時預測 ( now casting ) 。“現(xiàn)時預測” 一詞最初源于氣象 學領域,是針對現(xiàn)在已經發(fā)生的事可能因 為信息獲取困難等原因難以直接知道準確 情況,因而根據可得信息來進行推測。比 如對 宏 觀 經 濟 而 言, 在 月 底 估 測 本 月 GDP 總量是現(xiàn)時預測, 因為 “本月 GDP 是多少” 這件事已 經 發(fā) 生 了, 只 是 我 們 還不能馬上拿到相關數據。因為信息技術 的發(fā)展導致大量實時信息容易采集 ,崔玄 英和瓦里安強調應充分利用大數據方法為 經濟現(xiàn)象的現(xiàn)時預測服務。目前對宏觀經 濟的判斷依賴于各種統(tǒng)計調查系統(tǒng)發(fā)布的 統(tǒng)計數據,但面臨的最大困難之一便在于 關于宏觀經濟統(tǒng)計的數據滯后太多 ,基于 此統(tǒng)計進行的預測甚至被認為助長了宏觀 經濟波動。大數據時代大量實時數據的產 生,為更快捷地估測宏觀經濟提 供 了 可 能,大數據理論與方法的發(fā)展則為現(xiàn)時預 測提供了新的條件。 大數據也使得宏觀經濟預測模型產生 了變化。傳統(tǒng)的經濟預測往往通過建立時 間序列、截面或面板方程等幾個模型來進
行,變量的完整被認為是不可能的。由于 模型變量選擇、參數設置、估計方法以及 滯后期選擇等的不同,預測結果會產生很 大的偏差。大數據時代可以應用大量模型 進行研究,并應用完備的數據信息,這對 預測模型的改進提出了挑戰(zhàn),同時提高了 預測的準確性。 麥凱倫和山波霍格指出,大數據對分 析預測意想不到的事情也是特別有幫助 的。例如經濟形勢的變更、暫時的工廠關 閉和罷工等,傳統(tǒng)的調查數據須根據預定 的問題進行收集,而大數據時代搜索數據 更靈活,可用于評估這些特殊情況,對宏 瑤 瑏 ? 觀經濟進行合理預測。
五、大數據分析技術與宏觀經濟分析
人類對大數據特別是結構化的、甚至 看似雜亂無章的海量數據的分析能力的大 大加強,有賴于機器學習 ( machine learning) 算法的迅速發(fā)展。 簡單地說, 機器 學習就是讓計算機經過 “訓練 ” 在輸入 變量和 輸 出 變 量 間 建 立 起 某 種 “最 佳 ” , 是指把輸入 的匹配關系。 所謂 “訓練 ” 和輸出信息都已知的樣本輸入計算機 ,然 后根據一定的算法,由計算機生成由輸入 。 “機器” 能夠 變量預測輸出變量的方法 伴隨計算、運行次數的增多,通過學習逐 步自我提高和改善,使挖掘和處理更為準 確。機器學習的主要算法包括線性模型、 拓展的線性模型、 決策樹、 支持向量機、 人工神經網絡、自組織映射網絡、遺傳算 法等等,并仍在蓬勃發(fā)展。機器學習已經 在圖像識別、 語音識別、 自然語言處理、 智能機器人等諸多領域取得了巨大成功, 是當前進行數據挖掘和大數據分析的基本 手段。大數據推動數據的分析向機器學習 — 61 —
國外理論動態(tài)·2015 年第 1 期 方向發(fā)展。從根本上講,機器學習力圖通 過計算機模擬或實現(xiàn)人類的學習行為來獲 取新的知識或技能,并且重新組織已有的 知識結構使之不斷改善。宏觀經濟分析也 必然會成為機器學習模型的重要消費者; 同時,宏觀經濟研究分析的需要也必然會 反過來促進機器學習方法的進一步改進和 發(fā)展。 在宏觀 經 濟 模 型 中, 通 過 大 數 據 挖 掘,可得解釋變量會大大增加,因此研究 中會出現(xiàn)高維數據問題, 即因可 得 信 息 “過多” ,往往會出現(xiàn)和被解釋變量 ( 如 GDP) 相關的解釋變量數量過多, 產生所 謂的 “維數災難 ” ( curse of dimensionality) 。如在線性回歸問題 Y = Xβ + ε 中,其 中 Y 為 GDP,X ( 向量) 為可得的解釋變 量。樣本為時間系列,其數量受限于可得 的時間間隔數, 當 X 中的解釋變量數大 于樣本數時,無法用最小二乘法得到系數 β 的估計。目前機器學習理論中對此問題 已 有 不 少 方 法, 采 用 最 多 的 是 LASSO ( Least Absolute Shrinkage and Selection Operator) 算法。 這種算法可直觀理解為在最小二乘法 基礎上,增加一個懲罰項 λ ‖ β ‖1 。 通過 懲罰項的引入, LASSO 可 以 對 一 些 次 要 變量賦予系數為 0 , 同時實現(xiàn)對變量的選 擇。 “高維” 數據問題已經成為當前經濟 計量模型研究中的一個前沿和熱點領域。 處理高維數據能力的提升將大大增強大數 據對宏 觀 經 濟 分 析 的 意 義, 使 得 “大 ” 。 另外, 基于大數據的 成為有用之 “大 ” 社會網絡和社會計算等其他分析技術也在 蓬勃發(fā)展,并在大數據宏觀經濟分析方面 有著重要的應用前景。
六、大數據與宏觀經濟政策制定
大數據革命為政府的宏觀經濟政策制 定提供了機會。政府在政策制定上可以通 過大數據分析系統(tǒng)提升公共服務質量 ,增 加服務種類,并為公共服務提供更好的政 策指導。同時,在大數據分析的運用、提 高效率、與其他政策和技術協(xié)同以及為公 共服務領域帶來變革等方面,政府可以加 大重視和投入力度,為經濟的進一步發(fā)展 提供支持。 大數據給政府的經濟統(tǒng)計工作帶來了 巨大影響。首先,面對大數據帶來的技術 變革,政府應該將其納入政府統(tǒng)計之中。 經濟統(tǒng)計要充分利用大數據時代提供的技 術和條件,促進政府統(tǒng)計工作的變革。例 10 億價格項目 ” 便是政府應對大數 如“ 據變革的成功典范。其次,面對大數據帶 來的統(tǒng)計對象擴充,政府不但應當重視結 構化數據, 更應當重視挖掘非結 構 化 數 據,以期找尋出恰當的經濟統(tǒng)計指標 。大 數據時代,非結構化數據包含更多信息, 而且利用互聯(lián)網進行的數據挖掘 ,不僅可 以得到數字資源,文本數據也可以通過挖 掘獲得。第三,面對大數據帶來的統(tǒng)計資 源的拓展,政府應該將其統(tǒng)計資源拓展到 政府以外,重視拓寬其他數據資源。在過 去,政府靠自己的力量收集數據,但在大 數據時代, 人 人 都 是 數 據 的 制 造 者。 例 如,谷歌和百度等數據巨頭擁有大量政府 無法獲取的數據資源。政府要想辦法讓數 據巨頭將數據放到統(tǒng)計中來,而不能僅靠 自己調查統(tǒng)計。西方國家已經重視利用大 數據來提高宏觀經濟政策的決策性 ,美國 和澳大利亞就是成功的典范。 2012 年 3 月, 美國奧巴馬政府推出
— 62 —
學 科 前 沿 “大數據研究和發(fā)展計劃 ” , 涉及美國國 家科學基金、 國家衛(wèi)生研究院、 能源部、 國防部、國防部高級研究計劃局、地質勘 探局等 6 個聯(lián)邦政府部門。政府承諾投資 超兩億美元,大力推動和改善與大數據相 關的收集、組織和分析,以推進從巨大而 復雜的數據集合中獲取信息的能力 。美國 普查局在將大數據與統(tǒng)計調查相結合方面 也走在了前列。2012 年, 美國普查局向 公眾開放了普查應用程序接口,通過軟件 開發(fā)商專門設計了網絡和移動應用程序, 用戶可通過手機 APP 對人口、 社會普查 數據下載使用。 在 2020 年的普查中, 美 國普查局計劃采取 “網絡抓取技術 ” 等 多模式進行數據收集。美國未來試圖實現(xiàn) 企業(yè)數據與普查、 調查數據的全面融合, 提高統(tǒng)計調查的效率和質量。 澳大利亞大數據政策由澳大利亞信息 管理辦公室于 2013 年 8 月正式提出方案, 并對與之相關的政府部門進行了界定 ,對 涉及相關隱私和安全的內容進行了闡述。 目前,一系列大數據的試點項目 已 經 展 開。這些試點將對大數據工作組和澳大利 亞政府數據分析重點科研中心 ( 隸屬于 澳大利亞稅務局) 提供支撐。 于進一步更新。在大數據時代,可以將機 器學習算法引入宏觀經濟分析,改進宏觀 , 提高 經濟分析技術, 解決 “維數災難 ” 宏觀經濟分析的準確性。大數據也將促進 政府經濟政策制定的變革,提升政策的時 效性,提高政府服務效率。 與西方國家相比,中國目前在利用大 數據進行宏觀經濟分析方面尚顯薄弱 ,工 作尚待加強。為了在大數據時代更好地發(fā) 展經濟,應該挖掘更多的宏觀經濟數據資 源,實現(xiàn)計算機實時在線數據收集,盡快 建立基于大數據的宏觀經濟分析模型 ,開 發(fā)大數據上線軟件,以盡早完成基于大數 據的宏觀經濟預測分析系統(tǒng),為宏觀經濟 提供更及時、更準確的預測,為中國經濟 發(fā)展做出貢獻。 第一,政府和相關研究機構應該加大 投入,開展相關科研或立項,為大數據與 宏觀經濟分析的研究提供環(huán)境和宏觀層面 的支持。特別是跨學科領域,目前正需要 信息技術和經濟學相關領域學者的合作, 國家要采取措施創(chuàng)造合作的機會 。 第二, 決 策 者 應 加 快 步 伐, 搭 建 平 臺,充分利用大數據服務于宏觀經濟政策 的制定。決策者要明確大數據帶來的機會 和挑戰(zhàn),摒棄舊俗,加快相關改革,更新 觀念,整合 資 源, 跟 進 大 數 據 時 代 的 步 伐,開發(fā)新技術,探討新理論,及時應用 大數據與宏觀經濟分析的研究成果改善宏 觀經濟政策。 第三,科學合理的預測模型是經濟政 策合理的基礎,中國應盡快建立一批基于 大數據的宏觀經濟分析和預測模型 ,開發(fā) 大數據預測上線軟件,使宏觀經濟預測更 早、更及時、更準確。 第四,應加強大數據與宏觀經濟相關 方面的學科與專業(yè)教育,建立經濟數據分 — 63 —
七、結論與建議
大數據時代極大地拓寬了信息來源、 提高了獲取信息的時效性,同時,新信息 的非結構化對宏觀經濟分析的技術和方法 提出了新的要求。在大數據背景下,由于 數據噪聲的存在,宏觀經濟數據挖掘變得 十分重要,這就要改進技術,加強對非結 構化和半 結 構 化 數 據 的 挖 掘。 實 時、 快 速、海量的數據為更加準確的宏觀經濟預 測提供了可能,宏觀經濟預測模型也有待
國外理論動態(tài)·2015 年第 1 期 析新專業(yè),培養(yǎng)相關人才! 注 釋
tier ” , Bank of Canada Review, Summer 2013 , pp. 32 - 39. , “The Impact of Big Data on Data Analyt② Julie Lockner ,http: / / ibmdatamag. com /2012 /02 / the - impact ics” - of - big - data - on - data - analytics / , 2012. ③ Victor Mayer - Schonberger ,Kenneth Cukier,Big Data : A Revolution that Will Transform How we Live,Work and Think,London: John Murray, 2013. ④ Guido Imbens,T. Barrios,Rebecca Diamond and M. Kolesar,Clustering,Spatial Correlations and Randomization Inference,Harvard University, 2011. ⑤ Navjeet Kaur ,Jyoti Kiran,Natural Language Processing, Germany: LAP Lambert Academic Publishing, 2012. ,“A Billion Prices Now” ,The New York⑥ J. Surowiecki er, 30 May, 2011. ⑦ Hyun Young Choi,Hal Varian. Predicting the present with Google Trends. Technical report,Google,URL http : / / google. com / googleblogs / pdfs / google _predicting 2009 ; “Predicting the present with _the present. pdf, google trends. Economic Record ” ,URL http: / / people. ischool. berkeley. edu / ~ hal / Papers /2011 / ptp. pdf. Forthcoming, 2012. ,“Google Econometrics ⑧ N. Askitas,K. F. Zimmermann and Unemployment Forecasting ” , Applied Economics Quarterly, 55 ( 2 ) , 2009 ,pp. 20 - 107. ,“Predicting Unemployment in Short Sam⑨ F. D'Amuri ples with Internet Job Search Query Data” , Munich PerNo. 18403 , 2009. sonal Repec Archive Paper, ,“Query Indices and a 2008 Downturn: Israeli ? 瑏 瑠 T. Suhoy Data” ,Bank of Israel Discussion Paper No. 2006 - 2009. ,“Using Search Engine ? 瑏 瑡 Hyunyoung Choi,Hal Varian Data for Nowcasting - An Illustration ” , In Actes des Rencontrees Economiques; Aix - en - Provence, FRANCE,Recontres Economiques d'Aix - en - Provence,LeCercle des economists,http: / / www. lecercledeseconomistes. asso. fr / IMG / pdf / Actes _ Rencontres _ Economiques_d_Aix - en - Provence_2011. pdf,2011. L. Wu,E. Brynjolfsson ,“The Future of Prediction: How Google Searches Foreshadow Housing Prices and Quantities” ,Thirtieth International Conference on Information System,Phoenix 2009 ,pp. 1 - 14. ,“Internet Search Statistics as a Source of ? 瑏 瑢 G. K. Webb Business Intelligence: Searches on Foreclosure as an Es,Issues in Informatimate of Actual Home Foreclosures” 10 ( 2 ) , 2009 , pp. 82 - 87. tion Systems, ,,“Using Internet Search ? 瑏 瑣 N. McLaren,R. Shanbhogue Data as Economic Indicators ” ,Bank of England Quar2011 ,pp. 134 - 140. terly Bulletin,Q2 , T. Hastie, R. Tibshirani, The Elements of ? 瑏 瑤 J. Friedman, 2008. Statistical Learning,New York: 2ed,Springer,
, “Big Data Analysis: The Next Fron① Nii Ayi Armah
[ 劉濤雄: 清華大學經濟學研究所; 徐曉 飛: 清華大學經濟學研究所]
( 責任編輯 宋陽旨)
— 64 —
本文關鍵詞:大數據與宏觀經濟分析研究綜述,由筆耕文化傳播整理發(fā)布。
本文編號:150234
本文鏈接:http://sikaile.net/jingjilunwen/hongguanjingjilunwen/150234.html