天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

大數(shù)據(jù)與宏觀經(jīng)濟分析研究綜述

發(fā)布時間:2016-10-23 10:01

  本文關鍵詞:大數(shù)據(jù)與宏觀經(jīng)濟分析研究綜述,由筆耕文化傳播整理發(fā)布。


當前位置:首頁 >> 互聯(lián)網(wǎng) >> 大數(shù)據(jù)與宏觀經(jīng)濟分析研究綜述


學 科 前 沿

大數(shù)據(jù)與宏觀經(jīng)濟分析研究綜述

*

劉濤雄 徐曉飛

[ 內容提要] 大數(shù)據(jù)對宏觀經(jīng)濟分析具有革命性的意義 。在大數(shù)據(jù)時代, 紛繁 復雜的數(shù)據(jù)實時可得,整個社會經(jīng)濟產(chǎn)生了根本的變化 。大數(shù)據(jù)在宏觀經(jīng)濟分 析應用中最活躍也是最重要的四個領域為: 宏觀經(jīng)濟數(shù)據(jù)挖掘、 宏觀經(jīng)濟預 測、宏

觀經(jīng)濟分析技術和宏觀經(jīng)濟政策 。本文對大數(shù)據(jù)背景下宏觀經(jīng)濟數(shù)據(jù)挖 掘的來源和宏觀經(jīng)濟預測方法進行了評述 ,探討了大數(shù)據(jù)分析技術如何將機器 。本文還研究 學習算法引入宏觀經(jīng)濟分析,利用 LASSO 算法解決 “維數(shù)災難” 了大數(shù)據(jù)對宏觀經(jīng)濟政策制定的影響 ,并在此基礎上對大數(shù)據(jù)背景下的中國宏 觀經(jīng)濟分析提出了對策建議,認為政府應加大扶持力度,搭建平臺,及早建立 基于大數(shù)據(jù)的宏觀經(jīng)濟分析模型 ,并加強學科和專業(yè)教育。 [ 關鍵詞] 大數(shù)據(jù) 宏觀經(jīng)濟 數(shù)據(jù)挖掘 機器學習算法 預測

一、引言
隨著互聯(lián)網(wǎng)的普及,信息總量正以空 前的速度爆炸性增長,人類社會進入了一 ( 1PB = 1024TB , 1TB = 個以 “PB ” 1024GB ) 為單位的數(shù)據(jù)信息新時代, 即 大數(shù)據(jù)時代。大數(shù)據(jù),是指巨大而多樣化 的數(shù)據(jù)集 ① ,這些數(shù)據(jù)的處理超出了目前 主流軟件的能力,因此必須改進處理數(shù)據(jù)

。 “大數(shù)據(jù)” 術語最早可以追溯到 的工具 Apache 公司的開源項目 Nutch ( 一個開源 軟件實現(xiàn)的搜索引擎 ) , 伴隨谷歌的 MapReduce ( 映 射 和 歸 約, 是 一 種 編 程 模 型,用于大規(guī)模數(shù)據(jù) 集 的 并 行 運 算 ) 和 GFS ( 可擴展的 Google 文件系統(tǒng) ) , 大數(shù) 據(jù)不僅代表著數(shù)據(jù)規(guī)模,而且包含了數(shù)據(jù) ② 處理的速度。 目前一般認為, 大數(shù)據(jù)的 典型特點 可 以 用 “4V ” 即 大 量 化 ( Volume) 、快速化 ( Velocity ) 、 多樣化 ( Va-

* 本文為中國博士后科學基金面上項目 “大數(shù)據(jù)與宏觀經(jīng)濟現(xiàn)時預測研究” ( 2014M560068 ) 的階段性成果。

— 57 —

國外理論動態(tài)·2015 年第 1 期 riety) 和價值化 ( Value ) 來 概 括。 一 是 數(shù)據(jù)體量巨大。據(jù)估計,人類至今生產(chǎn)的 所有印刷材料的數(shù)據(jù)量大約為 200PB , 而 歷史上全人類說過的所有的話的數(shù)據(jù)量大 約為 5EB ( 1EB = 1024PB ) 。 當前互聯(lián)網(wǎng) 上的數(shù) 據(jù) 以 每 年 50% 左 右 的 速 度 增 長, 人類 90% 以上的數(shù)據(jù)都是最近幾年產(chǎn)生 的,到 2013 年, 全球存儲的數(shù)據(jù)預計能 70 達到約 1. 2 ZB ( 等于 2 個字節(jié),約 10 億 TB) 。二是處理速度快。 在如此海量的數(shù) 據(jù)面前, 處理數(shù)據(jù)的效率就是企 業(yè) 的 生 命。社交媒介、移動設備、網(wǎng)上交易和網(wǎng) 絡設備更新的速度非?,巨大的數(shù)據(jù)流 會導致傳統(tǒng)數(shù)據(jù)分析的軟硬件被淘汰 ,產(chǎn) 生從快速生成數(shù)據(jù)中實時獲取價值的專門 技術和數(shù)據(jù)分析系統(tǒng)。 三是數(shù)據(jù) 類 型 繁 多。構成大數(shù)據(jù)的信息類型來源不同 ,包 括網(wǎng)絡日志、音頻、視頻、圖片、地理位 置信息等。 其中大概只有約 10% 屬于結 構化數(shù)據(jù)適合整齊地進入相關數(shù)據(jù)庫的行 和列,其余 90% 是非結構化數(shù)據(jù)。 四是 價值密度低。價值密度的高低與數(shù)據(jù)總量 大小成反比。 例如, 一部 1 小時的視頻, 在連續(xù)不間斷監(jiān)控過程中,可能有用的數(shù) 據(jù)只占一兩秒時間。如何通過強大的機器 算法更 迅 速 地 完 成 數(shù) 據(jù) 的 價 值 “提 純 ” ③ 變得十分重要,也是數(shù)據(jù)挖掘的關鍵。 大數(shù)據(jù)正在深刻地影響著整個社會和 經(jīng)濟的發(fā)展。從經(jīng)濟分析的角度看,國際 上的大數(shù)據(jù)研究首先在行業(yè)研究 、商務分 析和企業(yè)應用層面快速發(fā)展,并逐漸影響 到經(jīng)濟分析的各個領域。當前,在宏觀經(jīng) 濟分析中如何充分利用大數(shù)據(jù)方法和技術 已經(jīng)開始在國際上引起重視,從國內的情 況來看,將大數(shù)據(jù)與宏觀經(jīng)濟聯(lián)系起來的 研究還鮮有見到,宏觀經(jīng)濟政策制定者對 此也重視不夠,而這正是本綜述的目的和 — 58 — 意義所在。

二、大數(shù)據(jù)對宏觀經(jīng)濟分析的革命性意義
大數(shù)據(jù)開啟了巨大的時代轉型,就宏 觀經(jīng)濟分析而言,大數(shù)據(jù)時代帶來的轉變 是重大且具有革命意義的。首先,大數(shù)據(jù) 極大地拓寬了信息來源。大數(shù)據(jù)時代的重 大變化是海量的可得數(shù)據(jù)。傳統(tǒng)經(jīng)濟分析 依靠的數(shù)據(jù)主要是樣本, 而在大 數(shù) 據(jù) 時 代,得到的數(shù)據(jù)可能就是總體本身,例如 就物價而言,每一筆在電子商務網(wǎng)站成交 的交易信息都能記錄在案。大而全的可得 數(shù)據(jù)對宏觀經(jīng)濟分析是極其重要的 ,可以 準確了解宏觀經(jīng)濟形勢,正確做出宏觀經(jīng) 濟發(fā)展預測,合理制定宏觀經(jīng)濟政策。這 些優(yōu)勢是傳統(tǒng)經(jīng)濟分析方法無法想象和實 現(xiàn)的。 其次,大數(shù)據(jù)時代信息獲得的速度大 大提高,很多信息實時可得。傳統(tǒng)的經(jīng)濟 分析主要依靠結構化數(shù)據(jù),這些數(shù)據(jù)最明 顯的缺陷就是具有很強的時滯性。 例如, 政府公布的季度 GDP 往往會有 1 個月的 滯后期,而反映全面經(jīng)濟社會狀況的統(tǒng)計 年鑒的滯后期會達到 3 個月左右,這對及 時了解宏觀經(jīng)濟形勢、預測與預警都是非 常不利的。大數(shù)據(jù)時代信息產(chǎn)生和傳遞的 速度空前加快,如互聯(lián)網(wǎng)上的大量信息是 實時的,移動互聯(lián)網(wǎng)和物聯(lián)網(wǎng)使每個人隨 時隨地都可能制造數(shù)據(jù)。大數(shù)據(jù)經(jīng)濟模型 可以充分利用數(shù)據(jù)的實時性,提高分析或 預測的時效性,為經(jīng)濟預警和政策制定提 供最快速的資料和依據(jù)。 第三,大數(shù)據(jù)帶來宏觀經(jīng)濟分析的方 法論變革。傳統(tǒng)的經(jīng)濟計量模型建立在抽 樣統(tǒng)計學的基礎上,以假設檢驗為基本模 式。隨著信息量的極大拓展和處理信息能

學 科 前 沿 力的極大提高,經(jīng)濟分析可能從樣本統(tǒng)計 時代走向總體普查時代。這一點對宏觀經(jīng) 濟分析意義重大,因為宏觀經(jīng)濟系統(tǒng)紛繁 復雜,如果能將對整體宏觀經(jīng)濟變量的分 析建立在盡可能多的關于經(jīng)濟主體行為的 信息以及其他諸多經(jīng)濟變量的信息的基礎 上,甚至拋棄原有的假設檢驗的模式 ,無 疑將會極大地提高宏觀經(jīng)濟分析的準確性 和可信度。同時,經(jīng)典計量模型以因果檢 驗為核心,而大數(shù)據(jù)分析則往往將相關性 發(fā)掘作為首要任務。在復雜的宏觀經(jīng)濟系 統(tǒng)中,當許多宏觀經(jīng)濟中的因果關系往往 難以準確檢驗、 因果結論經(jīng)常廣 受 質 疑 時,更重視可靠相關關系的發(fā)掘,充分利 用相關關系對于經(jīng)濟預測、政策制定與評 估的作用,無疑為宏觀經(jīng)濟分析打開了另 一片廣闊的空間。正因為如此,維克托· 邁爾 - 舍 恩 伯 格 ( Victor Mayer - Schonberger ) 與 肯 尼 思 · 庫 克 耶 ( Kenneth Cukier) 認為建立在相關關系分析基礎上 的預測是大數(shù)據(jù)的核心。 第四,大數(shù)據(jù)促進了宏觀經(jīng)濟分析技 術的革新。傳統(tǒng)的分析技術基于關系型宏 觀經(jīng)濟數(shù)據(jù),而分析模型主要基于統(tǒng)計數(shù) 據(jù),而大數(shù)據(jù)中的大量信息是非 結 構 化 的,數(shù)據(jù)的來源和形式復雜多樣。如互聯(lián) 網(wǎng)信息包 含 文 本、 圖 片、 影 音 等 多 種 形 式,在此狀況下進行宏觀經(jīng)濟分析,有必 要借鑒計算機領域已經(jīng)出現(xiàn)、但在現(xiàn)有經(jīng) 濟領域還少有應用的數(shù)據(jù)處理技術 ,例如 機器學習。機器學習已經(jīng)在圖像識別、語 音識別、自然語言處理、智能機器人等領 域取得了巨大成功,是當前進行大數(shù)據(jù)分 析的基本手段。此類技術在宏觀經(jīng)濟領域 的應用會極大地提高經(jīng)濟分析的能力 ,改 進分析結果、提升分析價值。另外,傳統(tǒng) 的經(jīng)濟計量對海量數(shù)據(jù)難以分析 ,發(fā)展適 合大數(shù)據(jù)的分析模型是經(jīng)濟計量面臨的重 ④ 大挑戰(zhàn)。 國際學術界和宏觀經(jīng)濟政策制定者已 經(jīng)意識到大數(shù)據(jù)對宏觀經(jīng)濟分析的革命性 影響,將大數(shù)據(jù)的概念、方法、技術和宏 觀經(jīng)濟分析結合起來的做法正逐步得到重 視,一些意義深遠的研究工作逐步興起。 綜合起來看,這些研究主要集中在宏觀經(jīng) 濟數(shù)據(jù)挖掘、宏觀經(jīng)濟預測、宏觀經(jīng)濟分 析技術和宏觀經(jīng)濟政策四個領域 。

三、宏觀經(jīng)濟數(shù)據(jù)挖掘
數(shù)據(jù)挖掘正在成為一個熱門行業(yè) 。簡 單地說,數(shù)據(jù)挖掘就是大數(shù)據(jù)時代的統(tǒng)計 調查。隨著互聯(lián)網(wǎng)信息技術的逐步發(fā)展, 獲取的數(shù)據(jù)種類越來越多,數(shù)量越來越龐 大,更新速 度 越 來 越 快, 數(shù) 據(jù) 中 有 大 量 “噪聲” 存在。 顯然, 傳統(tǒng)的統(tǒng)計調查方 法不能適應大數(shù)據(jù)時代信息收集的需要, 比如在內容形式上,互聯(lián)網(wǎng)上的諸多信息 是以多媒體方式存在的,統(tǒng)計調查無從下 手; 面對海量信息,統(tǒng)計調查速度慢,效 率低。因此,充分依靠計算機進行信息收 集的各種新技術應 運 而 生, 被 稱 為 “數(shù) 。數(shù)據(jù)挖掘多在利用網(wǎng)絡爬蟲軟 據(jù)挖掘” 件的基礎上建立機器學習模型。其過程一 般包括: 先利用網(wǎng)絡爬蟲軟件將原始信息 從網(wǎng)上抓取下來; 然后通過一定方法對這 些數(shù) 據(jù) 進 行 清 洗, 將 大 量 內 容 無 用 的 “噪聲” 過濾掉, 保留值得加工的信息; 最后對剩下的內容進行加工提取 ,并轉化 為一定程度結構化的可用數(shù)據(jù),如標準化 為時間序列等。這一過程已經(jīng)成為大數(shù)據(jù) 方法中的標準程序之一。從宏觀經(jīng)濟分析 的角度,根據(jù)信息來源的種類,數(shù)據(jù)挖掘 大體可分為兩類。 — 59 —

國外理論動態(tài)·2015 年第 1 期 第一類是對數(shù)量信息的收集整理 。這 一類工作要解決的問題是信息來源量大面 廣和快速更新的問題,比如麻省理工學院 10 億價格項目 ” ( The Billion Prices 的“ Project , BPP ) 。 研究團隊在經(jīng)濟學家阿 爾伯托 · 卡瓦洛 ( Alberto Cavallo ) 和羅 伯托·瑞格本 ( Roberto Rigobon ) 的帶領 下,通過 “網(wǎng)絡抓取技術 ” ( web scraping) ,利用網(wǎng)上購物交易數(shù)據(jù)計算日常通 脹指數(shù), 收 集 世 界 來 自 70 個 國 家、300 個零售商、 共 500 萬種在線商品的價格, 建立了通脹指數(shù)的日發(fā)布系統(tǒng)。相比傳統(tǒng) CPI 的月發(fā)布機制 ,“ 10 億價格項目 ” 僅 3 , 有 天的滯后期 幾乎實現(xiàn)了通貨膨脹的 實時預測。 第二類是對非數(shù)量信息的收集整理。 比如如何從文本、圖片、視頻等素材中挖 掘出結構化、數(shù)量化的信息。這類工作除 了要解決前述問題,還面臨將非結構化數(shù) 據(jù)轉化為結構化數(shù)據(jù)這一更困難的艱巨任 務。對一項典型的文本數(shù)據(jù)挖掘 工 作 而 言,假定任務是從日常的新聞報道中挖掘 出媒體對經(jīng)濟的信心指數(shù),那么基本過程 ⑤ 包括四步。 第一步是選取部分文本, 請 專業(yè)人士進行標注以便分類,如可分類為 “樂觀、中性、 悲觀 ” 三類, 同一個文本 可由三人分別標記,然后采取一定方法來 計算語料標注的一致性,只有通過,方能 被用于觀點分類。第二步是對文本進行特 征抽取和選擇,特征抽取方法包括基于規(guī) 則的特征抽取和基于統(tǒng)計的特征抽取 。第 三步是在特征抽取信息的基礎上建立分類 器,可同時考慮來源單位、作者身份、文 本性質這三類信息,對已標注文本通過機 器學習 ( 如采用支持向量機算法 ) 建立 分類器。第四步是將此分類器應用于分類 未標注文本,并將分類結果轉化為時間系 — 60 — 列數(shù)據(jù)。 數(shù)據(jù)挖掘是在借鑒眾多領域研究思想 的基礎上逐步發(fā)展的,借鑒了統(tǒng)計學的抽 樣估計、 人工智能和機器學習的 搜 索 算 法、建模技術和學習理論,還借鑒了信息 論、最優(yōu)化、可視化、信號處理和信息檢 索等思想。目前廣為接受的數(shù)據(jù)挖掘處理 模型是法耶德 ( Usama Fayyad) 等人設計 的多處理階段模型。 利用該模型 數(shù) 據(jù) 挖 掘,意在集中尋求數(shù)據(jù)挖掘過程中的可視 化方法,便于人機交互; 利用該模型也可 以增強對多媒體數(shù)據(jù)、文本數(shù)據(jù)和圖像數(shù) 據(jù)等各種非結構化或半結構化數(shù)據(jù)挖掘的 準確性。

四、大數(shù)據(jù)與宏觀經(jīng)濟預測
大數(shù)據(jù)時代信息的實時和快速為及時 高效的預測提供了可能,信息的規(guī)模龐大 為準確合理的預測提供了機會。大數(shù)據(jù)背 景下的宏觀經(jīng)濟預測將更加有效 、實用。 國際上利用大數(shù)據(jù)進行經(jīng)濟分析與預 測取得了一定的進展。BPP 項目利用網(wǎng)上 購物交易數(shù)據(jù)計算日常通脹指數(shù)。 例如, BPP 的數(shù)據(jù)顯示, 在雷曼兄弟公司 2008 年 9 月倒閉后,大部分美國企業(yè)幾乎立刻 開始 削 減 價 格, 這 表 明 總 需 求 已 經(jīng) 減 ⑥ 弱。 相比之下, 官方通脹機構公布的數(shù) 據(jù)直到當年 11 月,即在 10 月 CPI 數(shù)據(jù)公 布后,才對 通 貨 緊 縮 有 所 反 應。 崔 玄 英 ( Hyunyoung Choi ) 和瓦里安 ( Hal Varian ) 介紹了谷歌趨勢( Google Trends ) 如何可以 用來為預測當前經(jīng)濟變量服務,發(fā)現(xiàn)失業(yè) 和相關福利的搜索可以提高對于失業(yè)救濟 ⑦ 首次申請時間的 預 測。 阿 斯 基 達 斯 ( N. Askitas ) 和 齊 默 爾 曼 ( K. F. Zimmermann) ⑧ 、 阿穆里 ( F. D'Amuri ) ⑨ 以 及 蘇 霍

學 科 前 沿
瑠 瑏 依( T. Suhoy) ? 也發(fā)現(xiàn), 互聯(lián)網(wǎng)搜索可以 預測德國、意大利和以色列有關勞動力市 場的狀況。 崔 玄 英 和 瓦 里 安 以 及 吳 ( L. Wu) 和布林約爾松 ( E. Brynjolfsson ) 發(fā)現(xiàn),

與住房有關的搜索可以改善傳統(tǒng)模式對美 瑡 瑏 ? 國住房銷售的預測。 韋博( G. K. Webb) 認 , “止贖權” 的檢索次數(shù)和取消抵押品 為 贖回權的實際數(shù)目是美國住房市場問題的 瑢 瑏 ? 一個早期預警。 麥凱倫( N. McLaren) 和山 波霍格 ( R. Shanbhogue ) 檢 驗 了 在 線 搜 索 對英國就業(yè)和住房市場預測活動的重要 性,指出包含因特網(wǎng)搜索的模型提高了預 瑣 瑏 ? 測效果。 利用大數(shù)據(jù)對宏觀經(jīng)濟進行預測最重 要的方面當屬宏觀經(jīng)濟的現(xiàn)時預測 ( now casting ) !艾F(xiàn)時預測” 一詞最初源于氣象 學領域,是針對現(xiàn)在已經(jīng)發(fā)生的事可能因 為信息獲取困難等原因難以直接知道準確 情況,因而根據(jù)可得信息來進行推測。比 如對 宏 觀 經(jīng) 濟 而 言, 在 月 底 估 測 本 月 GDP 總量是現(xiàn)時預測, 因為 “本月 GDP 是多少” 這件事已 經(jīng) 發(fā) 生 了, 只 是 我 們 還不能馬上拿到相關數(shù)據(jù)。因為信息技術 的發(fā)展導致大量實時信息容易采集 ,崔玄 英和瓦里安強調應充分利用大數(shù)據(jù)方法為 經(jīng)濟現(xiàn)象的現(xiàn)時預測服務。目前對宏觀經(jīng) 濟的判斷依賴于各種統(tǒng)計調查系統(tǒng)發(fā)布的 統(tǒng)計數(shù)據(jù),但面臨的最大困難之一便在于 關于宏觀經(jīng)濟統(tǒng)計的數(shù)據(jù)滯后太多 ,基于 此統(tǒng)計進行的預測甚至被認為助長了宏觀 經(jīng)濟波動。大數(shù)據(jù)時代大量實時數(shù)據(jù)的產(chǎn) 生,為更快捷地估測宏觀經(jīng)濟提 供 了 可 能,大數(shù)據(jù)理論與方法的發(fā)展則為現(xiàn)時預 測提供了新的條件。 大數(shù)據(jù)也使得宏觀經(jīng)濟預測模型產(chǎn)生 了變化。傳統(tǒng)的經(jīng)濟預測往往通過建立時 間序列、截面或面板方程等幾個模型來進

行,變量的完整被認為是不可能的。由于 模型變量選擇、參數(shù)設置、估計方法以及 滯后期選擇等的不同,預測結果會產(chǎn)生很 大的偏差。大數(shù)據(jù)時代可以應用大量模型 進行研究,并應用完備的數(shù)據(jù)信息,這對 預測模型的改進提出了挑戰(zhàn),同時提高了 預測的準確性。 麥凱倫和山波霍格指出,大數(shù)據(jù)對分 析預測意想不到的事情也是特別有幫助 的。例如經(jīng)濟形勢的變更、暫時的工廠關 閉和罷工等,傳統(tǒng)的調查數(shù)據(jù)須根據(jù)預定 的問題進行收集,而大數(shù)據(jù)時代搜索數(shù)據(jù) 更靈活,可用于評估這些特殊情況,對宏 瑤 瑏 ? 觀經(jīng)濟進行合理預測。

五、大數(shù)據(jù)分析技術與宏觀經(jīng)濟分析
人類對大數(shù)據(jù)特別是結構化的、甚至 看似雜亂無章的海量數(shù)據(jù)的分析能力的大 大加強,有賴于機器學習 ( machine learning) 算法的迅速發(fā)展。 簡單地說, 機器 學習就是讓計算機經(jīng)過 “訓練 ” 在輸入 變量和 輸 出 變 量 間 建 立 起 某 種 “最 佳 ” , 是指把輸入 的匹配關系。 所謂 “訓練 ” 和輸出信息都已知的樣本輸入計算機 ,然 后根據(jù)一定的算法,由計算機生成由輸入 。 “機器” 能夠 變量預測輸出變量的方法 伴隨計算、運行次數(shù)的增多,通過學習逐 步自我提高和改善,使挖掘和處理更為準 確。機器學習的主要算法包括線性模型、 拓展的線性模型、 決策樹、 支持向量機、 人工神經(jīng)網(wǎng)絡、自組織映射網(wǎng)絡、遺傳算 法等等,并仍在蓬勃發(fā)展。機器學習已經(jīng) 在圖像識別、 語音識別、 自然語言處理、 智能機器人等諸多領域取得了巨大成功, 是當前進行數(shù)據(jù)挖掘和大數(shù)據(jù)分析的基本 手段。大數(shù)據(jù)推動數(shù)據(jù)的分析向機器學習 — 61 —

國外理論動態(tài)·2015 年第 1 期 方向發(fā)展。從根本上講,機器學習力圖通 過計算機模擬或實現(xiàn)人類的學習行為來獲 取新的知識或技能,并且重新組織已有的 知識結構使之不斷改善。宏觀經(jīng)濟分析也 必然會成為機器學習模型的重要消費者; 同時,宏觀經(jīng)濟研究分析的需要也必然會 反過來促進機器學習方法的進一步改進和 發(fā)展。 在宏觀 經(jīng) 濟 模 型 中, 通 過 大 數(shù) 據(jù) 挖 掘,可得解釋變量會大大增加,因此研究 中會出現(xiàn)高維數(shù)據(jù)問題, 即因可 得 信 息 “過多” ,往往會出現(xiàn)和被解釋變量 ( 如 GDP) 相關的解釋變量數(shù)量過多, 產(chǎn)生所 謂的 “維數(shù)災難 ” ( curse of dimensionality) 。如在線性回歸問題 Y = Xβ + ε 中,其 中 Y 為 GDP,X ( 向量) 為可得的解釋變 量。樣本為時間系列,其數(shù)量受限于可得 的時間間隔數(shù), 當 X 中的解釋變量數(shù)大 于樣本數(shù)時,無法用最小二乘法得到系數(shù) β 的估計。目前機器學習理論中對此問題 已 有 不 少 方 法, 采 用 最 多 的 是 LASSO ( Least Absolute Shrinkage and Selection Operator) 算法。 這種算法可直觀理解為在最小二乘法 基礎上,增加一個懲罰項 λ ‖ β ‖1 。 通過 懲罰項的引入, LASSO 可 以 對 一 些 次 要 變量賦予系數(shù)為 0 , 同時實現(xiàn)對變量的選 擇。 “高維” 數(shù)據(jù)問題已經(jīng)成為當前經(jīng)濟 計量模型研究中的一個前沿和熱點領域。 處理高維數(shù)據(jù)能力的提升將大大增強大數(shù) 據(jù)對宏 觀 經(jīng) 濟 分 析 的 意 義, 使 得 “大 ” 。 另外, 基于大數(shù)據(jù)的 成為有用之 “大 ” 社會網(wǎng)絡和社會計算等其他分析技術也在 蓬勃發(fā)展,并在大數(shù)據(jù)宏觀經(jīng)濟分析方面 有著重要的應用前景。

六、大數(shù)據(jù)與宏觀經(jīng)濟政策制定
大數(shù)據(jù)革命為政府的宏觀經(jīng)濟政策制 定提供了機會。政府在政策制定上可以通 過大數(shù)據(jù)分析系統(tǒng)提升公共服務質量 ,增 加服務種類,并為公共服務提供更好的政 策指導。同時,在大數(shù)據(jù)分析的運用、提 高效率、與其他政策和技術協(xié)同以及為公 共服務領域帶來變革等方面,政府可以加 大重視和投入力度,為經(jīng)濟的進一步發(fā)展 提供支持。 大數(shù)據(jù)給政府的經(jīng)濟統(tǒng)計工作帶來了 巨大影響。首先,面對大數(shù)據(jù)帶來的技術 變革,政府應該將其納入政府統(tǒng)計之中。 經(jīng)濟統(tǒng)計要充分利用大數(shù)據(jù)時代提供的技 術和條件,促進政府統(tǒng)計工作的變革。例 10 億價格項目 ” 便是政府應對大數(shù) 如“ 據(jù)變革的成功典范。其次,面對大數(shù)據(jù)帶 來的統(tǒng)計對象擴充,政府不但應當重視結 構化數(shù)據(jù), 更應當重視挖掘非結 構 化 數(shù) 據(jù),以期找尋出恰當?shù)慕?jīng)濟統(tǒng)計指標 。大 數(shù)據(jù)時代,非結構化數(shù)據(jù)包含更多信息, 而且利用互聯(lián)網(wǎng)進行的數(shù)據(jù)挖掘 ,不僅可 以得到數(shù)字資源,文本數(shù)據(jù)也可以通過挖 掘獲得。第三,面對大數(shù)據(jù)帶來的統(tǒng)計資 源的拓展,政府應該將其統(tǒng)計資源拓展到 政府以外,重視拓寬其他數(shù)據(jù)資源。在過 去,政府靠自己的力量收集數(shù)據(jù),但在大 數(shù)據(jù)時代, 人 人 都 是 數(shù) 據(jù) 的 制 造 者。 例 如,谷歌和百度等數(shù)據(jù)巨頭擁有大量政府 無法獲取的數(shù)據(jù)資源。政府要想辦法讓數(shù) 據(jù)巨頭將數(shù)據(jù)放到統(tǒng)計中來,而不能僅靠 自己調查統(tǒng)計。西方國家已經(jīng)重視利用大 數(shù)據(jù)來提高宏觀經(jīng)濟政策的決策性 ,美國 和澳大利亞就是成功的典范。 2012 年 3 月, 美國奧巴馬政府推出

— 62 —

學 科 前 沿 “大數(shù)據(jù)研究和發(fā)展計劃 ” , 涉及美國國 家科學基金、 國家衛(wèi)生研究院、 能源部、 國防部、國防部高級研究計劃局、地質勘 探局等 6 個聯(lián)邦政府部門。政府承諾投資 超兩億美元,大力推動和改善與大數(shù)據(jù)相 關的收集、組織和分析,以推進從巨大而 復雜的數(shù)據(jù)集合中獲取信息的能力 。美國 普查局在將大數(shù)據(jù)與統(tǒng)計調查相結合方面 也走在了前列。2012 年, 美國普查局向 公眾開放了普查應用程序接口,通過軟件 開發(fā)商專門設計了網(wǎng)絡和移動應用程序, 用戶可通過手機 APP 對人口、 社會普查 數(shù)據(jù)下載使用。 在 2020 年的普查中, 美 國普查局計劃采取 “網(wǎng)絡抓取技術 ” 等 多模式進行數(shù)據(jù)收集。美國未來試圖實現(xiàn) 企業(yè)數(shù)據(jù)與普查、 調查數(shù)據(jù)的全面融合, 提高統(tǒng)計調查的效率和質量。 澳大利亞大數(shù)據(jù)政策由澳大利亞信息 管理辦公室于 2013 年 8 月正式提出方案, 并對與之相關的政府部門進行了界定 ,對 涉及相關隱私和安全的內容進行了闡述。 目前,一系列大數(shù)據(jù)的試點項目 已 經(jīng) 展 開。這些試點將對大數(shù)據(jù)工作組和澳大利 亞政府數(shù)據(jù)分析重點科研中心 ( 隸屬于 澳大利亞稅務局) 提供支撐。 于進一步更新。在大數(shù)據(jù)時代,可以將機 器學習算法引入宏觀經(jīng)濟分析,改進宏觀 , 提高 經(jīng)濟分析技術, 解決 “維數(shù)災難 ” 宏觀經(jīng)濟分析的準確性。大數(shù)據(jù)也將促進 政府經(jīng)濟政策制定的變革,提升政策的時 效性,提高政府服務效率。 與西方國家相比,中國目前在利用大 數(shù)據(jù)進行宏觀經(jīng)濟分析方面尚顯薄弱 ,工 作尚待加強。為了在大數(shù)據(jù)時代更好地發(fā) 展經(jīng)濟,應該挖掘更多的宏觀經(jīng)濟數(shù)據(jù)資 源,實現(xiàn)計算機實時在線數(shù)據(jù)收集,盡快 建立基于大數(shù)據(jù)的宏觀經(jīng)濟分析模型 ,開 發(fā)大數(shù)據(jù)上線軟件,以盡早完成基于大數(shù) 據(jù)的宏觀經(jīng)濟預測分析系統(tǒng),為宏觀經(jīng)濟 提供更及時、更準確的預測,為中國經(jīng)濟 發(fā)展做出貢獻。 第一,政府和相關研究機構應該加大 投入,開展相關科研或立項,為大數(shù)據(jù)與 宏觀經(jīng)濟分析的研究提供環(huán)境和宏觀層面 的支持。特別是跨學科領域,目前正需要 信息技術和經(jīng)濟學相關領域學者的合作, 國家要采取措施創(chuàng)造合作的機會 。 第二, 決 策 者 應 加 快 步 伐, 搭 建 平 臺,充分利用大數(shù)據(jù)服務于宏觀經(jīng)濟政策 的制定。決策者要明確大數(shù)據(jù)帶來的機會 和挑戰(zhàn),摒棄舊俗,加快相關改革,更新 觀念,整合 資 源, 跟 進 大 數(shù) 據(jù) 時 代 的 步 伐,開發(fā)新技術,探討新理論,及時應用 大數(shù)據(jù)與宏觀經(jīng)濟分析的研究成果改善宏 觀經(jīng)濟政策。 第三,科學合理的預測模型是經(jīng)濟政 策合理的基礎,中國應盡快建立一批基于 大數(shù)據(jù)的宏觀經(jīng)濟分析和預測模型 ,開發(fā) 大數(shù)據(jù)預測上線軟件,使宏觀經(jīng)濟預測更 早、更及時、更準確。 第四,應加強大數(shù)據(jù)與宏觀經(jīng)濟相關 方面的學科與專業(yè)教育,建立經(jīng)濟數(shù)據(jù)分 — 63 —

七、結論與建議
大數(shù)據(jù)時代極大地拓寬了信息來源、 提高了獲取信息的時效性,同時,新信息 的非結構化對宏觀經(jīng)濟分析的技術和方法 提出了新的要求。在大數(shù)據(jù)背景下,由于 數(shù)據(jù)噪聲的存在,宏觀經(jīng)濟數(shù)據(jù)挖掘變得 十分重要,這就要改進技術,加強對非結 構化和半 結 構 化 數(shù) 據(jù) 的 挖 掘。 實 時、 快 速、海量的數(shù)據(jù)為更加準確的宏觀經(jīng)濟預 測提供了可能,宏觀經(jīng)濟預測模型也有待

國外理論動態(tài)·2015 年第 1 期 析新專業(yè),培養(yǎng)相關人才! 注 釋
tier ” , Bank of Canada Review, Summer 2013 , pp. 32 - 39. , “The Impact of Big Data on Data Analyt② Julie Lockner ,http: / / ibmdatamag. com /2012 /02 / the - impact ics” - of - big - data - on - data - analytics / , 2012. ③ Victor Mayer - Schonberger ,Kenneth Cukier,Big Data : A Revolution that Will Transform How we Live,Work and Think,London: John Murray, 2013. ④ Guido Imbens,T. Barrios,Rebecca Diamond and M. Kolesar,Clustering,Spatial Correlations and Randomization Inference,Harvard University, 2011. ⑤ Navjeet Kaur ,Jyoti Kiran,Natural Language Processing, Germany: LAP Lambert Academic Publishing, 2012. ,“A Billion Prices Now” ,The New York⑥ J. Surowiecki er, 30 May, 2011. ⑦ Hyun Young Choi,Hal Varian. Predicting the present with Google Trends. Technical report,Google,URL http : / / google. com / googleblogs / pdfs / google _predicting 2009 ; “Predicting the present with _the present. pdf, google trends. Economic Record ” ,URL http: / / people. ischool. berkeley. edu / ~ hal / Papers /2011 / ptp. pdf. Forthcoming, 2012. ,“Google Econometrics ⑧ N. Askitas,K. F. Zimmermann and Unemployment Forecasting ” , Applied Economics Quarterly, 55 ( 2 ) , 2009 ,pp. 20 - 107. ,“Predicting Unemployment in Short Sam⑨ F. D'Amuri ples with Internet Job Search Query Data” , Munich PerNo. 18403 , 2009. sonal Repec Archive Paper, ,“Query Indices and a 2008 Downturn: Israeli ? 瑏 瑠 T. Suhoy Data” ,Bank of Israel Discussion Paper No. 2006 - 2009. ,“Using Search Engine ? 瑏 瑡 Hyunyoung Choi,Hal Varian Data for Nowcasting - An Illustration ” , In Actes des Rencontrees Economiques; Aix - en - Provence, FRANCE,Recontres Economiques d'Aix - en - Provence,LeCercle des economists,http: / / www. lecercledeseconomistes. asso. fr / IMG / pdf / Actes _ Rencontres _ Economiques_d_Aix - en - Provence_2011. pdf,2011. L. Wu,E. Brynjolfsson ,“The Future of Prediction: How Google Searches Foreshadow Housing Prices and Quantities” ,Thirtieth International Conference on Information System,Phoenix 2009 ,pp. 1 - 14. ,“Internet Search Statistics as a Source of ? 瑏 瑢 G. K. Webb Business Intelligence: Searches on Foreclosure as an Es,Issues in Informatimate of Actual Home Foreclosures” 10 ( 2 ) , 2009 , pp. 82 - 87. tion Systems, ,,“Using Internet Search ? 瑏 瑣 N. McLaren,R. Shanbhogue Data as Economic Indicators ” ,Bank of England Quar2011 ,pp. 134 - 140. terly Bulletin,Q2 , T. Hastie, R. Tibshirani, The Elements of ? 瑏 瑤 J. Friedman, 2008. Statistical Learning,New York: 2ed,Springer,

, “Big Data Analysis: The Next Fron① Nii Ayi Armah

[ 劉濤雄: 清華大學經(jīng)濟學研究所; 徐曉 飛: 清華大學經(jīng)濟學研究所]

( 責任編輯 宋陽旨)

— 64 —



  本文關鍵詞:大數(shù)據(jù)與宏觀經(jīng)濟分析研究綜述,由筆耕文化傳播整理發(fā)布。



本文編號:150234

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/jingjilunwen/hongguanjingjilunwen/150234.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權申明:資料由用戶b36be***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com