“大數(shù)據(jù)”熱潮下人文地理學(xué)研究的再思考
本文關(guān)鍵詞:“大數(shù)據(jù)”熱潮下人文地理學(xué)研究的再思考,由筆耕文化傳播整理發(fā)布。
“大數(shù)據(jù)”熱潮下人文地理學(xué)研究的再思考 8734字 投稿:金犱犲
全文8頁(yè) 共8734字
絲綢之路的概念談到“絲綢之路”,我們首先應(yīng)該了解它的歷史事實(shí),同時(shí)需要了解古代產(chǎn)生這么一條“絲綢之路”的原因,這與當(dāng)時(shí)的歷史條件關(guān)系密切。馬克思?xì)v史唯物論有一個(gè)基本的概念:任何一種文化、思想,包括宗教、政治、科學(xué)活動(dòng),它的基礎(chǔ)都是當(dāng)時(shí)人們的吃喝住穿,…
修訂日期:2015-01-07DOI:10.11821/dlxb2015060011引言縱觀歷史,任何一個(gè)國(guó)家的崛起都會(huì)給全球穩(wěn)定和地緣格局帶來影響[1]。而大國(guó)間的爭(zhēng)霸與興衰更替,無不受地緣法則的支配。冷戰(zhàn)結(jié)束以來,隨著中國(guó)等新興國(guó)家的迅速發(fā)展,國(guó)…
修訂日期:2015-04DOI:10.11820/dlkxjz.2015.04.0021引言數(shù)據(jù)與信息收集是科學(xué)研究和政府以及企業(yè)決策重要環(huán)節(jié)。自IT技術(shù)發(fā)展以來,人們獲取數(shù)據(jù)的技術(shù)一日千里,同時(shí)全球各行各業(yè),各個(gè)領(lǐng)域?qū)τ跀?shù)據(jù)的依賴性也大幅度提高。特…
等的《“大數(shù)據(jù)”時(shí)代:生活、工作與思維方式的大變革》中,特別指出信息時(shí)代的“大數(shù)據(jù)”正在開啟一次重大的時(shí)代轉(zhuǎn)型,帶來了生活、工作與思維的大變革[1]。與此同時(shí),,“大數(shù)據(jù)”所蘊(yùn)含的科學(xué)研究?jī)r(jià)值也吸引了眾多學(xué)者的關(guān)注和重視。“大數(shù)據(jù)”已經(jīng)發(fā)展為重要的研究領(lǐng)域,并成為許多學(xué)科的熱點(diǎn)與主流[2,3]。2008年9月4日Nature雜志專門推出“大數(shù)據(jù)”的專刊,凸顯“大數(shù)據(jù)”在各領(lǐng)域的研究與應(yīng)用價(jià)值[4]。雖然,已有不少關(guān)于“大數(shù)據(jù)”與社會(huì)發(fā)展之間關(guān)系的深刻討論[5-7],但較少涉及“大數(shù)據(jù)”與人文地理學(xué)研究之間的關(guān)系,特別是對(duì)于“大數(shù)據(jù)”與“大數(shù)據(jù)”背后的空間內(nèi)容、空間進(jìn)程間的關(guān)系。在人文地理學(xué)領(lǐng)域,帶有地理空間信息的“大數(shù)據(jù)”直到最近才開始受到人文地理學(xué)者的關(guān)注[8]。
“大數(shù)據(jù)”,可以理解為信息時(shí)代背景下社會(huì)科學(xué)研究可能出現(xiàn)的新范式,是區(qū)別于傳統(tǒng)的基于“小數(shù)據(jù)”的研究范式。在傳統(tǒng)范式下,研究起源于問題發(fā)現(xiàn),基于問題再收集相關(guān)數(shù)據(jù)。但由于時(shí)間和經(jīng)費(fèi)的限制,數(shù)據(jù)收集往往限制在小范圍內(nèi)的抽樣調(diào)研。雖然數(shù)據(jù)的規(guī)模有限,但都是針對(duì)于研究問題,并經(jīng)過分析回應(yīng)相應(yīng)的研究假設(shè)。而在新的范式下,研究可能起源于數(shù)據(jù)。由于獲取數(shù)據(jù)的便利性,往往盡可能多地收集所有不同類型的數(shù)據(jù),進(jìn)而去尋找數(shù)據(jù)間的相關(guān)性或客觀存在的規(guī)律,以期待回答未知的研究問題。人文地理學(xué),作為研究社會(huì)經(jīng)濟(jì)空間組織和人地關(guān)系的一門學(xué)科,一直以來注重對(duì)空間的思考。隨著帶有地理空間信息的數(shù)據(jù)成為“大數(shù)據(jù)”的重要組成部分,基于“大數(shù)據(jù)”的空間分析給人文地理學(xué)研究帶來了新的發(fā)展機(jī)遇,并引發(fā)了近期人文地理學(xué)研究的“大數(shù)據(jù)”熱潮[9]。
1.1 “大數(shù)據(jù)”的定義、特征與類型
總的來看,當(dāng)前仍然沒有形成對(duì)“大數(shù)據(jù)”統(tǒng)一的定義。早在17世紀(jì),哲學(xué)家們使用“數(shù)據(jù)”這一詞匯,專指真實(shí)的、反映事實(shí)的相關(guān)信息[9]。長(zhǎng)期以來,研究過程中的“數(shù)據(jù)”指的是依據(jù)某些傳統(tǒng)調(diào)研方法(例如:?jiǎn)柧、訪談、日志等)收集的信息,以及這些信息所抽象表達(dá)出來的意義。進(jìn)入20世紀(jì)80年代,信息通信技術(shù)的進(jìn)步改變了人類的生活方式,加速了信息的存儲(chǔ)、交換與計(jì)算過程。特別是互聯(lián)網(wǎng)的使用,遺留下大量的數(shù)據(jù)“痕跡”,而且產(chǎn)生的速度也是日益增倍。據(jù)Hilbert等的研究表明,僅2007年人類大約存儲(chǔ)了超過300EB的數(shù)據(jù),而人類存儲(chǔ)信息量的增長(zhǎng)速度比世界經(jīng)濟(jì)的增長(zhǎng)速度快4倍[10]。這一海量的數(shù)據(jù)被形象的稱為“大數(shù)據(jù)”,這一定義突出體現(xiàn)了數(shù)據(jù)規(guī)模大的特征。但是,“大”反映的是一個(gè)相對(duì)的數(shù)據(jù)規(guī)模增長(zhǎng)趨勢(shì),僅僅突出數(shù)據(jù)規(guī)模是遠(yuǎn)遠(yuǎn)不夠的,而且可能造成誤解。其實(shí),在“大數(shù)據(jù)”被關(guān)注之前,就已經(jīng)存在不少基于傳統(tǒng)調(diào)研方法的大樣本數(shù)據(jù)。因此,如何界定“大”非常困難。規(guī)模大只是“大數(shù)據(jù)”的一個(gè)特征,并且規(guī)模劃定的標(biāo)準(zhǔn)也會(huì)隨著技術(shù)的進(jìn)步與時(shí)間的積累而變化,不應(yīng)該是對(duì)“大數(shù)據(jù)”的定義。更要認(rèn)識(shí)到,“大數(shù)據(jù)”是區(qū)別于以往傳統(tǒng)數(shù)據(jù)的新的數(shù)據(jù)類型。
基于已有的研究成果[1,5,11,12],“大數(shù)據(jù)”的主要特征包括:①數(shù)據(jù)規(guī)模大,超過以往研究的數(shù)據(jù)規(guī)模,甚至超過當(dāng)前研究人員所能掌控的數(shù)據(jù)規(guī)模;②數(shù)據(jù)生產(chǎn)速度快,基于大量的智能終端設(shè)備及互聯(lián)網(wǎng),每分每秒都在產(chǎn)生并傳播海量的數(shù)據(jù)信息;③數(shù)據(jù)來源與類型多元化,缺乏一定的數(shù)據(jù)過濾與合成機(jī)制,既包含結(jié)構(gòu)型數(shù)據(jù)也有非結(jié)構(gòu)型數(shù)據(jù);④數(shù)據(jù)覆蓋面廣,由于互聯(lián)網(wǎng)的不斷普及,數(shù)據(jù)幾乎能夠涵蓋到所針對(duì)的所有人群代表;⑤數(shù)據(jù)細(xì)節(jié)豐富,且節(jié)約數(shù)據(jù)輸入、存儲(chǔ)、編譯的時(shí)間費(fèi)用;⑥數(shù)據(jù)間存在相關(guān)性,不同類型的數(shù)據(jù)之間存在一些方面的共性,從而能夠累計(jì)與整合不同的數(shù)據(jù)類型;⑦數(shù)據(jù)有彈性,既可以靈活鏈接其他的數(shù)據(jù)類型,也可以隨時(shí)增加數(shù)據(jù)規(guī)模;⑧數(shù)據(jù)的空間屬性,隨著位置感知設(shè)備、基于位置服務(wù)技術(shù)及其他相關(guān)技術(shù)的發(fā)展及應(yīng)用,越來越多的數(shù)據(jù)攜帶了地理位置信息;⑨數(shù)據(jù)來源不明晰,由于數(shù)據(jù)來自各個(gè)方面(個(gè)人或群體),缺乏對(duì)數(shù)據(jù)質(zhì)量和樣本抽取的控制。
簡(jiǎn)單來看,“大數(shù)據(jù)”可以大致劃分為三種類型:直接觀測(cè)型、自動(dòng)獲取型與自愿貢獻(xiàn)型。①直接觀測(cè)型主要是指由各種電子監(jiān)視器等(例如道路卡口攝像頭)直接觀測(cè)的數(shù)據(jù),往往針對(duì)某一特定地方或人(群)。②自動(dòng)獲取型數(shù)據(jù)是由于電子信息設(shè)備或相關(guān)網(wǎng)絡(luò)應(yīng)用程序的使用而自動(dòng)留下的網(wǎng)絡(luò)“痕跡”。例如網(wǎng)絡(luò)中留下的搜索與瀏覽記錄;網(wǎng)絡(luò)購(gòu)物留下的交易數(shù)據(jù)、快遞包裹留下的轉(zhuǎn)運(yùn)記錄;出租車GPS記錄的時(shí)空出行路線、智能公交卡記錄的上下車出行記錄;手機(jī)基站檢測(cè)得到的手機(jī)用戶位置、手機(jī)用戶間的通信記錄等。③自愿貢獻(xiàn)型數(shù)據(jù)是人們自愿在網(wǎng)絡(luò)上發(fā)布或分享的數(shù)據(jù),主要是社交網(wǎng)站上使用者的相互作用,例如社交網(wǎng)站簽到留下的時(shí)空數(shù)據(jù)、社交網(wǎng)站用戶的社交關(guān)系網(wǎng)絡(luò)、社交網(wǎng)站用戶的相關(guān)言論,以及Frickr等分享網(wǎng)站上游客上傳的照片信息等。
1.2 “大數(shù)據(jù)”為人文地理學(xué)研究帶來新機(jī)遇
“大數(shù)據(jù)”提供了豐富的、詳細(xì)的、實(shí)時(shí)的信息,有助于社會(huì)科學(xué)家更加全面、大尺度、精細(xì)化地研究各類社會(huì)科學(xué)問題,為社會(huì)科學(xué)研究提供了新范式的轉(zhuǎn)型機(jī)遇:即從數(shù)據(jù)缺乏到數(shù)據(jù)充裕,從靜態(tài)分析到動(dòng)態(tài)展現(xiàn),從單一研究假設(shè)與簡(jiǎn)單模型到復(fù)雜理論與模型。從實(shí)證主義來看,“大數(shù)據(jù)”為社會(huì)科學(xué)提供了計(jì)量革命的新契機(jī);“數(shù)據(jù)導(dǎo)向”的新范式將挑戰(zhàn)傳統(tǒng)社會(huì)科學(xué)研究基于歸納、演繹等程序的認(rèn)識(shí)論[13-16]?紤]到越來越多的“大數(shù)據(jù)”攜帶的地理空間屬性[17],無疑也為關(guān)注空間的人文地理學(xué)研究的發(fā)展提供了新的機(jī)遇。同時(shí),更加重要的是,在當(dāng)前社會(huì)科學(xué)空間轉(zhuǎn)向的大前提下,“大數(shù)據(jù)”為人文地理學(xué)在整個(gè)社會(huì)科學(xué)領(lǐng)域內(nèi)爭(zhēng)取更多的關(guān)注與重視提供了新的契機(jī)。
從人文地理學(xué)的發(fā)展歷程來看,“大數(shù)據(jù)”也契合了人文地理學(xué)“計(jì)量轉(zhuǎn)向”與“社會(huì)轉(zhuǎn)向”的發(fā)展規(guī)律。1950年代,得益于計(jì)算機(jī)處理數(shù)據(jù)能力的提升,人文地理學(xué)研究出現(xiàn)了“計(jì)量轉(zhuǎn)向”。數(shù)量模型的引入提供了空間研究的方法基礎(chǔ),避免了簡(jiǎn)單的、抽象的、定性的約束。特別是Schaefer等倡導(dǎo)地理學(xué)是一門追求普遍規(guī)律的實(shí)證主義科學(xué),并力圖借助數(shù)學(xué)模型等工具發(fā)現(xiàn)空間法則[18]。這一轉(zhuǎn)向引導(dǎo)了人文地理學(xué)與自然地理學(xué)走上不同的發(fā)展道路[19-21],數(shù)理理論的引入使人文地理學(xué)在社會(huì)科學(xué)研究中得到更多的承認(rèn)與聲譽(yù)。如今,“大數(shù)據(jù)”提供的大規(guī)模的、精細(xì)的、帶有地理空間屬性的信息無疑為人文地理學(xué)者挖掘空間規(guī)律(或是尋找相關(guān)性的客觀存在),回答未知的新問題提供了新機(jī)遇。既包括此前“小數(shù)據(jù)”難以發(fā)現(xiàn)的規(guī)律,也包括新數(shù)據(jù)類型(如微博數(shù)據(jù)、公交刷卡數(shù)據(jù)、出租車數(shù)據(jù)、手機(jī)通信數(shù)據(jù)等)可能發(fā)現(xiàn)的新研究問題。
進(jìn)入20世紀(jì)90年代,人文地理學(xué)出現(xiàn)了社會(huì)與文化的研究轉(zhuǎn)向,開始關(guān)注社會(huì)人、道德人和充滿個(gè)性的“個(gè)人”,而不僅僅是經(jīng)濟(jì)人或機(jī)械的人口數(shù)量[22-24]。政治、社會(huì)、文化等因素在塑造空間體系的作用得到重視,個(gè)體的價(jià)值觀、個(gè)性、情感、心理等要素開始被關(guān)注。基于個(gè)體記錄的“大數(shù)據(jù)”,為人文地理學(xué)研究提供了豐富的個(gè)體行為數(shù)據(jù),從而為人文地理學(xué)者構(gòu)建更加復(fù)雜的模型,動(dòng)態(tài)分析個(gè)體與地方以及個(gè)體之間的關(guān)系,描繪人地互動(dòng)的過程及格局提供了新的可能。特別是作為人口集聚的城市,“大數(shù)據(jù)”為動(dòng)態(tài)實(shí)時(shí)掌握城市發(fā)展和運(yùn)行的情況(例如:交通系統(tǒng)、基礎(chǔ)設(shè)施系統(tǒng)、自然環(huán)境等),為預(yù)防和解決城市問題提供了新的方法和手段。同時(shí),“大數(shù)據(jù)”也為人文地理學(xué)提供了涵蓋自然科學(xué)與社會(huì)科學(xué)的跨學(xué)科平臺(tái),從而可能為社會(huì)研究帶來創(chuàng)新的機(jī)遇,也有利于擴(kuò)大人文地理學(xué)的影響力。
2 “大數(shù)據(jù)”:新機(jī)遇下潛伏的危機(jī)與挑戰(zhàn)
“大數(shù)據(jù)”為人文地理學(xué)研究提供新機(jī)遇,帶來“大數(shù)據(jù)”的研究熱潮。但同時(shí),人文地理學(xué)者也不能忽視潛伏在這個(gè)學(xué)科未來發(fā)展中可能出現(xiàn)的危機(jī)與挑戰(zhàn),需要辯證的思考,具體反映在認(rèn)識(shí)論、方法與數(shù)據(jù)本身三個(gè)方面。
2.1 數(shù)據(jù)決定論:數(shù)據(jù)并不是知識(shí)
作為“大數(shù)據(jù)”的信奉者,Anderson在Wired Magzine的一篇評(píng)述中強(qiáng)調(diào)“大數(shù)據(jù)”可能帶來理論的終結(jié)(the end of theory)和傳統(tǒng)科學(xué)方法的過時(shí)(obsolescence of traditional methodology),因?yàn)閮H僅依靠“大數(shù)據(jù)”就足以直觀地了解所發(fā)生的各種現(xiàn)象,簡(jiǎn)單的數(shù)字就能表達(dá)一切(number speaks for themselves)[25]。在評(píng)述中,Anderson提到:“誰會(huì)明白人們?yōu)槭裁茨敲醋?重要的是他們做了什么。有了足夠多的詳?xì)數(shù)據(jù),研究人員就可以跟蹤和了解大家都在做什么;研究人員分析數(shù)據(jù)時(shí)不再需要前提假設(shè)和預(yù)測(cè)結(jié)果,我們只需要把這些數(shù)據(jù)扔進(jìn)數(shù)據(jù)處理器中,讓數(shù)據(jù)自己去尋找相關(guān)性;在這一背景下,相關(guān)關(guān)系比因果關(guān)系更加重要,有助于新的科學(xué)規(guī)律或知識(shí)在未知理論或相關(guān)模型的基礎(chǔ)上被發(fā)現(xiàn)”[25]。雖然Anderson的這一鼓吹受到很多批評(píng),但是卻引申了眾多關(guān)于“大數(shù)據(jù)”與知識(shí)創(chuàng)造的討論:在“大數(shù)據(jù)”背景下,“大數(shù)據(jù)”在研究過程與知識(shí)生產(chǎn)過程中扮演著什么樣的角色?特別是考慮到當(dāng)前越來越多的數(shù)據(jù)被電子化并可能成為研究的主要數(shù)據(jù)來源,以及研究人員逐漸提升的數(shù)據(jù)收集、分析與空間可視化技術(shù),“大數(shù)據(jù)”是否會(huì)為人文地理學(xué)者提供創(chuàng)造知識(shí)、追尋真理的新途徑?
基于Anderson的數(shù)據(jù)決定論,不得不重新審視科學(xué)研究中的認(rèn)識(shí)論問題,思考數(shù)據(jù)與知識(shí)的區(qū)別。“大數(shù)據(jù)”作為一種新方法和新技術(shù),為人文地理學(xué)研究提供了新的數(shù)據(jù)類型乃至新的研究范式,為新知識(shí)的創(chuàng)造提供了新的機(jī)遇。但是,“大數(shù)據(jù)”本身并不是知識(shí),簡(jiǎn)單的數(shù)字無法表達(dá)知識(shí)。即使在“大數(shù)據(jù)”背景下,科學(xué)研究也應(yīng)該堅(jiān)持對(duì)數(shù)據(jù)確定性的追求以及從這些冗雜的數(shù)據(jù)庫(kù)中提取有用和有效的信息,而這一過程顯然不是簡(jiǎn)單的數(shù)據(jù)本身就可以解決的[22]。在人文地理學(xué)研究中,特別是伴隨著“計(jì)量轉(zhuǎn)向”與“實(shí)證主義”的盛行,人文地理學(xué)者更應(yīng)當(dāng)重視數(shù)據(jù)與知識(shí)的思考。顯然,研究人員不能為了數(shù)據(jù)而去收集數(shù)據(jù),僅僅因?yàn)檫@些空間數(shù)據(jù)存在著并且可以被獲取。Porter曾經(jīng)指出:“雖然定量研究一直致力于在研究過程中利用數(shù)據(jù)來反映客觀實(shí)際,但是數(shù)據(jù)從來就不會(huì)自己表達(dá),數(shù)據(jù)的采集、分析與結(jié)論的獲得都是基于研究人員已有的認(rèn)知與相關(guān)的研究假設(shè)”[26]。數(shù)據(jù)僅僅是服務(wù)于理論的工具,是為了證明理論的前提與假設(shè)。同時(shí),在數(shù)據(jù)的處理過程中,信息大多被編譯為數(shù)字,從而遺失了大量的“情景”信息,以至于這些“情景”信息很難在定量研究的數(shù)理模型中得到體現(xiàn),從而難以全面反映客觀而又復(fù)雜的事實(shí)存在[27],甚至可能產(chǎn)生錯(cuò)誤的、曲解的結(jié)果。另外,相關(guān)性雖然反映了兩組變量間的關(guān)系,但卻難以說明為什么這兩組變量是相關(guān)的。以人類活動(dòng)的空間數(shù)據(jù)為例,雖然能夠借助“大數(shù)據(jù)”反映活動(dòng)空間的變化情況,卻仍然難以僅僅通過這些數(shù)據(jù)去說明人們?yōu)槭裁醇鄣竭@些地方,以及如何集聚等問題。而正是“為什么”、“如何”等這些空間背后的機(jī)制問題,更有待于人文地理學(xué)者的研究。這些問題的回答,顯然離不開基于因果解釋的理論框架與機(jī)制分析,僅僅依靠數(shù)據(jù)的空間可視化分析是不夠的。因此,數(shù)據(jù)與知識(shí)之間仍然存在明顯的界限,數(shù)據(jù)的累加并不完全等同于知識(shí)的進(jìn)步。豐富的數(shù)據(jù)源給人文地理學(xué)研究帶來了新機(jī)遇,但是數(shù)據(jù)決定論的認(rèn)識(shí)論并不利于人文地理學(xué)研究的健康發(fā)展。例如,可能帶來對(duì)“小數(shù)據(jù)”研究、質(zhì)性研究?jī)r(jià)值的逐漸忽視和相關(guān)研究經(jīng)費(fèi)資助的逐漸減少。
2.2 數(shù)據(jù)處理與分析:方法準(zhǔn)備的不足
隨著GIS技術(shù)的快速發(fā)展,雖然在數(shù)據(jù)收集、空間可視化方面取得了較大的進(jìn)展。但面對(duì)動(dòng)態(tài)而又冗雜的“大數(shù)據(jù)”,人文地理學(xué)研究仍然缺乏相對(duì)應(yīng)的、與時(shí)俱進(jìn)的數(shù)據(jù)分析方法。從人文地理學(xué)來看,一方面數(shù)據(jù)的收集與分析仍然局限在小眾的領(lǐng)域,主要是對(duì)問卷或訪談采集到的小規(guī)模數(shù)據(jù)進(jìn)行針對(duì)性分析。“大數(shù)據(jù)”并沒有得到普及,甚至也沒有納入到相關(guān)的教育培訓(xùn)中;另一方面,作為一門關(guān)注空間的學(xué)科,仍然面臨著如何將這些結(jié)構(gòu)化與非結(jié)構(gòu)化的數(shù)據(jù)落實(shí)到空間坐標(biāo)上的挑戰(zhàn)[28,29]。因此,人文地理學(xué)研究亟需處理與分析“大數(shù)據(jù)”的新方法與手段[9]。
同時(shí),更加重要的是研究人員如何從冗雜的數(shù)據(jù)中提取有效的信息。人文地理學(xué)者采集與可視化空間數(shù)據(jù)的研究成果能夠在多大程度上真實(shí)反映人類社會(huì)活動(dòng)在空間上的投影,似乎仍然沒有得到有效的驗(yàn)證。雖然大規(guī)模的數(shù)據(jù)能夠盡可能地覆蓋更多的樣本,但是同樣面臨著樣本采集偏差與代表性的問題,從而關(guān)系到結(jié)論的可信程度。而對(duì)于互聯(lián)網(wǎng)數(shù)據(jù)的挖掘與分析,除了數(shù)據(jù)代表性的問題,還更應(yīng)當(dāng)謹(jǐn)慎對(duì)待分析結(jié)果,注重與線下數(shù)據(jù)以及相關(guān)理論分析的對(duì)接。例如Ginsberg等對(duì)流感搜索空間數(shù)據(jù)的分析與實(shí)際流感就診量空間數(shù)據(jù)的對(duì)比分析[30]。這其中,如何將網(wǎng)絡(luò)數(shù)據(jù)與線下數(shù)據(jù)更加有效的結(jié)合,也面臨著新的挑戰(zhàn)。更進(jìn)一步看,隨著收集數(shù)據(jù)的累加,數(shù)據(jù)分析方法(特別是GIS技術(shù))的突破將有可能帶來新一輪的“計(jì)量革命”,并直接影響到“大數(shù)據(jù)”熱潮下的人文地理學(xué)研究成果。
2.3 數(shù)據(jù)危機(jī):隱私、尺度與邊界
僅僅從數(shù)據(jù)本身來看,也面臨著不少挑戰(zhàn)與危機(jī)。首先是數(shù)據(jù)的隱私問題。隨著信息通訊技術(shù)、相關(guān)電子設(shè)備及應(yīng)用程序(APP)在人們?nèi)粘I钪械钠占,有關(guān)個(gè)人的信息也在不斷地產(chǎn)生并成為網(wǎng)絡(luò)中的“痕跡”。這些“痕跡”的增多,足以幫助研究者去有效識(shí)別和描繪特定的個(gè)體或群體,但卻使每個(gè)使用者的隱私完全暴露在研究者或數(shù)據(jù)所有者面前。在當(dāng)今的信息時(shí)代,要控制這些數(shù)據(jù)的產(chǎn)生已不大現(xiàn)實(shí)。對(duì)于人文地理學(xué)的研究而言,問題的關(guān)鍵在于如何去保護(hù)數(shù)據(jù)的隱私,以及如何建立一套數(shù)據(jù)使用倫理的標(biāo)準(zhǔn)體系。
其次,大規(guī)模且實(shí)時(shí)更新的“大數(shù)據(jù)”也亟需研究人員尋找數(shù)據(jù)收集在時(shí)間與空間上的合適尺度。例如,集中在小空間尺度的數(shù)據(jù),有助于把握更多的空間細(xì)節(jié),但可能丟失對(duì)總體空間趨勢(shì)的把握;而集中在大空間尺度的數(shù)據(jù),有助于把握總體空間趨勢(shì),但可能隱藏了空間背后的細(xì)節(jié)及作用機(jī)制。并且,由于數(shù)據(jù)規(guī)模是實(shí)時(shí)更新的,數(shù)據(jù)采集的時(shí)間段及劃分也非常重要,并可能影響到最終的分析結(jié)果。這其中,時(shí)間段的選取也有賴于已有的相關(guān)理論,以及對(duì)于不同時(shí)間段結(jié)果變化分析的實(shí)證積累。
同時(shí),冗雜的數(shù)據(jù)規(guī)模有賴于研究者找到合適的方法篩選出有針對(duì)性的信息,從而更加聚焦于研究問題。在這一過程中,必然需要過濾掉研究問題邊界外冗余的信息(例如,關(guān)鍵詞的分析與提取)。但是,這其中卻可能存在著數(shù)據(jù)偏差與代表性的問題。從如此龐雜的數(shù)據(jù)庫(kù)中提取有效的信息,并且保證在過濾過程中沒有信息的丟失,也是一個(gè)非常有挑戰(zhàn)性的工作[31]。
3 “大數(shù)據(jù)”:盛宴下人文地理學(xué)發(fā)展的反思
當(dāng)前快速發(fā)展的信息通信技術(shù),使得“大數(shù)據(jù)”無論在數(shù)據(jù)量還是具體的數(shù)據(jù)類型方面都將進(jìn)一步充實(shí),并成為眾多學(xué)科關(guān)注的新數(shù)據(jù)來源。“大數(shù)據(jù)”在給人文地理學(xué)研究帶來機(jī)遇的同時(shí),也給整個(gè)學(xué)科的發(fā)展帶來了潛伏的危機(jī)與挑戰(zhàn)。在這樣一場(chǎng)數(shù)據(jù)導(dǎo)向的研究盛宴下,更應(yīng)當(dāng)去反思學(xué)科的發(fā)展,如何在這一背景下促進(jìn)學(xué)科自身的發(fā)展并擴(kuò)大整個(gè)學(xué)科的影響力。
3.1 定量研究與質(zhì)性研究
需要反思的是在“大數(shù)據(jù)”背景下,人文地理學(xué)研究可能出現(xiàn)對(duì)定量研究的更多關(guān)注和對(duì)質(zhì)性研究的更多忽視。正如Harvey對(duì)地理學(xué)“計(jì)量轉(zhuǎn)向”的無情批評(píng):“沿著地理學(xué)的計(jì)量轉(zhuǎn)向,我們將越來越少獲得真正有價(jià)值的知識(shí)。顯然,這一轉(zhuǎn)向正在呈現(xiàn)出我們所使用的復(fù)雜理論和方法模型與我們實(shí)際所闡述事實(shí)之間的巨大差異”[32]。“大數(shù)據(jù)”可能使數(shù)理模型成為地理學(xué)者膜拜與迷戀的工具,從而可能帶來對(duì)數(shù)理模型建模和評(píng)價(jià)的集中關(guān)注,卻忽視了數(shù)理模型所要追求與反映的知識(shí)。對(duì)于這一點(diǎn),不少社會(huì)科學(xué)學(xué)者也反思,雖然社會(huì)科學(xué)一直在追求通過定量分析來反映客觀實(shí)際,但是社會(huì)科學(xué)卻從來也沒有達(dá)到這一目標(biāo)[33,34]。“大數(shù)據(jù)”在一定程度上確實(shí)提供了使整個(gè)學(xué)科更“硬”、更加客觀的新途徑。可是,正如前文分析指出,在數(shù)據(jù)的采集、篩選與空間分析過程中仍然無法避免研究人員的主觀意識(shí)。
此外,對(duì)于定量研究與質(zhì)性研究的區(qū)分一直存在著“質(zhì)性研究的工作是主觀的,是在講故事,而定量研究則是客觀的事實(shí)”的錯(cuò)誤理解。在這一錯(cuò)誤理解的基礎(chǔ)上,“大數(shù)據(jù)”在給定量研究帶來的機(jī)遇的同時(shí),可能進(jìn)一步加深這兩者之間的對(duì)立。追求客觀事實(shí)一直是科學(xué)哲學(xué)關(guān)注的重點(diǎn)問題,研究人員一直信奉著盡可能排除主觀因素來客觀反映事實(shí)存在。只有經(jīng)歷重復(fù)檢驗(yàn)的研究假設(shè)才能被認(rèn)可為知識(shí)體系的進(jìn)步。然而,對(duì)于關(guān)注社會(huì),關(guān)注人與空間關(guān)系的人文地理學(xué),卻不得不面對(duì)復(fù)雜的個(gè)體與社會(huì),很難脫離特殊的地方情景與歷史情景,實(shí)驗(yàn)的重復(fù)性難以企及(這也是這個(gè)學(xué)科常常被批評(píng)“軟”的根本原因之一)。其實(shí),不論是質(zhì)性研究還是定量研究,都可統(tǒng)一地理解為對(duì)原始數(shù)據(jù)的再闡述。正如Gitelman所指出的,每一個(gè)學(xué)科都有針對(duì)原始數(shù)據(jù)處理和再闡述的一套標(biāo)準(zhǔn),不應(yīng)當(dāng)去嚴(yán)格地區(qū)分定量研究與質(zhì)性研究的區(qū)別,應(yīng)重在對(duì)事實(shí)的真實(shí)闡述和反映[35]。因此,在“大數(shù)據(jù)”時(shí)代背景下,定量研究與定性研究在人文地理學(xué)研究中應(yīng)當(dāng)給予同等的重視。
3.2 “小數(shù)據(jù)”與“大數(shù)據(jù)”
應(yīng)當(dāng)警惕在“大數(shù)據(jù)”背景下,對(duì)傳統(tǒng)“小數(shù)據(jù)”研究的忽視。正如前文分析指出,“大數(shù)據(jù)”雖然覆蓋了更多的樣本,但同樣存在著樣本偏差與代表性的問題。如何減少樣本的偏差并不取決于數(shù)據(jù)的大小,而是取決于數(shù)據(jù)處理的方法和手段。在社會(huì)科學(xué)研究中,研究人員為了嚴(yán)謹(jǐn)?shù)某晒恢眻?jiān)守著數(shù)據(jù)采集與分析過程中的嚴(yán)格標(biāo)準(zhǔn),包括在研究設(shè)計(jì)中對(duì)抽樣樣本的控制,在數(shù)據(jù)分析過程對(duì)統(tǒng)計(jì)學(xué)意義的測(cè)量等。數(shù)據(jù)規(guī)模的增大并不意味著數(shù)據(jù)采集與分析方法重要性的降低。特別是在人文地理學(xué)研究中,如何界定數(shù)據(jù)的尺度與邊界,如何合適的篩選出有用的信息都直接影響著分析結(jié)果的正確性。
同時(shí),數(shù)據(jù)從來就不會(huì)自己表達(dá)一切。相反,從數(shù)據(jù)到知識(shí)的過程,有賴于人文地理學(xué)者的挖掘與提煉。數(shù)據(jù)僅僅是服務(wù)于理論的工具,是為了證明某一研究假設(shè)而采取一定的方法去采集與分析的。因此,關(guān)鍵仍然在于研究問題的設(shè)定,發(fā)現(xiàn)新的知識(shí)并不依賴于數(shù)據(jù)規(guī)模的大小,不應(yīng)當(dāng)忽視“小數(shù)據(jù)”的價(jià)值。相反,人文地理學(xué)者更應(yīng)當(dāng)結(jié)合研究問題,基于“小數(shù)據(jù)”與“大數(shù)據(jù)”在采集過程中的難易度以及分析問題中的優(yōu)劣勢(shì),做出合理的選擇。當(dāng)前,人文地理學(xué)者不僅需要“大數(shù)據(jù)”來可視化空間,尋找外在的空間規(guī)律,更需要進(jìn)一步挖掘背后的空間機(jī)制。這其中,可以對(duì)比和運(yùn)用傳統(tǒng)“小數(shù)據(jù)”與傳統(tǒng)理論的分析,發(fā)揮“大數(shù)據(jù)”對(duì)整體趨勢(shì)的把握以及“小數(shù)據(jù)”對(duì)具體細(xì)節(jié)的捕捉。
3.3 數(shù)據(jù)壟斷與跨學(xué)科合作
“大數(shù)據(jù)”雖然在不斷積累,但是要獲得這些數(shù)據(jù)卻并不是一件容易的事情,尤其是要想獲得持續(xù)的、可對(duì)比的數(shù)據(jù)。由于這些“大數(shù)據(jù)”大多是掌控在政府及各部門以及公司手上,基于不同的利益考慮,這可能會(huì)由于數(shù)據(jù)壟斷而產(chǎn)生新的“數(shù)據(jù)鴻溝”。因此,對(duì)于急于獲取數(shù)據(jù)的人文地理學(xué)者而言,只有與相應(yīng)的政府各及各部門,或相應(yīng)公司的協(xié)商,或者是借助計(jì)算機(jī)科學(xué)的數(shù)據(jù)挖掘技術(shù),否則將很難獲得這些數(shù)據(jù)?梢姡瑪(shù)據(jù)獲取機(jī)會(huì)將直接帶來研究發(fā)展上的差異,從而可能錯(cuò)失許多潛在研究的機(jī)會(huì)。
同時(shí),即使獲得這些數(shù)據(jù),在數(shù)據(jù)分析方法上仍然與其他學(xué)科存在一定差距,這就更加要求人文地理學(xué)需要加強(qiáng)與其他學(xué)科(例如計(jì)算機(jī)學(xué)、統(tǒng)計(jì)學(xué)等)的合作。在“大數(shù)據(jù)”處理與分析上進(jìn)行跨學(xué)科的合作可能成為未來人文地理學(xué)發(fā)展的新趨勢(shì)。
4 結(jié)論與討論
中國(guó)快速發(fā)展的互聯(lián)網(wǎng)經(jīng)濟(jì)和正在進(jìn)行的智慧城市建設(shè),促使我們?nèi)找嫣幱谝粋(gè)被“大數(shù)據(jù)”熱潮所包圍的環(huán)境之中。盡管國(guó)際著名學(xué)者M(jìn)ichael I Jordan在接受IEEE《頻譜》雜志采訪時(shí),指出大數(shù)據(jù)可能只是一場(chǎng)“空歡喜”,大數(shù)據(jù)的“冬天”即將到來等論調(diào),卻絲毫沒有阻止國(guó)內(nèi)對(duì)大數(shù)據(jù)研究的關(guān)注。
人文地理學(xué)是一個(gè)研究?jī)?nèi)容豐富的學(xué)科,表現(xiàn)為不同的方法論、認(rèn)識(shí)論范式與實(shí)踐的競(jìng)爭(zhēng)與共存。從Hartshome[36]和Schaefer[18]的爭(zhēng)論到對(duì)定量研究的反思,人文地理學(xué)者一直在尋找學(xué)科發(fā)展的方向,如何去開展研究,如何理解、分析和評(píng)價(jià)人與空間的相互作用。面對(duì)大數(shù)據(jù)帶來的沖擊,人文地理學(xué)者一方面需要去積極探索、實(shí)踐和創(chuàng)新;另一方面,也需要對(duì)大數(shù)據(jù)的應(yīng)用進(jìn)行冷靜思考,重新審視數(shù)據(jù)分析在人文地理學(xué)研究中的價(jià)值,反思學(xué)科過去與當(dāng)前的發(fā)展態(tài)勢(shì)。
展望未來,如何抓住機(jī)遇,并應(yīng)對(duì)面臨的挑戰(zhàn),將關(guān)系到人文地理學(xué)整個(gè)學(xué)科的發(fā)展及其在整個(gè)社會(huì)科學(xué)研究中的地位。“大數(shù)據(jù)”提供了大量的帶有地理空間信息的數(shù)據(jù),為人文地理學(xué)研究的發(fā)展提供了新的機(jī)遇,也契合了人文地理學(xué)人本主義的發(fā)展趨勢(shì)。但同時(shí),也面臨著數(shù)據(jù)決定論、技術(shù)主義、數(shù)據(jù)分析方法準(zhǔn)備不足以及數(shù)據(jù)本身的危機(jī)與挑戰(zhàn)。在這一背景下,無論是定量研究還是定性研究,“小數(shù)據(jù)”還是“大數(shù)據(jù)”的研究都應(yīng)當(dāng)給予同樣的重視,數(shù)據(jù)采集、分析、闡述與數(shù)據(jù)規(guī)模并無主要的關(guān)聯(lián)。要避免“迷戀”于數(shù)據(jù)分析和可視化技能,而忽視對(duì)人文地理問題長(zhǎng)期的跟蹤與持續(xù)的研究。并且,應(yīng)當(dāng)警惕數(shù)據(jù)壟斷可能帶來研究的“數(shù)字鴻溝”,并呼吁人文地理學(xué)研究更多的與其他學(xué)科進(jìn)行跨學(xué)科合作。
作者介紹:甄峰(1973- ),男,陜西漢中人,南京大學(xué)建筑與城市規(guī)劃學(xué)院教授,南京大學(xué)人文地理研究中心博士生導(dǎo)師,研究方向?yàn)槌鞘械乩砼c區(qū)域規(guī)劃、智慧城市研究,E-mail:zhenfeng@nju.edu.cn(南京 210093);王波(通訊作者)(1987- ),男,湖南衡陽(yáng)人,香港大學(xué)地理系碩士,研究方向?yàn)槌鞘械乩砼c區(qū)域規(guī)劃,E-mail:wangbo_nick@163.com。
修訂日期:2015-03-23DOI:10.11821/dlyj2015050011“大數(shù)據(jù)”:人文地理學(xué)研究的新機(jī)遇近年來,“大數(shù)據(jù)”已經(jīng)滲透到全球范圍內(nèi)社會(huì)經(jīng)濟(jì)的各個(gè)領(lǐng)域,成為一個(gè)熱點(diǎn)話題。在等的《“大數(shù)據(jù)”時(shí)代:生活、工作與思維方式的大變革》中…
修訂時(shí)間:2014-04-10中圖分類號(hào):K901文獻(xiàn)標(biāo)識(shí)碼:A文章編號(hào):1000-0690(2015)04-0402-081洛杉磯學(xué)派的源起、代表人物及發(fā)展脈絡(luò)20世紀(jì)中后期,經(jīng)濟(jì)全球化在形式與內(nèi)容、廣度與深度上呈現(xiàn)了迅速進(jìn)展,從根本上帶來了美國(guó)社…
貴州清水江文書,是繼徽州文書之后發(fā)現(xiàn)的又一大地方文書檔案遺存。清水江文書保存了大量的明清以降苗族、侗族人民在山林經(jīng)營(yíng)和木材貿(mào)易方面所立的契約與記錄,故有“貴州苗族林業(yè)契約文書”、“苗族林契”、“侗族林契”之稱。①但山林經(jīng)營(yíng)契約并非該文書的全部。在清水…
[中圖分類號(hào)]K207[文獻(xiàn)標(biāo)識(shí)碼]A[文章編號(hào)]1000-114x(2015)04-0138-102010年8月,日本東洋文庫(kù)出版《跨越時(shí)空之旅的五十本圖書》,收錄五十部館藏珍本圖書的書影。①東洋文庫(kù)乃日本著名圖書館,藏書甚豐,珍稀本圖書亦為數(shù)不少…
本文由第一文庫(kù)網(wǎng)()首發(fā),轉(zhuǎn)載請(qǐng)保留網(wǎng)址和出處!
>> 查看更多相關(guān)文檔
免費(fèi)下載文檔:
本文關(guān)鍵詞:“大數(shù)據(jù)”熱潮下人文地理學(xué)研究的再思考,由筆耕文化傳播整理發(fā)布。
本文編號(hào):74888
本文鏈接:http://sikaile.net/shekelunwen/renwendili/74888.html