天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 管理論文 > 信息管理論文 >

大數(shù)據(jù)引論

發(fā)布時(shí)間:2015-03-10 09:30

  

大數(shù)據(jù)引論

  表面上來看,“大數(shù)據(jù)”概念的火爆可以歸結(jié)到邁爾-舍恩伯格寫的《大數(shù)據(jù)時(shí)代》和涂子沛寫的《大數(shù)據(jù)》。前者引爆了“大數(shù)據(jù)”的概念,并著重從社會(huì)變革的角度闡釋了數(shù)據(jù)思維的重要性。后者則更像是一部信息開放史,闡述了信息對于社會(huì)發(fā)展的影響程度。

 

  其實(shí),在很大程度上,“大數(shù)據(jù)”更像是一種以迎合方式制造的概念,好似生產(chǎn)中的定制化一樣,數(shù)據(jù)使用單位覺察到數(shù)據(jù)在決策和治理方面的重要性,又不知道該如何表達(dá)與之前的“信息社會(huì)”、“商業(yè)智能”等概念的區(qū)隔,“大數(shù)據(jù)”的登場對他們而言可謂是久旱逢甘霖,他鄉(xiāng)遇故知。

 

  客觀來看,這兩位作者都沒有把大數(shù)據(jù)的概念清晰地闡述出來。在這里,之所以強(qiáng)調(diào)概念的重要性并非要教條化,而是出于對目前國內(nèi)各行業(yè)對大數(shù)據(jù)的理解出現(xiàn)了亂象。幾乎所有企業(yè)都握著自己手里那些數(shù)據(jù),躍躍欲試地說要迎接大數(shù)據(jù)時(shí)代。而他們中的大部分尚不知道自己的數(shù)據(jù)成色到底如何,更不知道如何分析與使用。

 

  信息化社會(huì)的表征

 

  倫敦大學(xué)社會(huì)學(xué)教授韋伯斯特眼中的“信息社會(huì)”并非僅僅是信息產(chǎn)量猛增的社會(huì)。他認(rèn)為如果把信息從人類社會(huì)圖景中抹去的話,并不會(huì)有什么與過往社會(huì)圖景根本的區(qū)別。韋伯斯特說的并非毫無道理,因?yàn)楫?dāng)我們被各種符號包裹著的時(shí)候,總會(huì)希望它們能遠(yuǎn)離自己。

 

  因此,韋伯斯特認(rèn)為“語義“是識別信息社會(huì)的重要標(biāo)志,也就是信息本身所承載的意義。在韋伯斯特的眼里,語義是一個(gè)人文詞匯,對于信息的質(zhì)量只能依靠一種精英式的直覺來判斷。比如,鮑德里亞就會(huì)認(rèn)為信息變成了無意義的符號,我們最后所面對的不過是一個(gè)符號社會(huì)。但是,鮑德里亞所描述的就真的僅僅是消費(fèi)社會(huì)而不是意義社會(huì)嗎?

 

  2007年在哈佛大學(xué)舉行的“計(jì)算社會(huì)科學(xué)”研討會(huì)確立了“社會(huì)化計(jì)算”的地位。社會(huì)化計(jì)算源于社會(huì)化軟件的興起,如今,這類計(jì)算是基于社交網(wǎng)絡(luò)的數(shù)據(jù)結(jié)構(gòu)。用戶之間的聯(lián)系程度,誰和誰的關(guān)系近了多少還是遠(yuǎn)了多少,這是無法在第一時(shí)間用數(shù)據(jù)體現(xiàn)出來的。

 

  社會(huì)化計(jì)算的功能就是把我們憑借意識判斷的過程數(shù)據(jù)化,但這一計(jì)算方式并沒有得到更多人的關(guān)注。社會(huì)化計(jì)算把韋伯斯特的“語義說”進(jìn)行了科學(xué)量化,從而很好地彌補(bǔ)了人文與科學(xué)的縫隙。毫不夸張地說,信息社會(huì)的到來,應(yīng)該是伴隨著社交網(wǎng)絡(luò)的崛起和社會(huì)化計(jì)算的應(yīng)用。

 

  從目前我們看到的關(guān)于大數(shù)據(jù)的各種描述,大數(shù)據(jù)與之前數(shù)據(jù)分析的很大不同是對于非結(jié)構(gòu)性數(shù)據(jù)的重視與分析。所謂非結(jié)構(gòu)性數(shù)據(jù),恰恰更多地是以社交網(wǎng)絡(luò)為載體。哈爾濱工業(yè)大學(xué)專門從事社會(huì)化計(jì)算研究的丁效告訴筆者,他們小組最近基于社交網(wǎng)絡(luò)上的用戶情緒反應(yīng),做了一個(gè)預(yù)測首周電影票房的模型,準(zhǔn)確率達(dá)到80%。而此前,他和他的導(dǎo)師同樣利用社會(huì)化計(jì)算的方式,畫出了一個(gè)新浪微博的消息樹,將信息引爆的路徑用圖形的方式展現(xiàn)了出來。顯然,社會(huì)化計(jì)算的預(yù)測功能更加符合人們對于大數(shù)據(jù)的期待。

 

  如果說在社交網(wǎng)絡(luò)崛起之前,,所謂的“工業(yè)社會(huì)”與“后工業(yè)社會(huì)”的區(qū)別是因?yàn)樾畔⒌募ぴ鰧?dǎo)致了社會(huì)結(jié)構(gòu)的方方面面出現(xiàn)了巨變,且呈現(xiàn)出了符號化的特征,那么在社交網(wǎng)絡(luò)崛起之后,社會(huì)化計(jì)算得以將各種符號背后的意義深度挖掘,尤其是用符號學(xué)無法合理闡釋的因果性在這里變成了網(wǎng)絡(luò)之下的相關(guān)性。進(jìn)一步說,社會(huì)化計(jì)算讓信息社會(huì)的概念走出了實(shí)質(zhì)性的一步。

 

  大數(shù)據(jù)時(shí)代正是信息社會(huì)從“量”走向“質(zhì)”的表征,或者說信息化社會(huì)在大數(shù)據(jù)時(shí)代才算是真正到來。

 

  殊途同歸

 

  革命性科學(xué)理念的推廣,往往離不開商業(yè)應(yīng)用,因?yàn)樯虡I(yè)化是實(shí)現(xiàn)技術(shù)閉環(huán)的最有效方式。前文提到的信息社會(huì)在大數(shù)據(jù)之前是處于“量”的時(shí)代,這還是一種概括性描述。在局部的商業(yè)領(lǐng)域,數(shù)據(jù)的價(jià)值分析早已經(jīng)在上個(gè)世紀(jì)末展開,那時(shí)人們將其命名為“商業(yè)智能”(BI)。

 

  數(shù)據(jù)分析的職能始終圍繞著“客戶關(guān)系管理”(CRM)搭建模型,主要解決兩個(gè)問題:客戶細(xì)分和預(yù)測。一位在國內(nèi)較早為企業(yè)提供數(shù)據(jù)挖據(jù)和分析的工程師表示,數(shù)據(jù)分析是“商業(yè)智能”規(guī)劃中的一個(gè)部分,大數(shù)據(jù)只不過是豐富了“商業(yè)智能”的主題,也就是“商業(yè)智能”可以較以前做更多的事情了。他認(rèn)為,“大數(shù)據(jù)”有別于之前的數(shù)據(jù)分析,是因?yàn)閿?shù)據(jù)源越來越多,數(shù)據(jù)量越來越大。

 

  除了傳統(tǒng)具有數(shù)據(jù)積累習(xí)慣的行業(yè),比如電信業(yè)、銀行業(yè),當(dāng)下數(shù)據(jù)量的激增更多是基于電子商務(wù)的興起,而目前對數(shù)據(jù)挖掘和分析需求更多的也是電子商務(wù)公司。

 

  這種直接面對客戶端的數(shù)據(jù)挖掘和分析,是企業(yè)最直接用到的。通過對既往消費(fèi)行為的分析,從而劃分客戶群體,做精準(zhǔn)營銷。他們的數(shù)據(jù)依據(jù)是用戶以往行為記錄,也可以說是結(jié)構(gòu)型數(shù)據(jù)。比如某人消費(fèi)了多少次,每次多少錢。那位國內(nèi)較早從事數(shù)據(jù)挖掘的工程師目前就在為淘寶上的幾位大賣家提供第三方的數(shù)據(jù)挖掘服務(wù)。賣家在擁有用戶行為分析的數(shù)據(jù)前提下,可以更加精確地指定品牌推廣計(jì)劃。

 

  數(shù)據(jù)源的擴(kuò)容則是偏向于社交網(wǎng)絡(luò)和未來的物聯(lián)網(wǎng)應(yīng)用,用戶提供非結(jié)構(gòu)型數(shù)據(jù)的入口會(huì)越來越多。

 

  為了與社會(huì)化計(jì)算相區(qū)別,我們可以將其這種直接面對客戶端的結(jié)構(gòu)型數(shù)據(jù)挖掘稱為傳統(tǒng)的數(shù)據(jù)挖掘。而事實(shí)上,傳統(tǒng)數(shù)據(jù)挖掘和社會(huì)化計(jì)算是一個(gè)殊途同歸的過程。最后都要回歸到聚類問題,分類問題,描述性問題,關(guān)聯(lián)問題,序列問題,異常性問題這六大主流問題之中,雖然在過程中的算法各有不同。

 

  大數(shù)據(jù)的目的

 

  大數(shù)據(jù)解決的是心物間隔的問題。

 

  這個(gè)結(jié)論正是由上述的基于客戶的傳統(tǒng)數(shù)據(jù)挖掘和社會(huì)化計(jì)算得出。傳統(tǒng)的數(shù)據(jù)挖掘方法是以確定性數(shù)據(jù)為主,假設(shè)了數(shù)字可以準(zhǔn)確地表達(dá)人的需求。比如連續(xù)買了一年這個(gè)牌子的產(chǎn)品,就會(huì)假設(shè)這個(gè)用戶是該品牌的忠實(shí)消費(fèi)者。在哲學(xué)上,這是一種物化的體現(xiàn)。

 

  社會(huì)化計(jì)算則充分利用了社交圈子中的關(guān)系強(qiáng)弱來預(yù)測用戶的需求,這是更多地利用了表面的相關(guān)性,比如從我對好友說喜歡寶馬車來推測我可能喜歡某個(gè)牌子的手表。這就是邁爾-舍恩伯格說的相關(guān)性。

 

  以Facebook為代表的社交網(wǎng)絡(luò)所形成的數(shù)據(jù)更多指向用戶的內(nèi)心表達(dá),在哲學(xué)上就是“心”的體現(xiàn)。之所以說,后現(xiàn)代經(jīng)濟(jì)較之現(xiàn)代經(jīng)濟(jì)具有了“濕”的特征,正是因?yàn)楹蟋F(xiàn)代經(jīng)濟(jì)中多了很多“心”的要素。大數(shù)據(jù)的哲學(xué)意義正在于此。從這個(gè)角度看阿里巴巴入股新浪微博,可以看做是在打通結(jié)構(gòu)性數(shù)據(jù)和非結(jié)構(gòu)性數(shù)據(jù)之間的通路。

 

  Google代表的算法和Facebooke的算法到底有什么不同,哪一個(gè)更能代表未來?Google的算法是基于關(guān)聯(lián)性,比如它的廣告推薦系統(tǒng),就是利用用戶的使用痕跡進(jìn)行精準(zhǔn)推薦。Facebook的算法則是基于關(guān)系圖譜,當(dāng)然最近Facebook認(rèn)識到了關(guān)系的脆弱性,它又開始打造興趣圖譜。這兩種算法的應(yīng)用場景不同,很難說到底哪個(gè)更具備未來性。

 

  定義大數(shù)據(jù)

 

  從廣義來說,大數(shù)據(jù)是一種基于數(shù)據(jù)量越來越大、信息源越來越多而實(shí)現(xiàn)管理智能的思維形態(tài)。從狹義來說,大數(shù)據(jù)就是一種特殊的IT平臺。按照傳統(tǒng)的IT架構(gòu),數(shù)據(jù)處理能力是有上限的。Google在2003年和2004年公布了關(guān)于GFS、MapReduce和BigTable的三篇技術(shù)論文,這也成為后來云計(jì)算發(fā)展的重要基石。隨后,著名的Hadroop基于這三篇論文誕生,其創(chuàng)始人Doug Cutting帶著這項(xiàng)技術(shù)轉(zhuǎn)投Yahoo!,并將其打造成了一個(gè)易于開發(fā)和運(yùn)行處理大規(guī)模數(shù)據(jù)的軟件平臺。

 

  這種基于模塊化搭建起來的開源IT架構(gòu),使得數(shù)據(jù)量的處理能力無限上漲。這是大數(shù)據(jù)得以實(shí)現(xiàn)的硬前提。

 

  在思維層面上,大數(shù)據(jù)在三個(gè)方面具有顛覆性的意義:

 

  可視化思維:大數(shù)據(jù)的一個(gè)重要功能就是把抽象問題直觀化,也就是可視化。哲學(xué)在這里是否要發(fā)生一個(gè)質(zhì)變,還不得而知。如果,Google或者百度的神經(jīng)網(wǎng)絡(luò)算法成功的話,也許哲學(xué)就不復(fù)存在了。

 

  數(shù)據(jù)化思維:這也是中國人思維里最缺少的東西,更是中國企業(yè)在大數(shù)據(jù)時(shí)代伊始階段四處抓瞎的原因。

 

  心物合一:這是最高級的問題。主體和客體哪個(gè)更真實(shí)的爭論也許可以到此為止,大數(shù)據(jù)可以利用社會(huì)化計(jì)算和行為數(shù)據(jù)分析,得出一個(gè)精準(zhǔn)的結(jié)論。

 

  不過,對于企業(yè)管理者而言,看待大數(shù)據(jù)時(shí)應(yīng)該避免高估數(shù)據(jù)挖掘和低估數(shù)據(jù)挖掘,只要把它作為正常企業(yè)業(yè)務(wù)流程中的一個(gè)重要環(huán)節(jié)即可。

 

  在使用大數(shù)據(jù)時(shí)可以嘗試如下思路:

 

  先判斷數(shù)據(jù)能不能在某個(gè)環(huán)節(jié)產(chǎn)生價(jià)值;規(guī)劃和選擇大數(shù)據(jù)方案;大處著眼,小處著手。切忌在伊始階段就上馬大系統(tǒng),大格局。


 。▉碓矗篒T經(jīng)理世界)

文章為作者獨(dú)立觀點(diǎn),不代表經(jīng)管之家立場



本文編號:17194

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/guanlilunwen/sjfx/17194.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶ac9e4***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請E-mail郵箱bigeng88@qq.com