寫給大三老師的祝福_寫給大四畢業(yè)生的文章_《寫給大家看的大數(shù)據(jù)》(赫爾維茨)【圖片 簡(jiǎn)介 評(píng)論 價(jià)格 目錄】
本文關(guān)鍵詞:寫給大家看的大數(shù)據(jù),由筆耕文化傳播整理發(fā)布。
寫給大家看的大數(shù)據(jù) 特色及評(píng)論
大數(shù)據(jù)是當(dāng)前信息科技領(lǐng)域*為炙手可熱的話題之一!秾懡o大家看的大數(shù)據(jù)》簡(jiǎn)單而系統(tǒng)地介紹了大數(shù)據(jù)體系涉及的各方面知識(shí),涵蓋大數(shù)據(jù)的基本概念、大數(shù)據(jù)的技術(shù)基礎(chǔ)、大數(shù)據(jù)管理、大數(shù)據(jù)分析、大數(shù)據(jù)在現(xiàn)實(shí)工作中如何實(shí)現(xiàn)和實(shí)施等關(guān)鍵內(nèi)容,涉及大數(shù)據(jù)基礎(chǔ)架構(gòu)、大數(shù)據(jù)使用的數(shù)據(jù)庫(kù)和分布式技術(shù)、對(duì)大數(shù)據(jù)進(jìn)行基礎(chǔ)分析和高級(jí)分析的特點(diǎn)及異同,以及企業(yè)如何應(yīng)用大數(shù)據(jù)轉(zhuǎn)變其商業(yè)運(yùn)作模式等內(nèi)容,能夠?qū)ο胍私獯髷?shù)據(jù)全貌,或是想要使用大數(shù)據(jù)的企業(yè)和個(gè)人提供全面的知識(shí)內(nèi)容和學(xué)習(xí)借鑒。 《寫給大家看的大數(shù)據(jù)》語(yǔ)言生動(dòng),,內(nèi)容覆蓋面廣,理論結(jié)合實(shí)例,非常適合對(duì)大數(shù)據(jù)感興趣的廣大讀者。對(duì)于從事與大數(shù)據(jù)相關(guān)工作的人員,本書也有很高的參考價(jià)值。
寫給大家看的大數(shù)據(jù) 內(nèi)容簡(jiǎn)介
不同于目前市面上側(cè)重于宏觀分析和商業(yè)分析的大數(shù)據(jù)圖書,本書是一本真正立足于“大數(shù)據(jù)技術(shù)”本身的圖書,為讀者全面掌握和學(xué)習(xí)大數(shù)據(jù)這門技術(shù)本身知識(shí)而敘述,進(jìn)而進(jìn)階到大數(shù)據(jù)分析,*終講到大數(shù)據(jù)的商業(yè)應(yīng)用。是廣大讀者學(xué)習(xí)“入門級(jí)”內(nèi)容的不二選擇。
寫給大家看的大數(shù)據(jù) 本書目錄
目 錄
第一部分 大數(shù)據(jù)入門 1
第1章 大數(shù)據(jù)基礎(chǔ) 3
數(shù)據(jù)管理的演化過程 4
理解數(shù)據(jù)管理的幾個(gè)關(guān)鍵 5
關(guān)鍵1:創(chuàng)建可管理的數(shù)據(jù)結(jié)構(gòu) 5
關(guān)鍵2:web和內(nèi)容管理 7
關(guān)鍵3:管理大數(shù)據(jù) 7
大數(shù)據(jù)的定義 9
構(gòu)建成功的大數(shù)據(jù)管理架構(gòu) 10
捕捉、組織、集成分析與模擬 10
建立架構(gòu)基礎(chǔ) 11
性能問題 13
傳統(tǒng)與高級(jí)分析 15
大數(shù)據(jù)之旅 16
第2章 研究大數(shù)據(jù)類型 17
定義結(jié)構(gòu)化的數(shù)據(jù) 18
探索大結(jié)構(gòu)化數(shù)據(jù)源 18
理解關(guān)系型數(shù)據(jù)庫(kù)在大數(shù)據(jù)中的角色 19
定義非結(jié)構(gòu)化數(shù)據(jù) 21
探索非結(jié)構(gòu)化數(shù)據(jù)源 21
理解cms在大數(shù)據(jù)管理中的角色 23
理解實(shí)時(shí)需求和非實(shí)時(shí)需求 23
聚合大數(shù)據(jù) 25
管理不同類型的數(shù)據(jù) 25
將不同類型的數(shù)據(jù)整合到大數(shù)據(jù)環(huán)境中 25
第3章 當(dāng)老古董遇上新生代:分布式計(jì)算 27
分布式計(jì)算簡(jiǎn)史 27
感謝darpa 27
可持續(xù)模型的價(jià)值 28
了解分布式計(jì)算基礎(chǔ) 29
為什么大數(shù)據(jù)需要分布式計(jì)算 29
計(jì)算經(jīng)濟(jì)的改變 30
時(shí)延帶來的問題 30
當(dāng)需求遇上解決方案 31
獲取所需的性能 31
第二部分 大數(shù)據(jù)的技術(shù)基礎(chǔ) 33
第4章 深入大數(shù)據(jù)技術(shù)組件 35
探索大數(shù)據(jù)棧 36
第0層:帶冗余的物理基礎(chǔ)架構(gòu) 37
物理冗余網(wǎng)絡(luò) 38
管理硬件:存儲(chǔ)與服務(wù)器 39
基礎(chǔ)架構(gòu)操作 39
第1層:安全框架 39
進(jìn)/出應(yīng)用程序和互聯(lián)網(wǎng)的界面與接口 40
第2層:可操作數(shù)據(jù)庫(kù) 42
第3層:組織數(shù)據(jù)服務(wù)與工具 43
第4層:可分析的數(shù)據(jù)倉(cāng)庫(kù) 44
大數(shù)據(jù)分析 45
大數(shù)據(jù)應(yīng)用程序 46
第5章 虛擬化及其如何支持分布式計(jì)算 47
理解虛擬化的基本知識(shí) 47
在大數(shù)據(jù)中使用虛擬化的重要性 48
服務(wù)器虛擬化 50
應(yīng)用程序虛擬化 50
網(wǎng)絡(luò)虛擬化 51
處理器和內(nèi)存虛擬化 51
數(shù)據(jù)和存儲(chǔ)虛擬化 52
使用hypervisor管理虛擬化 53
抽象化與虛擬化 54
實(shí)現(xiàn)在大數(shù)據(jù)中的虛擬化 54
第6章 云和大數(shù)據(jù) 56
大數(shù)據(jù)領(lǐng)域中的云 56
理解云部署和分發(fā)模型 57
云部署模型 57
云分發(fā)模型 59
大數(shù)據(jù)需要云 60
在大數(shù)據(jù)中使用云 61
大數(shù)據(jù)云市場(chǎng)的服務(wù)提供商 62
亞馬遜公共彈性計(jì)算云(ec2) 63
谷歌的大數(shù)據(jù)服務(wù) 64
微軟azure 64
openstack 65
在使用云服務(wù)時(shí)需要注意什么 65
第三部分 大數(shù)據(jù)管理 67
第7章 操作型數(shù)據(jù)庫(kù) 69
rdbms在大數(shù)據(jù)領(lǐng)域的重要性 71
非關(guān)系型數(shù)據(jù)庫(kù) 72
key-value型數(shù)據(jù)庫(kù) 73
文檔數(shù)據(jù)庫(kù) 75
mongodb 76
couchdb 77
縱列數(shù)據(jù)庫(kù) 78
圖形數(shù)據(jù)庫(kù) 79
空間數(shù)據(jù)庫(kù) 81
混合持久化 83
第8章 mapreduce基礎(chǔ) 85
mapreduce溯源 85
理解map函數(shù) 86
添加reduce函數(shù) 88
結(jié)合map和reduce 89
優(yōu)化mapreduce 91
硬件/網(wǎng)絡(luò)拓?fù)洹?2
同步 92
文件系統(tǒng) 92
第9章 探索hadoop的世界 94
談?wù)刪adoop 94
理解hadoop分布式文件系統(tǒng)(hdfs) 95
name節(jié)點(diǎn) 95
數(shù)據(jù)節(jié)點(diǎn) 96
理解hdfs 97
hadoop的mapreduce 99
準(zhǔn)備數(shù)據(jù) 100
開始mapping 101
reduce和融合 101
第10章 hadoop基礎(chǔ)和生態(tài) 103
使用hadoop生態(tài)系統(tǒng)構(gòu)建大數(shù)據(jù)基礎(chǔ) 103
使用hadoop yarn管理資源和應(yīng)用程序 104
使用hbase存儲(chǔ)大數(shù)據(jù) 105
使用hive挖掘大數(shù)據(jù) 106
使用hadoop生態(tài)系統(tǒng) 107
pig和pig latin 107
sqoop 108
zookeeper 109
第11章 設(shè)備和大數(shù)據(jù)倉(cāng)庫(kù) 111
使用傳統(tǒng)數(shù)據(jù)倉(cāng)庫(kù)裝載大數(shù)據(jù) 111
優(yōu)化數(shù)據(jù)倉(cāng)庫(kù) 112
區(qū)別大數(shù)據(jù)結(jié)構(gòu)和數(shù)據(jù)倉(cāng)庫(kù)數(shù)據(jù) 112
一個(gè)混合式處理的例子 113
大數(shù)據(jù)分析和數(shù)據(jù)倉(cāng)庫(kù) 114
集成的關(guān)鍵 115
再思考提取、變換和載入 115
改變數(shù)據(jù)倉(cāng)庫(kù)的角色 116
改變部署模型 116
設(shè)備模型 117
云模型 117
數(shù)據(jù)倉(cāng)庫(kù)的未來 117
第四部分 數(shù)據(jù)分析與大數(shù)據(jù) 119
第12章 定義大數(shù)據(jù)分析 121
使用大數(shù)據(jù)獲得結(jié)果 121
基本分析 122
高級(jí)分析 123
實(shí)用性分析 126
貨幣化分析 126
為掌握大數(shù)據(jù)修改商務(wù)智能產(chǎn)品 126
數(shù)據(jù) 126
分析算法 127
基礎(chǔ)架構(gòu)支持 128
大數(shù)據(jù)分析案例研究 128
orbitz 129
nokia 129
nasa 129
大數(shù)據(jù)分析解決方案 130
第13章 理解文本分析和大數(shù)據(jù) 131
探索非結(jié)構(gòu)化數(shù)據(jù) 132
理解文本分析 133
分析和提取技術(shù) 135
理解信息抽取 136
分類學(xué) 137
將結(jié)果匯總成結(jié)構(gòu)化數(shù)據(jù) 138
開始使用大數(shù)據(jù) 138
客戶的聲音 138
社交媒體分析 139
大數(shù)據(jù)文本分析工具 141
attensity 141
clarabridge 142
ibm 142
opentext 142
sas 143
第14章 大數(shù)據(jù)分析的定制化 144
構(gòu)建新的大數(shù)據(jù)模型 145
理解大數(shù)據(jù)分析的各種方法 147
大數(shù)據(jù)分析的定制應(yīng)用程序 147
大數(shù)據(jù)分析的半定制化應(yīng)用程序 149
大數(shù)據(jù)分析框架的特點(diǎn) 151
由大到。捍髷(shù)據(jù)悖論 153
第五部分 大數(shù)據(jù)實(shí)現(xiàn) 155
第15章 集成數(shù)據(jù)源 157
識(shí)別你需要的數(shù)據(jù) 157
勘探階段 158
編制階段 159
集成和整合階段 160
理解大數(shù)據(jù)集成基礎(chǔ) 161
定義傳統(tǒng)etl 163
理解elt——提取、載入和轉(zhuǎn)換 164
大數(shù)據(jù)質(zhì)量?jī)?yōu)化 165
使用hadoop實(shí)現(xiàn)etl 166
大數(shù)據(jù)集成的*佳實(shí)踐 166
第16章 處理實(shí)時(shí)數(shù)據(jù)流和復(fù)雜事件 168
流數(shù)據(jù)和復(fù)雜事件處理 169
使用流數(shù)據(jù) 169
數(shù)據(jù)流 169
流的元數(shù)據(jù) 171
使用復(fù)雜事件處理 172
從流中分離出cep 173
商務(wù)領(lǐng)域的數(shù)據(jù)流和cep 174
第17章 可操作的大數(shù)據(jù) 175
讓大數(shù)據(jù)成為操作過程的一部分 175
集成大數(shù)據(jù) 175
疾病診斷中的大數(shù)據(jù)協(xié)作 177
理解大數(shù)據(jù)工作流 180
大數(shù)據(jù)的有效性、準(zhǔn)確性和波動(dòng)性 181
數(shù)據(jù)有效性 181
數(shù)據(jù)波動(dòng)性 182
第18章 在企業(yè)中應(yīng)用大數(shù)據(jù) 184
大數(shù)據(jù)經(jīng)濟(jì)學(xué) 184
數(shù)據(jù)類型和數(shù)據(jù)來源的識(shí)別 185
修改業(yè)務(wù)流或創(chuàng)建新的業(yè)務(wù)流 187
大數(shù)據(jù)工作流的技術(shù)影響 188
網(wǎng)羅大數(shù)據(jù)項(xiàng)目的人才 188
計(jì)算大數(shù)據(jù)的投入產(chǎn)出(roi) 189
企業(yè)數(shù)據(jù)管理和大數(shù)據(jù) 189
創(chuàng)建大數(shù)據(jù)實(shí)施里程碑 190
理解業(yè)務(wù)緊迫性 191
正確地預(yù)測(cè)工作量 191
選擇正確的軟件開發(fā)方法學(xué) 191
平衡預(yù)算和功能 192
評(píng)估風(fēng)險(xiǎn)承受能力 192
邁出第一步 193
第19章 大數(shù)據(jù)環(huán)境的安全和管理 195
大數(shù)據(jù)下的安全 195
評(píng)估業(yè)務(wù)風(fēng)險(xiǎn) 196
大數(shù)據(jù)中潛藏的風(fēng)險(xiǎn) 196
理解數(shù)據(jù)保護(hù) 197
數(shù)據(jù)管理的挑戰(zhàn) 198
大數(shù)據(jù)過程審計(jì) 199
定位關(guān)鍵利益者 200
正確運(yùn)用組織架構(gòu) 200
為管理風(fēng)險(xiǎn)做準(zhǔn)備 200
制訂正確的管理規(guī)則和質(zhì)量保障 201
開發(fā)管理完善、安全可靠的大數(shù)據(jù)環(huán)境 201
第六部分 現(xiàn)實(shí)中的大數(shù)據(jù)解決方案 203
第20章 大數(shù)據(jù)對(duì)業(yè)務(wù)的重要性 205
將大數(shù)據(jù)作為業(yè)務(wù)規(guī)劃的工具 205
第一步:規(guī)劃中引入數(shù)據(jù) 206
第二步:執(zhí)行分析 206
第三步:檢查結(jié)果 207
第四步:落實(shí)計(jì)劃 207
規(guī)劃過程的另一個(gè)維度 207
第五步:實(shí)時(shí)監(jiān)控 208
第六步:調(diào)節(jié)影響 208
第七步:適應(yīng)性實(shí)驗(yàn) 208
正確地看待數(shù)據(jù)分析 208
在正確的基礎(chǔ)上開始行動(dòng) 209
規(guī)劃大數(shù)據(jù) 210
調(diào)整業(yè)務(wù)流程 210
第21章 從現(xiàn)實(shí)視角看數(shù)據(jù)分析 212
理解用戶對(duì)運(yùn)動(dòng)型數(shù)據(jù)的需求 213
流數(shù)據(jù)對(duì)環(huán)境的影響 214
使用傳感器來提供實(shí)時(shí)水文信息 215
實(shí)時(shí)數(shù)據(jù)的優(yōu)勢(shì) 215
流數(shù)據(jù)對(duì)公共政策的影響 216
流數(shù)據(jù)在醫(yī)療行業(yè)的應(yīng)用 217
流數(shù)據(jù)在能源行業(yè)的應(yīng)用 218
使用流數(shù)據(jù)提升能量產(chǎn)率 218
使用流數(shù)據(jù)提升能源產(chǎn)出 218
連接數(shù)據(jù)流和歷史數(shù)據(jù)與其他實(shí)時(shí)數(shù)據(jù)源 219
第22章 從現(xiàn)實(shí)視角看大數(shù)據(jù)分析對(duì)業(yè)務(wù)流程的優(yōu)化 220
了解企業(yè)對(duì)大數(shù)據(jù)分析的需求 220
使用文本分析提升客戶體驗(yàn) 221
使用大數(shù)據(jù)分析進(jìn)行決策 222
使用大數(shù)據(jù)分析避免欺詐 224
整合新數(shù)據(jù)源的商業(yè)價(jià)值 225
第七部分 十項(xiàng)注意 227
第23章 十條大數(shù)據(jù)*佳實(shí)踐 229
理解你的目標(biāo) 229
建立里程碑 230
發(fā)現(xiàn)你的數(shù)據(jù) 230
清楚你缺少什么數(shù)據(jù) 230
理解可選技術(shù)方案 231
規(guī)劃大數(shù)據(jù)安全 231
規(guī)劃大數(shù)據(jù)管理策略 231
規(guī)劃數(shù)據(jù)管家 232
持續(xù)測(cè)試 232
學(xué)習(xí)*佳實(shí)踐和利用模式 232
第24章 十個(gè)大數(shù)據(jù)資源 234
hurwitz & associates 234
標(biāo)準(zhǔn)化組織 234
開放數(shù)據(jù)基金會(huì) 234
云安全聯(lián)盟 235
美國(guó)國(guó)家標(biāo)準(zhǔn)和科技機(jī)構(gòu) 235
apache軟件基金會(huì) 235
oasis 235
供應(yīng)商的網(wǎng)站 236
在線協(xié)作套件 236
大數(shù)據(jù)會(huì)議 237
第25章 十條“要”與“不要” 238
要將所有業(yè)務(wù)單元都涵蓋在大數(shù)據(jù)戰(zhàn)略中 238
要評(píng)估所有的大數(shù)據(jù)分發(fā)模型 238
要將傳統(tǒng)數(shù)據(jù)源作為大數(shù)據(jù)戰(zhàn)略的一部分 238
要計(jì)劃持久化元數(shù)據(jù) 239
要分發(fā)你的數(shù)據(jù) 239
不要依賴于單一的大數(shù)據(jù)分析方法 239
不要在準(zhǔn)備充分之前就膨脹 239
不要忽略數(shù)據(jù)集成的需求 239
不要忘記安全地管理數(shù)據(jù) 240
不要忽略數(shù)據(jù)的管理效率 240
術(shù)語(yǔ)表 241
寫給大家看的大數(shù)據(jù) 作者介紹
Judith Hurwitz是Hurwitz&Associates的主席兼CEO。這是一家專注于新興科技的調(diào)研和咨詢公司,涵蓋領(lǐng)域包括云計(jì)算、大數(shù)據(jù)、數(shù)據(jù)分析、軟件開發(fā)、服務(wù)和管理。作為參與技術(shù)創(chuàng)新和應(yīng)用的先驅(qū),朱迪絲多年來以受信顧問的身份服務(wù)了許多行業(yè)中的領(lǐng)軍企業(yè),包括阿波羅計(jì)算機(jī)公司和約翰·漢考克。她撰寫過大量涵蓋分布式軟件各方面知識(shí)的文章。她出版過多本圖書。
寫給大家看的大數(shù)據(jù)
本文關(guān)鍵詞:寫給大家看的大數(shù)據(jù),由筆耕文化傳播整理發(fā)布。
本文編號(hào):67163
本文鏈接:http://sikaile.net/wenshubaike/mishujinen/67163.html