高級(jí)編譯器豆瓣_lol安裝不了_多核應(yīng)用編程實(shí)戰(zhàn)
本文關(guān)鍵詞:多核應(yīng)用編程實(shí)戰(zhàn),由筆耕文化傳播整理發(fā)布。
《多核應(yīng)用編程實(shí)戰(zhàn)》
基本信息
原書名:Multicore application programming:for windows,linux,and Oracle Solaris
作者: (美)戈夫(Darryl Gove)
譯者: 郭晴霞
叢書名: 圖靈程序設(shè)計(jì)叢書
出版社:人民郵電出版社
ISBN:9787115317506
上架時(shí)間:2013-5-22
出版日期:2013 年5月
開(kāi)本:16開(kāi)
頁(yè)碼:1
版次:1-1
所屬分類:計(jì)算機(jī)
更多關(guān)于 》》》《多核應(yīng)用編程實(shí)戰(zhàn)》
內(nèi)容簡(jiǎn)介
計(jì)算機(jī)書籍
《多核應(yīng)用編程實(shí)戰(zhàn)》是一本全面實(shí)用的多核應(yīng)用編程指南,旨在介紹如何編寫功能正確、性能優(yōu)越且適合擴(kuò)展為在多個(gè)cpu核心的系統(tǒng)運(yùn)行的應(yīng)用程序。本書面向多種操作系統(tǒng)和處理器類型引用程序示例,內(nèi)容涵蓋類unix 操作系統(tǒng)(linux、oracle solaris、os x)和windows 系統(tǒng)上多核應(yīng)用的編寫方法、多核的硬件實(shí)現(xiàn)對(duì)應(yīng)用程序的性能影響、編寫并行應(yīng)用程序時(shí)要避免的潛在問(wèn)題,以及如何編寫可擴(kuò)展至大量并行線程的應(yīng)用程序。
《多核應(yīng)用編程實(shí)戰(zhàn)》適合所有c程序員學(xué)習(xí)參考。
面向主流平臺(tái)打造多核應(yīng)用程序,真正實(shí)現(xiàn)高性能與高可擴(kuò)展性并舉。
《多核應(yīng)用編程實(shí)戰(zhàn)》是一本全面、實(shí)用的高性能多核應(yīng)用編程指南,不僅介紹了在windows、linux和oracle solaris上實(shí)現(xiàn)并行化的前沿方法,而且通過(guò)示例闡述了面向多核處理器編程時(shí)所涉及的各種挑戰(zhàn),指導(dǎo)讀者開(kāi)發(fā)功能正確、性能優(yōu)越,且可擴(kuò)展為在8個(gè)、16個(gè)甚至更多cpu核心的系統(tǒng)運(yùn)行的應(yīng)用程序。通讀本書,你將了解具體硬件實(shí)現(xiàn)對(duì)應(yīng)用程序性能的影響,了解如何避免常見(jiàn)問(wèn)題,一步步學(xué)會(huì)編寫可處理大量并行線程的應(yīng)用程序,并掌握高級(jí)并行化技術(shù)。
《多核應(yīng)用編程實(shí)戰(zhàn)》并不局限于一種方式或平臺(tái)。有了它,每一位使用現(xiàn)代多核處理器的c程序員都能在任意前沿操作系統(tǒng)環(huán)境中游刃有余!
《多核應(yīng)用編程實(shí)戰(zhàn)》內(nèi)容
在最佳時(shí)機(jī)采用并行化技術(shù)
在多線程間安全共享數(shù)據(jù)
用posix或windows線程編寫應(yīng)用程序
用自定義代碼實(shí)現(xiàn)同步和共享
充分利用自動(dòng)并行化和openmp
克服限制擴(kuò)展性的常見(jiàn)障礙
用新的方法編寫正確、快速、可擴(kuò)展的并行代碼
目錄
《多核應(yīng)用編程實(shí)戰(zhàn)》
第1章 硬件、進(jìn)程和線程 1
1.1 計(jì)算機(jī)的內(nèi)部結(jié)構(gòu) 1
1.2 多核處理器的緣起 3
1.2.1 在單芯片上支持多線程 4
1.2.2 通過(guò)處理器核心流水線作業(yè)提高指令發(fā)出率 8
1.2.3 使用緩存保存最近使用的數(shù)據(jù) 10
1.2.4 用虛擬內(nèi)存存儲(chǔ)數(shù)據(jù) 12
1.2.5 從虛擬地址轉(zhuǎn)換到物理地址 13
1.3 多處理器系統(tǒng)的特征 14
1.4 源代碼到匯編語(yǔ)言的轉(zhuǎn)換 16
1.4.1 32位與64位代碼的性能 18
1.4.2 確保內(nèi)存操作的正確順序 19
1.4.3 進(jìn)程和線程的差異 21
1.5 小結(jié) 23
第2章 高性能編碼 24
2.1 定義性能 24
2.2 了解算法復(fù)雜度 25
2.2.1 算法復(fù)雜度的示例 26
2.2.2 算法復(fù)雜度的重要性 28
.2.2.3 謹(jǐn)慎運(yùn)用算法復(fù)雜度 30
2.3 結(jié)構(gòu)如何影響性能 30
2.3.1 在源代碼和生成結(jié)構(gòu)上權(quán)衡性能和便利性 30
2.3.2 利用庫(kù)結(jié)構(gòu)化應(yīng)用程序 33
2.3.3 數(shù)據(jù)結(jié)構(gòu)對(duì)性能的影響 42
2.4 編譯器的作用 47
2.4.1 兩種編譯器優(yōu)化 48
2.4.2 選擇合適的編譯器選項(xiàng) 50
2.4.3 如何用跨文件優(yōu)化提高性能 51
2.4.4 使用配置文件反饋 53
2.4.5 潛在的指針別名會(huì)如何抑制編譯器優(yōu)化 55
2.5 通過(guò)分析確定占用時(shí)間的地方 58
2.6 怎樣避免手動(dòng)優(yōu)化 64
2.7 從設(shè)計(jì)角度看性能 64
2.8 小結(jié) 65
第3章 識(shí)別并行機(jī)會(huì) 66
3.1 使用多進(jìn)程提高系統(tǒng)工作效率 66
3.2 多用戶使用一個(gè)系統(tǒng) 67
3.3 通過(guò)整合提高機(jī)器工作效率 68
3.3.1 用容器隔離共享一個(gè)系統(tǒng)的應(yīng)用程序 69
3.3.2 使用虛擬機(jī)監(jiān)控程序托管多個(gè)操作系統(tǒng) 69
3.4 采用并行機(jī)制提高單個(gè)任務(wù)的性能 71
3.4.1 理解并行應(yīng)用程序 72
3.4.2 并行如何影響算法的選擇 72
3.4.3 amdahl定律 73
3.4.4 確定最大實(shí)際線程數(shù) 75
3.4.5 同步成本怎樣降低擴(kuò)展性 76
3.5 并行模式 78
3.5.1 使用simd指令的數(shù)據(jù)并行 78
3.5.2 通過(guò)進(jìn)程或線程實(shí)現(xiàn)并行化 79
3.5.3 多個(gè)獨(dú)立任務(wù) 79
3.5.4 多個(gè)松散耦合的任務(wù) 80
3.5.5 相同任務(wù)的多個(gè)副本 81
3.5.6 單個(gè)任務(wù)拆分到多個(gè)線程 82
3.5.7 使用流水線任務(wù)完成某個(gè)事項(xiàng) 82
3.5.8 將工作分配給客戶端和服務(wù)器 83
3.5.9 將責(zé)任劃分給生產(chǎn)者和消費(fèi)者 84
3.5.10 結(jié)合多種并行化策略 85
3.6 依賴關(guān)系對(duì)并行運(yùn)行代碼能力的影響 85
3.6.1 反依賴和輸出依賴 86
3.6.2 通過(guò)推測(cè)打破依賴 88
3.6.3 關(guān)鍵路徑 91
3.7 發(fā)現(xiàn)并行機(jī)會(huì) 92
3.8 小結(jié) 93
第4章 同步和數(shù)據(jù)共享 94
4.1 數(shù)據(jù)爭(zhēng)用 94
4.1.1 使用工具檢測(cè)數(shù)據(jù)爭(zhēng)用 95
4.1.2 避免數(shù)據(jù)爭(zhēng)用 98
4.2 同步原語(yǔ) 98
4.2.1 互斥量和臨界區(qū) 98
4.2.2 自旋鎖 99
4.2.3 信號(hào)量 100
4.2.4 讀寫鎖 100
4.2.5 屏障 101
4.2.6 原子操作和無(wú)鎖代碼 102
4.3 死鎖和活鎖 103
4.4 線程和進(jìn)程間的通信 104
4.4.1 內(nèi)存、共享內(nèi)存和內(nèi)存映射文件 104
4.4.2 條件變量 105
4.4.3 信號(hào)和事件 107
4.4.4 消息隊(duì)列 108
4.4.5 命名管道 108
4.4.6 通過(guò)網(wǎng)絡(luò)棧進(jìn)行通信 109
4.4.7 線程之間共享數(shù)據(jù)的其他方法 110
4.5 存儲(chǔ)線程私有數(shù)據(jù) 110
4.6 小結(jié) 112
第5章 使用posix線程 113
5.1 創(chuàng)建線程 113
5.1.1 線程終止 114
5.1.2 用子線程接收和傳遞數(shù)據(jù) 115
5.1.3 分離線程 116
5.1.4 設(shè)置pthread的屬性 117
5.2 編譯多線程代碼 119
5.3 進(jìn)程終止 121
5.4 線程之間共享數(shù)據(jù) 122
5.4.1 使用互斥鎖保護(hù)訪問(wèn) 122
5.4.2 互斥鎖屬性 124
5.4.3 使用自旋鎖 125
5.4.4 讀寫鎖 127
5.4.5 屏障 129
5.4.6 信號(hào)量 130
5.4.7 條件變量 136
5.5 變量和內(nèi)存 140
5.6 多進(jìn)程編程 143
5.6.1 在進(jìn)程之間共享內(nèi)存 144
5.6.2 在進(jìn)程之間共享信號(hào)量 147
5.6.3 消息隊(duì)列 147
5.6.4 管道和命名管道 150
5.6.5 使用信號(hào)與進(jìn)程通信 151
5.7 套接字 156
5.8 可重入代碼和編譯器標(biāo)志 158
5.9 小結(jié) 160
第6章 windows線程 161
6.1 創(chuàng)建windows本機(jī)線程 161
6.1.1 終止線程 165
6.1.2 創(chuàng)建和重新啟動(dòng)掛起的線程 167
6.1.3 使用內(nèi)核資源的句柄 168
6.2 同步和資源共享的方式 168
6.2.1 線程間需要同步的一個(gè)例子 169
6.2.2 保護(hù)對(duì)臨界區(qū)代碼的訪問(wèn) 170
6.2.3 用互斥量保護(hù)代碼段 172
6.2.4 輕量級(jí)讀寫鎖 173
6.2.5 信號(hào)量 175
6.2.6 條件變量 177
6.2.7 向其他線程或進(jìn)程發(fā)出事件完成的信號(hào) 178
6.3 windows中的寬字符串處理 179
6.4 創(chuàng)建進(jìn)程 180
6.4.1 在進(jìn)程之間共享內(nèi)存 182
6.4.2 在子進(jìn)程中繼承句柄 185
6.4.3 互斥量命名及其在進(jìn)程間的共享 186
6.4.4 用管道通信 187
6.4.5 用套接字進(jìn)行通信 190
6.5 變量的原子更新 193
6.6 分配線程本地存儲(chǔ) 195
6.7 設(shè)置線程的優(yōu)先級(jí) 197
6.8 小結(jié) 198
第7章 自動(dòng)并行化和openmp 199
7.1 使用自動(dòng)并行化產(chǎn)生并行代碼 199
7.1.1 識(shí)別和并行約簡(jiǎn) 203
7.1.2 對(duì)包含調(diào)用的代碼進(jìn)行自動(dòng)并行化 204
7.1.3 協(xié)助編譯器實(shí)現(xiàn)代碼的自動(dòng)并行化 206
7.2 使用openmp生成并行應(yīng)用程序 208
7.2.1 使用openmp并行化循環(huán) 209
7.2.2 openmp應(yīng)用程序的運(yùn)行時(shí)行為 210
7.2.3 openmp并行區(qū)域中的變量作用域 210
7.2.4 使用openmp并行化約簡(jiǎn) 212
7.2.5 在并行區(qū)域外訪問(wèn)私有數(shù)據(jù) 212
7.2.6 使用調(diào)度改進(jìn)工作分配 214
7.2.7 用并行段完成獨(dú)立工作 217
7.2.8 嵌套并行 218
7.2.9 使用openmp動(dòng)態(tài)定義并行任務(wù) 219
7.2.10 保持?jǐn)?shù)據(jù)對(duì)線程私有 223
7.2.11 控制openmp運(yùn)行時(shí)環(huán)境 225
7.2.12 等待工作完成 227
7.2.13 限制執(zhí)行代碼區(qū)域的線程 229
7.3 確保并行區(qū)域的代碼按順序執(zhí)行 232
7.4 折疊循環(huán)改進(jìn)工作負(fù)荷均衡 233
7.5 強(qiáng)制實(shí)現(xiàn)內(nèi)存一致性 234
7.6 并行化示例 235
7.7 小結(jié) 239
第8章 手工編碼的同步和共享 240
8.1 原子操作 240
8.1.1 用比較和交換指令構(gòu)成更復(fù)雜的原子操作 242
8.1.2 強(qiáng)制實(shí)現(xiàn)內(nèi)存排序以確保正確操作 245
8.1.3 編譯器對(duì)內(nèi)存排序指令的支持 247
8.1.4 編譯器對(duì)操作的重新排序 247
8.1.5 易失變量 251
8.2 操作系統(tǒng)提供的原子操作 251
8.3 無(wú)鎖算法 254
8.3.1 dekker算法 254
8.3.2 帶循環(huán)緩存的生產(chǎn)者/消費(fèi)者 256
8.3.3 擴(kuò)展到多個(gè)消費(fèi)者或生產(chǎn)者 259
8.3.4 將生產(chǎn)者/消費(fèi)者擴(kuò)展到多個(gè)線程 260
8.3.5 更改生產(chǎn)者/消費(fèi)者代碼為使用原子操作 266
8.3.6 aba問(wèn)題 268
8.4 小結(jié) 271
第9章 基于多核處理器的擴(kuò)展 272
9.1 對(duì)應(yīng)用程序擴(kuò)展的限制 272
9.1.1 串行代碼對(duì)性能的限制 272
9.1.2 超線性擴(kuò)展 275
9.1.3 工作負(fù)荷不均衡 276
9.1.4 熱鎖 277
9.1.5 庫(kù)代碼擴(kuò)展 282
9.1.6 工作量不足 284
9.1.7 算法限制 286
9.2 擴(kuò)展的硬件限制 288
9.2.1 核心之間的帶寬共享 288
9.2.2 偽共享 290
9.2.3 緩存沖突和容量 293
9.2.4 流水線資源匱乏 297
9.3 操作系統(tǒng)對(duì)擴(kuò)展性的限制 301
9.3.1 過(guò)度訂閱 301
9.3.2 使用處理器綁定改善內(nèi)存局部性 303
9.3.3 優(yōu)先級(jí)反轉(zhuǎn) 310
9.4 多核處理器和擴(kuò)展 310
9.5 小結(jié) 311
第10章 其他并行技術(shù) 312
10.1 基于gpu的運(yùn)算 312
10.2 語(yǔ)言擴(kuò)展 314
10.2.1 線程構(gòu)建模塊 314
10.2.2 cilk++ 317
10.2.3 grand central dispatch 320
10.2.4 為未來(lái)c和c++標(biāo)準(zhǔn)提議的可能功能 321
10.2.5 微軟的c++/cli 324
10.3 其他語(yǔ)言 325
10.4 集群技術(shù) 327
10.4.1 mpi 328
10.4.2 以mapreduce作為擴(kuò)展策略 331
10.4.3 網(wǎng)格 332
10.5 事務(wù)性內(nèi)存 332
10.6 向量化 333
10.7 小結(jié) 334
第11章 結(jié)束語(yǔ) 335
11.1 編寫并行應(yīng)用程序 335
11.1.1 識(shí)別任務(wù) 335
11.1.2 估算性能提升 336
11.1.3 確定依賴關(guān)系 336
11.1.4 數(shù)據(jù)爭(zhēng)用和互斥鎖擴(kuò)展限制 336
11.1.5 鎖的粒度 337
11.2 多核處理器上的并行代碼 337
11.3 并行化的未來(lái) 339
參考文獻(xiàn) 340
索引 342
本圖書信息來(lái)源:互動(dòng)出版網(wǎng)
本文關(guān)鍵詞:多核應(yīng)用編程實(shí)戰(zhàn),,由筆耕文化傳播整理發(fā)布。
本文編號(hào):105436
本文鏈接:http://sikaile.net/wenshubaike/mishujinen/105436.html