計(jì)算機(jī)體系結(jié)構(gòu):量化研究方法(第5版)
本文關(guān)鍵詞:計(jì)算機(jī)體系結(jié)構(gòu):量化研究方法,由筆耕文化傳播整理發(fā)布。
> 計(jì)算機(jī)體系結(jié)構(gòu):量化研究方法(第5版) 1.13 歷史回顧與參考文獻(xiàn) 2013-01-04 09:06:24 我要投稿
本文所屬圖書 > 計(jì)算機(jī)體系結(jié)構(gòu):量化研究方法(第5版)
本書是最權(quán)威的計(jì)算機(jī)體系結(jié)構(gòu)著作,是久負(fù)盛名的經(jīng)典作品。書中系統(tǒng)地介紹了計(jì)算機(jī)系統(tǒng)的設(shè)計(jì)基礎(chǔ)、指令集系統(tǒng)結(jié)構(gòu)、流水線和指令集并行技術(shù)、層次化存儲系統(tǒng)與存儲設(shè)備、互連網(wǎng)絡(luò)以及多處理器系統(tǒng)等重要內(nèi)容。... 立即去當(dāng)當(dāng)網(wǎng)訂購
附錄L從歷史角度回顧了本書每一章中介紹的重要思想。這些歷史回顧可以讓我們通過一系列計(jì)算機(jī)或重大項(xiàng)目的介紹來了解一種思想的發(fā)展歷程。如果你想研究一種思想或機(jī)器的最初發(fā)展,或者希望擴(kuò)展閱讀,可以參見每段歷史介紹的末尾提供的參考文獻(xiàn)。關(guān)于本章,可參見附錄L.2節(jié)(The Early Development of Computers,計(jì)算機(jī)的早期發(fā)展),其中討論了數(shù)字計(jì)算機(jī)及性能測量方法的早期發(fā)展。
在閱讀這些歷史資料時,你很快就會意識到,與許多其他工程領(lǐng)域相比,計(jì)算科學(xué)是如此“年輕”,它的重要優(yōu)勢之一就是許多先驅(qū)仍 然健在——我們可以直接向他們了解歷史!
案例研究與練習(xí)(Diana Franklin設(shè)計(jì))
案例研究1:芯片制造成本
本案例研究說明的概念
制造成本
制造成品率
以冗余容忍缺陷
計(jì)算機(jī)芯片的價格中涉及許多因素。新的小型化技術(shù)大幅提升了芯片性能,降低了所需要的芯片面積。采用小型化技術(shù),人們可以縮小芯片的面積或者在芯片上放置更多硬件,從而實(shí)現(xiàn)更多功能。在這個研究案例中,我們將研究包括制造技術(shù)、芯片面積和冗余在內(nèi)的各種不同設(shè)計(jì)決策是如何影響芯片成本的,見表1-11。
表1-11 幾種現(xiàn)代處理器的制造成本因素
芯 片 晶片尺寸(mm2) 估測缺陷率(每cm2) 制程(nm) 晶體管數(shù)(百萬個)
IBM Power5 389 0.30 130 276
Sun Niagara 380 0.75 90 279
AMD Opteron 199 0.75 90 233
1.1 [10/10] <1.6>表1-11給出了影響幾種當(dāng)前芯片成本的相關(guān)芯片統(tǒng)計(jì)數(shù)字。在下面幾個練習(xí)中,我們將研究IBM Power5的不同設(shè)計(jì)決策所產(chǎn)生的影響。
a. [10] <1.6>IBM Power5的成品率是多少?
b. [10] <1.6>為什么IBM Power5的缺陷率要低于Niagara和Opteron?
1.2 [20/20/20/20] <1.6>建造一套新的制造設(shè)備需要10億美元。我們將銷售由這家工廠生成的一系列芯片,需要決定每種芯片的生產(chǎn)量。Woods芯片的大小為150 mm2,每個無缺陷芯片的利潤為20美元。Markon芯片的大小為250 mm2,每個無缺陷芯片的利潤為25美元。這套制造設(shè)備與Power5的制造設(shè)備相同。每個晶圓的直徑為300 mm。
a. [20] <1.6>如果制造Woods芯片,每個晶圓的利潤為多少?
b. [20] <1.6>如果制造Markon芯片,每個晶圓的利潤為多少?
c. [20] <1.6>我們應(yīng)當(dāng)用這套設(shè)備生產(chǎn)哪種芯片?
d. [20] <1.6>每種新Power5芯片的利潤是多少?如果Woods芯片的月需求量為50 000個,Markon芯片為25 000個,而這套設(shè)備一個月可以生產(chǎn)150個晶圓,如何分配這些晶圓?
1.3 [20/20] <1.6>AMD公司的一位同事建議:由于成品率如此之低,所以如果在晶片上再放一個核心,只有那些兩個處理器都失效的芯片才被扔掉,那就有可能降低芯片的制造成本。為了完成這個練習(xí),我們將成品率看作是在給定缺陷率下,特定區(qū)域未發(fā)生缺陷的概率。分別基于每種Opteron核心計(jì)算概率(這種計(jì)算方法可能不完全準(zhǔn)確,成品率公式是根據(jù)實(shí)驗(yàn)證據(jù)得出的,而不是根據(jù)芯片不同部分出現(xiàn)錯誤的概率,再經(jīng)過數(shù)學(xué)計(jì)算得出的)。
a. [20] <1.6>在兩個處理器核心中,缺陷核心數(shù)不超過一個的概率是多少?
b. [20] <1.6>如果每個舊芯片的成本為20美元,考慮到新的芯片面積和成品率,新芯片的成本應(yīng)當(dāng)是多少?
案例研究2:計(jì)算機(jī)系統(tǒng)中的功耗
本案例研究說明的概念
Amdahl定律
冗余
MTTF
功耗
現(xiàn)代系統(tǒng)中的功率取決于多種因素,包括芯片時鐘頻率、效率、磁盤驅(qū)動器速度、磁盤驅(qū)動器使用率和DRAM。下面的練習(xí)研究不同設(shè)計(jì)決策和使用情景對功率的影響。
1.4 [20/10/20] <1.5>表1-12給出了幾種計(jì)算機(jī)系統(tǒng)組件的功耗。在這個練習(xí)中,我們將研究硬盤驅(qū)動器是如何影響系統(tǒng)功耗的。
a. [20] <1.5>假定每個組件的負(fù)載最大,且電源效率為80%,有一系統(tǒng),采用Intel Pentium 4芯片,2 GB 240管腳金士頓DRAM和一個7200 rpm的硬盤驅(qū)動器,問服務(wù)器電源必須向這個系統(tǒng)提供的功率為多少瓦?
b. [10] <1.5>如果這個7200 rpm磁盤驅(qū)動器的空閑時間大約占60%,則它會消耗多少功率?
c. [20] <1.5>假定從一個7200 rpm磁盤驅(qū)動器讀取數(shù)據(jù)的時間大約是5400 rpm磁盤讀取時間的75%,7200 rpm磁盤的空閑時間占多大比例時,兩個磁盤的平均功耗相等嗎?
1.5 [10/10/20] <1.5>在為服務(wù)器場供電時,一個至關(guān)重要的因素就是冷卻。如果不能有效地使計(jì)算機(jī)散熱,風(fēng)扇就會把熱空氣而不是冷空氣吹回計(jì)算機(jī)。我們將研究各種不同設(shè)計(jì)決策如何影響一個系統(tǒng)的必要冷卻方式,從而影響它的價格。請使用表1-12進(jìn)行功率計(jì)算。
a. [10] <1.5>機(jī)架上安裝一個冷卻門的成本是4000美元,可以消散14 KW(向室內(nèi)散熱;向室外散熱需要增加成本)。如果服務(wù)器采用Intel Pentium 4處理器,1 GB 240管腳DRAM和一個7200 rpm硬盤驅(qū)動器,那么一個冷卻門可以冷卻多少個服務(wù)器?
b. [10] <1.5>我們正在考慮為硬盤驅(qū)動器提供容錯功能。RAID 1將磁盤數(shù)目加倍(見第6章),F(xiàn)在,一個只有一個冷卻器的機(jī)架中可以放入多少個系統(tǒng)?
c. [20] <1.5>典型的服務(wù)器場每平方英尺可以消耗最多200W的熱量。如果一個服務(wù)器機(jī)架需要11平方英尺(包括前后間隙),在一個機(jī)架內(nèi)可以放入多少個第(a)步中提到的服務(wù)器?需要多少個冷卻門?
表1-12 幾種計(jì)算機(jī)組件的功耗
組件類型 產(chǎn) 品 性 能 功 率
處理器 Sun Niagara 8-core 1.2 GHz 72~79 W(峰值)
Intel Pentium 4 2 GHz 48.9~66 W
DRAM 金士頓X64C3AD2 1 GB 184個管腳 3.7W
金士頓D2N3 1 GB 240個管腳 2.3W
硬盤驅(qū)動器 DiamondMax 16 5400 rpm 讀取/尋道時7.0 W,空閑時2.9 W
DiamondMax 9 7200 rpm 讀取/尋道時7.9 W,空閑時4.0 W
1.6 [討論]<1.8>表1-13給出了幾種基準(zhǔn)測試對兩個服務(wù)器的功率和性能進(jìn)行對比的結(jié)果。兩個服務(wù)器分別為Sun Fire T2000(采用Niagara)和IBM x346(使用Intel Xeon處理器)。這一信息曾在Sun Web網(wǎng)站上發(fā)布。共發(fā)布了兩條信息:兩個基準(zhǔn)測試的功率和速度。對于所示結(jié)果,Sun Fire T2000顯然要更好一些。還有其他哪些因素也很重要,會使一些人因?yàn)镮BM x346在這些領(lǐng)域有出眾表現(xiàn)而選擇它?
表1-13 Sun功率/性能對比,由Sun選擇性報(bào)告
Sun Fire T2000 IBM x346
功率(瓦) 298 438
SPECjbb(操作數(shù)/秒) 63 378 39 985
功率(瓦) 330 438
SPECWeb(復(fù)合) 14 001 1348
1.7 [20/20/20/20] <1.6、1.9>公司的內(nèi)部研究表明:一個單核系統(tǒng)就足以滿足對處理能力的要求,而我們正在研究使用兩個核心能否節(jié)省功率。
a. [20] <1.9>假定應(yīng)用程序有80%是可并行化的。可以將頻率降低多少而仍能獲得相同性能?
b. [20] <1.6>假定電壓可能隨頻率線性下降。利用1.5節(jié)的公式,與單核系統(tǒng)相比,雙核系統(tǒng)可能需要多少動態(tài)功率?
c. [20] <1.6、1.9>現(xiàn)在假定電壓不會降至原電壓的25%以下。這一電壓被稱為電壓下限,低于這一電壓就會丟失狀態(tài)。當(dāng)并行化百分比為多少時,將使電壓處于這一電壓下限?
d. [20] <1.6、1.9>使用1.5節(jié)的公式,考慮到電壓下降,雙核系統(tǒng)與單核系統(tǒng)相比,需要多少動態(tài)功率?
練習(xí)
1.8 [10/15/15/10/10] <1.4、1.5>架構(gòu)師面對的一個挑戰(zhàn)是,今天擬定的設(shè)計(jì)方案可能需要幾年的時間進(jìn)行實(shí)施、驗(yàn)證和測試,然后才能上市。這就意味著架構(gòu)師必須提前為幾年之后的技術(shù)進(jìn)步制定計(jì)劃。有時,這是很難做到的。
a. [10] <1.4>根據(jù)摩爾定律觀測到的器件發(fā)展趨勢,到2015年,一個芯片上的晶體管數(shù)目應(yīng)當(dāng)是2005年的多少倍?
b. [15] <1.5>時鐘頻率的增加也一度反映了這一趨勢。如果時鐘頻率仍以20世紀(jì)90年代的相同速度攀升,2015年的時鐘速率大約是多少?
c. [15] <1.5>以目前的增長速率,2015年的時鐘頻率是多少?
d. [10] <1.4>是什么限制了時鐘頻率的增長速度?為了提升性能,架構(gòu)師現(xiàn)在能用多出來的晶體管做些什么?
e. [10] <1.4>DRAM容量的增長速度也已變緩。20年來,DRAM容量每年提高60%。這一速率下降到每年40%,現(xiàn)在的改進(jìn)速率為每年25%~40%。如果這一趨勢繼續(xù)下去,2020年的DRAM容量增速大約是多少?
1.9 [10/10] <1.5>我們正在為一種實(shí)時應(yīng)用設(shè)計(jì)系統(tǒng),這種應(yīng)用要求必須在指定期限之前完成計(jì)算。提前完成計(jì)算沒有任何收益。我們發(fā)現(xiàn),在最糟糕的情況下,這一系統(tǒng)執(zhí)行必需代碼的速度是最低要求速度的兩倍。
a. [10] <1.5>如果以當(dāng)前速度執(zhí)行計(jì)算,并在完成任務(wù)后關(guān)閉系統(tǒng),可以節(jié)省多少能量?
b. [10] <1.5>如果將電壓和頻率設(shè)置為現(xiàn)在的一半,可以節(jié)省多少能量?
1.10 [10/10/20/20] <1.5>諸如Google和Yahoo!之類的服務(wù)器場都為當(dāng)時的最高請求速率提供了足夠的計(jì)算容量。假設(shè)這些服務(wù)器在大多數(shù)時間內(nèi)僅以60%的容量運(yùn)行。進(jìn)一步假設(shè)功率不會隨負(fù)載線性改變,也就是說,當(dāng)服務(wù)器以60%的容量運(yùn)行時,它們消耗的功率為最大功率的90%。這些服務(wù)器可以關(guān)閉,但在負(fù)載更多時,需要的重新啟動時間過長。有人提議采用一種新型系統(tǒng),,它能夠快速重新啟動,但處在這種“勉強(qiáng)生存”狀態(tài)時需要消耗一定的功率,為最大值的20%。
a. [10] <1.5>關(guān)閉60%的服務(wù)器可以節(jié)省多少功率?
b. [10] <1.5>將60%的服務(wù)器置于“勉強(qiáng)生存”狀態(tài),可以節(jié)省多少功率?
c. [20] <1.5>將電壓降低20%,頻率降低40%,可以節(jié)省多少功率?
d. [20] <1.5>將30%的服務(wù)器置于“勉強(qiáng)生存”狀態(tài),30%的服務(wù)器關(guān)閉,可以節(jié)省多少功率?
1.11 [10/10/20] <1.7>可用性是服務(wù)器設(shè)計(jì)中的最重要考慮事項(xiàng),緊隨其后的是可擴(kuò)展性和吞吐量。
a. [10] <1.7>有一個處理器,其FIT為100。這個系統(tǒng)的平均無故障時間(MTTF)為多少?
b. [10] <1.7>如果需要1天的時間才能讓這個系統(tǒng)再次正常運(yùn)行,這個系統(tǒng)的可用性是多少?
c. [20] <1.7>假設(shè)政府為了降低成本,準(zhǔn)備用廉價計(jì)算機(jī)構(gòu)建一個超級計(jì)算機(jī),而不是使用可靠但卻昂貴的計(jì)算機(jī)。一個具有1000個處理器的系統(tǒng),其MTTF為多少?(假設(shè)這些處理器一損俱損。)
1.12 [20/20/20] <1.1、1.2、1.7>在Amazon或eBay使用的服務(wù)器場中,一個故障不會導(dǎo)致整個系統(tǒng)崩潰,而是減少在任意時刻能夠滿足的請求數(shù)目。
a. [20] <1.7>如果一個公司有10 000臺計(jì)算機(jī),每臺計(jì)算機(jī)的MTTF為35天,而且只有當(dāng)1/3以上的計(jì)算機(jī)發(fā)生故障時才會經(jīng)歷災(zāi)難性故障,系統(tǒng)的MTTF為多少?
b. [20] <1.1、1.7>如果一臺計(jì)算機(jī)的MTTF加倍,需要另加1000美元,這是不是一個很好的業(yè)務(wù)決策?證明你的結(jié)論。
c. [20] <1.2>表1-2給出了宕機(jī)的平均成本,假定在一年的所有時間內(nèi),該成本不變。但對于零售商來說,圣誕季節(jié)是盈利水平最高的(因此,如果因?yàn)殄礄C(jī)造成無法銷售,損失也最大)。如果目錄銷售中心在第四季度的通信流量是其他任一季度的兩倍,那第四季度每小時的平均宕機(jī)成本是多少?其他時間的宕機(jī)成本又是多少?
1.13 [10/20/20] <1.9>你的公司正要選擇是購買Opteron,還是Itanium 2。你已經(jīng)分析了公司的應(yīng)用情況,在60%的時間里運(yùn)行類似于wupwise之類的應(yīng)用程序,20%的時間里運(yùn)行類似于ammp之類的應(yīng)用程序,20%的時間里運(yùn)行類似于apsi之類的應(yīng)用程序。
a. [10] 如果僅依據(jù)SPEC總體性能進(jìn)行選擇,你選擇哪一種?為什么?
b. [20] 對Opteron和Itanium 2來說,這種混合應(yīng)用程序的加權(quán)平均執(zhí)行時間比是多少?
c. [20] Opteron相對于Itanium 2的加速比是多少?
1.14 [20/10/10/10/15] <1.9>在這個練習(xí)中,假定我們正在考慮通過添加向量硬件來提高一個機(jī)器的性能。當(dāng)一個計(jì)算運(yùn)行于向量硬件的向量模式時,其速度是正常執(zhí)行模式的10倍。我們將使用向量模式時花費(fèi)的時間百分比稱為向量化百分比。向量將在第4章討論,但回答下面的問題不需要知道有關(guān)其工作方式的任何信息!
a. [20] <1.9>繪制一條曲線,以加速比為因變量,以向量模式下所執(zhí)行計(jì)算的比例為自變量。將y軸標(biāo)記為“凈加速比”,x軸標(biāo)記為“向量化百分比”。
b. [10] <1.9>向量化百分比達(dá)到多少時,才能使加速比為2?
c. [10] <1.9>如果已經(jīng)使加速比為2,在向量模式下的計(jì)算運(yùn)行時間占多大百分比?
d. [10] <1.9>向量化百分比達(dá)到多少時,才能使加速比為向量模式所能實(shí)現(xiàn)的最大加速比的一半?
e. [15] <1.9>假定已經(jīng)測得程序的向量化百分比為70%。硬件設(shè)計(jì)組估計(jì),通過大量追加投入,可以加快向量硬件的速度。你想知道編譯器組是否也能提高向量化百分比。編譯器團(tuán)隊(duì)需要實(shí)現(xiàn)多大的向量化百分比,才能在向量單元中獲得另外2倍的加速(超過最初的10倍以上)?
1.15 [15/10] <1.9>假定我們對一臺計(jì)算機(jī)進(jìn)行了升級,使某種執(zhí)行模式提升為原來的10倍。升級模式的使用時間占總時間的50%,這一數(shù)值是在使用該升級模式時測得的執(zhí)行時間百分比。回想一下,Amdahl定律需要的是能改進(jìn)但還沒有改進(jìn)的原執(zhí)行時間比例。因此,在使用Amdahl定律計(jì)算加速比時,不能使用這個50%的測量值。
a. [15] <1.9>從快速模式獲得的加速比是多少?
b. [10] <1.9>轉(zhuǎn)換為快速模式的原執(zhí)行時間比例是多少?
1.16 [20/20/15] <1.9>在為了優(yōu)化處理器的某一部分而進(jìn)行改變時,經(jīng)常會出現(xiàn)這樣一種情況:加速某種類型的指令時,會降低其他某些指令的速度。例如,如果放入一個復(fù)雜的浮點(diǎn)單元,它要占用空間,為了容納它,就得將某些東西移得遠(yuǎn)一些,這樣就會要增加一些延遲周期才能到達(dá)被挪遠(yuǎn)的單元;镜腁mdahl定律公式?jīng)]有考慮這種折中。
a. [20] <1.9>如果這個新的快速浮點(diǎn)單元使浮點(diǎn)運(yùn)算平均提高到2倍,浮點(diǎn)運(yùn)算占用的時間為原程序執(zhí)行時間的20%,那么總加速比為多少(忽略對所有其他指令的影響)?
b. [20] <1.9>現(xiàn)在假定浮點(diǎn)單元的加速會降低數(shù)據(jù)緩存訪問的速度,減緩倍數(shù)為1.5(或者說加速比為2/3)。數(shù)據(jù)緩存訪問時間為總執(zhí)行時間的10%。現(xiàn)在的總加速比為多少?
c. [15] <1.9>在實(shí)現(xiàn)新的浮點(diǎn)運(yùn)算之后,在浮點(diǎn)運(yùn)算上花費(fèi)的執(zhí)行時間占多大比例?數(shù)據(jù)緩存訪問又占多大比例?
1.17 [10/10/20/20] <1.10>公司剛剛購買了一個新的Intel Core i5雙核處理器,你接到針對這一處理器來優(yōu)化軟件的任務(wù)。你將在這個雙核處理器上運(yùn)行兩個應(yīng)用程序,但它們的資源需求并不一樣。第一個程序需要80%的資源,另一個僅需要20%的資源。假定對該程序的一部分進(jìn)行并行化時,該部分的加速比為2。
a. [10] <1.10>假定第一個應(yīng)用程序的40%可以并行化,那么在隔離運(yùn)行時,通過這個應(yīng)用程序可以實(shí)現(xiàn)多大的加速比?
b. [10] <1.10>假定第二個應(yīng)用程序的99%可以并行化,那么在隔離運(yùn)行時,這個應(yīng)用程序可以達(dá)到多大的加速比?
c. [20] <1.10>假定第一個應(yīng)用程序的40%可以并行化,如果對其實(shí)現(xiàn)并行化,系統(tǒng)總加速比為多少?
d. [20] <1.10>假定第二個應(yīng)用程序的99%可以并行化,如果對其實(shí)現(xiàn)并行化,系統(tǒng)總加速比為多少?
1.18 [10/20/20/20/25] <1.10>在實(shí)現(xiàn)一個應(yīng)用程序的并行化時,理想加速比應(yīng)當(dāng)?shù)扔谔幚砥鞯膫數(shù)。但它要受到兩個因素的限制:可并行化應(yīng)用程序的百分比和通信成本。Amdahl定律考慮了前者,但沒有考慮后者。
a. [10] <1.10>如果應(yīng)用程序的80%可以并行化,N個處理器的加速比為多少?(忽略通信成本。)
b. [20] <1.10>如果每增加一個處理器,通信開銷為原執(zhí)行時間的0.5%,則8個處理器的加速比為多少?
c. [20] <1.10>如果處理器數(shù)目每增加一倍,通信開銷增加原執(zhí)行時間的0.5%,則8個處理器的加速比為多少?
d. [20] <1.10>如果處理器數(shù)目每增加一倍,通信開銷增加原執(zhí)行時間的0.5%,則N個處理器的加速比為多少?
e. [25] <1.10>寫出求解這一問題的一般公式:如果一個應(yīng)用程序中占原執(zhí)行時間的P%可以并行化,處理器數(shù)目每增加一倍,通信成本增加原執(zhí)行時間的5%,則達(dá)到最高加速比的處理器數(shù)目為多少?
點(diǎn)擊復(fù)制鏈接 與好友分享!回本站首頁 您對本文章有什么意見或著疑問嗎?請到論壇討論您的關(guān)注和建議是我們前行的參考和動力 上一篇:1.12 結(jié)語 下一篇:精益創(chuàng)業(yè)實(shí)戰(zhàn)(第2版) 相關(guān)文章1.13 如何用龍須面穿過整個宇宙?
1.13 傳播距離和輻射角
不期回報(bào)地參與對話
參與者
2.5.6 OLAP與OLTP
2.2.3 導(dǎo)航與搜索
1.1 《指南》與項(xiàng)目管理的關(guān)系
1.6.3 成本與價格
1.11 謬論與易犯錯誤
O2O與電商
圖文推薦本文關(guān)鍵詞:計(jì)算機(jī)體系結(jié)構(gòu):量化研究方法,由筆耕文化傳播整理發(fā)布。
本文編號:336428
本文鏈接:http://sikaile.net/wenshubaike/mishujinen/336428.html