考察數(shù)據(jù)科學(xué)家和分析師的 41 個統(tǒng)計學(xué)問題
ID:DatapiTHU
作者:Dishashree Gupta
編譯:閔黎 牋 盧苗苗 丁楠雅
本文是 Analytics Vidhya 所舉辦的在線統(tǒng)計學(xué)測試的原題,有志于成為數(shù)據(jù)科學(xué)家或者數(shù)據(jù)分析師的同仁可以以這 41 個問題測試自己的統(tǒng)計學(xué)水平。
介紹
統(tǒng)計學(xué)是數(shù)據(jù)科學(xué)和任何數(shù)據(jù)分析的基礎(chǔ)。良好的統(tǒng)計學(xué)知識可以幫助數(shù)據(jù)分析師做出正確的商業(yè)決策。一方面,描述性統(tǒng)計幫助我們通過數(shù)據(jù)的集中趨勢和方差了解數(shù)據(jù)及其屬性。另一方面,推斷性統(tǒng)計幫助我們從給定的數(shù)據(jù)樣本中推斷總體的屬性。了解描述性和推斷性統(tǒng)計學(xué)知識對于立志成為數(shù)據(jù)科學(xué)家或分析師至關(guān)重要。
為了幫助您提高統(tǒng)計學(xué)知識,我們進(jìn)行了這次實踐測試。測試涉及描述性和推斷性統(tǒng)計。測試題提供了答案和解釋,以防你遇到卡殼的問題。
如果您錯過了測試,請在閱讀答案之前嘗試解決問題。
總得分
以下是測試得分的分布情況,幫助您評估您的測試表現(xiàn)。
您可以訪問這里(https://datahack.analyticsvidhya.com/contest/skilltest-statistics-3/lb)查看最終成績。
超過 450 人參加了這次測試,獲得的最高分是 37 分。以下是一些關(guān)于分?jǐn)?shù)分布的統(tǒng)計數(shù)據(jù):
平均得分:20.40
得分中位數(shù):23
得分眾數(shù):25
問題與答案
1)哪些統(tǒng)計方法用來度量數(shù)據(jù)的集中趨勢?
A)平均值和正態(tài)分布
B)平均值,中位數(shù)和眾數(shù)
C)眾數(shù),Alpha 和極差
D)標(biāo)準(zhǔn)差,極差和平均值
E)中位數(shù),極差和正態(tài)分布
答案:(B)
平均值,中位數(shù)和眾數(shù)是分析數(shù)據(jù)集中趨勢的三種統(tǒng)計方法。 我們使用這些測量方法來查找數(shù)據(jù)集的中心值,,以及總結(jié)整個數(shù)據(jù)集。
2)給出 5 個數(shù)字:(5,10,15,5,15),求單項數(shù)據(jù)與平均值之間的離差的和。
A)10
B)25
C)50
D)0
E)以上都沒有
答案:(D)
單項數(shù)據(jù)的離差之和始終為 0。
3)每年進(jìn)行一次考試。 考試的平均分為 150 分,標(biāo)準(zhǔn)差為 20。如果 Ravi 的 Z 值為 1.50,他的得分是多少?
A)180
B)130
C)30
D)150
答案:(A)
X = μ +Z σ,其中 μ 是平均值,σ 是標(biāo)準(zhǔn)差,X 是我們計算的分?jǐn)?shù)。 因此 X = 150 + 20 * 1.5 = 180
4)如果數(shù)據(jù)集中的單項數(shù)值發(fā)生變化,則以下集中趨勢中的哪個測量值一定會發(fā)生變化?
A)平均值
B)中位數(shù)
C)眾數(shù)
D)上述所有
如果我們改動數(shù)據(jù)集中的任何值,數(shù)據(jù)集的平均值一定會改變。 因為平均值是由數(shù)據(jù)集中的所有值匯總求得的,所以數(shù)據(jù)集中的每個值都對平均值起作用。 中位數(shù)和眾數(shù)可能會改變,也可能不會隨數(shù)據(jù)集中的單個值而改變。
5)下圖所示,標(biāo)尺的垂線上有六個數(shù)據(jù)點(diǎn)。
以下哪一條垂直線代表給定數(shù)據(jù)點(diǎn)的平均值?其中標(biāo)尺的比例單位相同。
A)A
B)B
C)C
D)D
答案:(C)
從視覺上觀察數(shù)據(jù)點(diǎn)做判斷有點(diǎn)困難, 我們可以通過簡單的取值來理解平均值。 令 A 為 1,B 為 2,C 為 3 等。 所示的數(shù)據(jù)值將變?yōu)?{1,1,1,4,5,6},這意味著是 18/6 = 3 即 C.
6)如果正偏態(tài)分布的中位數(shù)為 50,則下列哪個選項是正確的?
A)平均值大于 50
B)平均值小于 50
C)眾數(shù)小于 50
D)眾數(shù)大于 50
E)A 和 C
F)B 和 D
答案:(E)
以下是負(fù)偏態(tài)分布,正態(tài)分布和正偏態(tài)分布曲線:
B)σ 1 中位數(shù)(V)
因為沒有提到變量 V 的分布類型,我們不能肯定地說 V 是有偏的。
38)普通最小二乘法(OLS)線性回歸方程得到的回歸線試圖 ____?
A)通過盡可能多的點(diǎn)
B)通過盡可能少的點(diǎn)
C)最小化所觸及的點(diǎn)數(shù)
D)最小化點(diǎn)到回歸線的距離的平方
回歸線嘗試最小化點(diǎn)到回歸線之間的距離的平方。根據(jù)定義,普通最小二乘法回歸方程具有誤差的平方的最小和。 這意味著殘差的平方和也應(yīng)該是最小化的。這條回歸線可能會也可能不會通過最多的數(shù)據(jù)點(diǎn)。最常見的情況是,當(dāng)數(shù)據(jù)有很多離群值或線性關(guān)系不是非常強(qiáng)的時候,回歸線不是通過所有的點(diǎn),而是盡量減少通過的點(diǎn)的誤差平方和。
39)下表是一個線性回歸方程(Y = 5X+40)。
以下哪一項是該線性方程模型的 MAE(平均絕對誤差)?
A)8.4
B)10.29
C)42.5
為了計算本題中的平均絕對誤差,我們首先用給定的方程計算 Y 值,然后計算相對于實際 Y 值的絕對誤差。 那么這個絕對誤差的平均值將是平均絕對誤差。 下表總結(jié)了這些值。
A)增加 1 磅
B)增加 5 磅
C)增加 125 磅
觀察給定方程 y = 120 + 5x, 如果身高增加 1 個單位,則體重將增加 5 磅。因為截距 120 是不變的,不會貢獻(xiàn)差異。
41) [ 對錯判斷 ]
本文編號:2176253
本文鏈接:http://sikaile.net/wenshubaike/dxkc/2176253.html