原标题:统计学基础知识测试您来试试吧!
超过450人参加了这次测试,获得的最高分是37分以下是一些关于分数分布的统计数据:
以下是测试得分的分布情况,帮助您评估您的测试表现
1)哪些统计方法用来度量数据的集中趋势?
B)平均值中位数和众数
C)众数,Alpha和极差
D)标准差极差和平均值
E)中位数,极差和正态分布
2)给出5个数字:(5,10,15,5,15)求单项数据与平均值之间的离差的和。
3)每年进行一次考试 考试的平均分为150分,标准差为20如果Ravi的Z值为1.50,他的得分是多少
4)如果数据集中的单项数值发生变化,则以下集中趋势中的哪个测量值一定会发生变化
5)下图所示,标尺嘚垂线上有六个数据点
以下哪一条垂直线代表给定数据点的平均值?其中标尺的比例单位相同
6)如果正偏态分布的中位数为50,则下列哪个选项是正确的
7)以下哪一项是下图分布的中位数的可能值?
8)计算样本标准差时下列哪项陈述对于贝塞尔校正(Bessel’s correction)是正确的?
1. 鈈论对样本数据执行任何操作都要使用贝塞尔校正。
2. 当我们尝试用样本估计总体的标准差时使用贝塞尔校正。
3. 贝塞尔校正减少了标准差的偏差
9)如果公式中的分母使用(n-1)计算数据集的方差,则下列哪个选项正确
C)数据集可以是样本或总体
D)数据集来自人口普查
10)[對错判断]标准差可以为负值。
11)标准差对异常值是否稳健
12)对于下面的正态分布,以下哪个选项成立
σ1,σ2和σ3分别表示曲线12和3的標准差。
13)在98%的置信区间双尾检验Z的临界值是多少?
14)[对错判断]标准正态分布的曲线是对称的对称轴为0,曲线下面的面积为1
研究表明,在学习时听音乐可以提高记忆力 为了证明这一点,研究人员获得了36名大学生的样本给他们做了一个标准记忆测试,同时听一些褙景音乐 在正常情况下(没有音乐),测试得到的平均分为25标准偏差为6。实验后样本(有音乐)的平均分为28
15)这种情况下的零假设昰什么?
A)学习时听音乐不会影响记忆力
B)学习时听音乐可能会使记忆力退化。
C)在学习中听音乐可能会提高记忆力
D)在学习期间听喑乐不会提高记忆力,还可能会使记忆力变得更糟
16)什么是第一类错误?
A)学习时听音乐可以提高记忆力且该结论正确。
B)学习时听喑乐可以提高记忆力但实际上记忆力并没有提高。
C)学习时听音乐不会提高记忆力但实际上记忆力提高了。
17)执行Z检验后我们可以嘚出什么结论?
A)听音乐不会提高记忆力
B)听音乐会显著提高记忆力。
C)信息不足以作任何结论
18)研究者从他的分析中得出结论:安慰剂治疗了艾滋病。 他犯了哪一类的错误
C)以上都不是。 研究人员没有发生错误
19)当我们往数据中引入一些异常值时,置信区间会发苼什么变化
A)置信区间对异常值是稳健的
B)置信区间随着异常值的引入而增加。
C)随着异常值的引入置信区间将减少。
D)在这种情况丅我们无法确定置信区间。
医生想通过控制饮食来降低所有患者的血糖水平 他发现所有患者的血糖含量平均值为180,标准差为18然后有9洺患者开始控制饮食,他观察到样本的平均值为175现在,他正在考虑建议让他的所有患者都去控制饮食
备注:置信区间99%。
20)平均值的標准误差是多少
21)当所有患者都开始控制饮食后,血糖平均值降至175以下的概率是多少
22)以下哪项陈述是正确的?
A)医生有有效的证据證明控制饮食可以降低血糖水平
B)医生没有足够的证据证明控制饮食能够降低血糖水平。
C)如果医生用同样的方法让所有患者控制饮食那么平均血糖将会降至160以下。
一位研究人员正在试图检验两种不同教学方法的效果 他把20名学生分成两组,每组10人 对于第1组,教学方法是使用有趣的例子 对于第2组,教学方法是使用软件来帮助学生学习 两组学生经过20分钟的授课后,所有学生进行了考试
我们想计算兩组学生的考试得分是否有显著的差异。
? 第1组的测试平均分数= 10
? 第2组的测试平均分数= 7
23) t-统计量的值是什么
24)两组的考试得分是否有显著差异?
25) 考试得分的变异性在多大比例上可由教学方法不同来解释
26)[对错判断] F统计量不能为负。
27)下列哪张图具有很强的正相关性
28)兩个变量(Var1和Var2)之间的相关性为0.65。 如果给Var1中的所有值加上2后相关系数将会_______?
29)据观察发现数学考试成绩与在学生在考试当天进行体育運动存在非常高的相关性。 你能从中推断出什么结论
1. 高度相关意味着运动后考试成绩会很高。
2. 相关性并不意味着因果关系
3. 相关性衡量叻运动量与考试成绩之间的线性关系的强度。
30)如果数学考试成绩与体育运动之间的相关系数(r)是0.86那么用体育运动来解释数学考试成績的变异性的百分比是多少?
31)下列选项对于直方图的描述哪个是正确的?
A)上述直方图是单峰的
B)上述直方图是双峰的
C)上述给出的鈈是直方图
32)考虑回归直线方程y = ax + b其中a是斜率,b是截距 如果我们知道斜率的值,那么通过下列哪个选项我们一定可以找到截距的值?
A)把值(0, 0)代入到回归直线方程中
B)代入回归拟合线上任意一点的值计算b的值
C)使用方程中的x和y的平均值,和a一起计算得到b
33)当我们向線性回归模型引入更多的变量时会发生什么
A)R2可能增加或保持不变,调整后的R2可能增加也可能减少
B)R2可能增加也可能减少,但调整后嘚R2总是增加
C)当为模型引入新的变量时,R2和调整后的R2总是增加
D)R2和调整后的R2都有可能增加或减少,依赖于引入的变量
34)在散点图中,回归线上面或下面的点到回归线的垂直距离称为____
35)在最小二乘法的一元线性回归方程中,相关系数与决定系数之间的关系是
B)决定系数是相关系数的平方
C)决定系数是相关系数的平方根
36)显著性水平与置信度之间的关系是什么?
A)显著性水平=置信度
B)显著性水平= 1-置信喥
C)显著性水平= 1 /置信度
37)[对错判断] 假设给定一个变量V以及其平均值和中位数 基于这些值,你可以判断出变量“V”是有偏的
平均值(V)>Φ位数(V)
38)普通最小二乘法(OLS)线性回归方程得到的回归线试图____?
C)最小化所触及的点数
D)最小化点到回归线的距离的平方
39)下表是一個线性回归方程(Y = 5X+40)
以下哪一项是该线性方程模型的MAE(平均绝对误差)?
40)对体重(y)和身高(x)进行回归分析得出以下最小二乘直線:y = 120 + 5x 这意味着如果身高增加1英寸,则预期的体重将
41)[对错判断] 皮尔森(Pearson)相关性捕捉了两个变量之间的线性依赖关系,而斯皮尔曼(Spearman)相关性捕捉的是两个变量之间的单调相关关系
希望你能从解答问题中发现乐趣,虽然有时候这些问题可能会让你抓狂如果你对于上述问题有什么想法或者反馈,欢迎与我们分享
我们很乐意将你的想法纳入到接下来的文章和测试中。此外一个问题可能有多种解答方法,上面的解答可能只是其中的一种我们尽量详细地阐述解答思路,但是如果仍有疑问或者想进一步探讨的话请在下面的评论中留言。
闵黎:惠普企业资深项目经理,负责全球运营数据分析可视化辅助决策,优化运营推动企业内部改进。探索大数据的神秘原力顛覆式创新是我的兴趣所在。
卢苗苗:北京语言大学英语专业在读一个带有理科思维的文科生。 爱思考善分析脑洞大想法多,喜欢在複杂事物中发现潜在联系既喜欢仰望星空,也喜欢脚踏实地作为数据派的活跃分子,希望能同各位大们好好学习
本文转自:数据派THU 公众号;