一.讨论
1、 统计学的基本概念和统计工作的基本步骤。
统计学:运用概率论和数理统计等数学的基本原理和方法研究生物医学资料的搜集、整理分析和推断的一门学科。 步骤:1.设计 2.搜集资料 3.整理资料4.分析资料 5.解释资料
2、应用平均数与离散程度指标描述数值变量资料的数学特征——集中趋势和离散趋势。 P129-133
3.为何偏态分布或开口资料必须用中位数描述其平均水平?
1.因为中位数不受极端值影响 2.中位数只受居中变量波动的影响,为某个数值(中间)
4.判断“由于中位数可用于描述总体分布类型不明的数值资料,因此,任何分布类型的数值资料均可用M 表示其平均水平”一句是否正确?
不正确,因为中位数只受居中变量波动的影响,具有较强的稳定性,故中位数不具有较强的代表性,且其代表性低于均数,在任何分布类型的数值变量资料中,能用均数的尽量用均数,所以不能用M表示其平均水平。
5.在不同分布类型中, X与M 的关系如何?
在正态分布中,X=M;在正偏态分布中,X>M;在负偏态分布中,X<M。
二.名词解释
1.小概率事件:概率小于0.05或0.01的随机事件
2. 总体:根据研究目的所确定的同质的所有观察单位的某一种变量值的集合。
3. 样本:按照随机化原则,从总体中抽取的有代表性的部分观察单位的某变量值的集合。
4. 参数:总体的统计指标或特征值 统计量:由样本所算出的统计指标或特征值
5. 概率:在一定条件下,某事件发生可能性大小的度量。
6.均数:亦称算数均数,是反映一组同质的呈对称分布的数值变量资料的平均水平的指标, 为用得最多的统计描述指标。
7.标准差:描述一组同质的呈正态分布的数值变量资料的变异程度的指标。
8.中位数:将一组观察值按升序或降序排列,位次居中的数,常用M表示。(是反映一组同质的呈偏态分布的数值变量资料和等级资料的平均水平的指标)。
三.填空题:
1.保证样本对总体具有代表性,应遵循的原则包括:同质性 、随机性 、适当性。
2.医学统计工作的步骤是:设计、 搜集资料、整理资料 、分析资料和解释资料。
3. 一般将概率小于或等于 0.05 和 0.01 的随机事件称为小概率事件。
4.为了说明数值变量资料的离散程度应选用变异指标,常用的变异指标有方差、标准差、变异系数 。(常用描述离散趋势的指标:四方位数、标准差、变异系数)
5.描述一组数值变量资料的平均水平的指标有均数、几何均数、中位数。
6.中位数通常用来描述偏态分布资料 、分布类型未知的资料、 开口资料等数值变量资料的平均水平。
7.四分位数间距是指 中间50%数据的极差,是用来描述一组同质的呈偏态分布的数值变量资料的离散程度。
四。判断题:
1.( F )随意抽样,防止主观抽样即是随机抽样。
2.( F )用定性的方法得到的资料称作数值变量资料,也称作分类资料。
3.( F )用清点数目数出来的资料是数值变量资料。
4.( F )由于样本观察结果具有不确定性,故不能根据样本推论总体。
5.( F )任何分布类型的数值资料的集中趋势均可用中位数描述。
6.( T )按等比数列分组的数据,最好计算几何均数描述其平均水平。
7.( F )只要单位相同,用s 和用CV来比较两套服从正态分布的数值变量资料的离散 程度的结论是完全一样的。
8.( F )平均数是一类用于推断数值变量资料平均水平(或集中趋势)的指标。
五.单项选择题:
1.随机抽取西藏、成都成年男子各100人,记录每人的血型类型。则此资料类型为:
A 数值变量资料 B 二项分类资料 C 多项无序分类资料 D 等级资料
E 配对资料
2.统计中所说的样本是指:
A 随意抽取的总体中任意部分
B 有意识的选择总体中典型部分
C 依照研究者要求选取总体中有意义的一部分
D 按照随机原则抽取总体中有代表性的一部分
E 以上方法均不是
3.随机事件一般是指:
A 发生概率为0的事件 B 发生概率为1的事件 C 发生概率很小的事件
D 即小概率事件 E.在一次试验中可能发生也可能不发生的事件,其发生的概率为0<P<1
4.关于随机抽样,下列说法正确的是:
A 随机抽样即随意抽取个体
谷氨酸受体B 研究者在随机抽样时应精心挑选个体,以使样本更能代表总体
C 遵循随机化的原则从总体中抽取观察单位,使样本能较好地代表总体特征
D 为确保样本具有更好的代表性,样本量应越大越好
E 以上均错误
5.参数是指:
A 参与个体数 B 总体的统计指标 C 样本的统计指标 D 样本的总和
E 总体的分布
6.测量患者的体重、转氨酶等指标所得的资料是:
A 二项分类资料 B 多项分类资料 C 数值资料 D 等级资料
E 间断性资料
7.用某种新疗法某病患者41人,结果如下,该资料的类型是:
结果 治愈 显效 好转 恶化 死亡
人数 8 23 6 3 1
A 二项分类资料 B 多项无序分类资料 C数值变量资料 D 等级资料
E 离散性资料
8.医学统计的研究内容是:
A 研究样本 B 研究个体 C 研究变量之间的相关关系 D 研究总体
E 研究资料或信息的收集、整理、分析和推断
9.总体应该由 :
A 研究对象组成 B 研究变量组成 C 研究目的而定 D 同质个体组成
E 个体组成
10.统计学数据具有的特征:
A 稳定性 B 可加性 C 主观性 D 变异性 E 可靠性
11.若调查某地20岁正常男性100名,身高的S=4.09cm,体重的S = 4.01kg,则两者的变异程度:
A 体重的变异大 B身高的变异大 C 二者的变异差别较小D 二者的变异无差别
E 不能直接比较二者的变异程度
12.一组服从负偏态分布数值变量资料的中位数与均数的关系
可能是:
A M >x B.M =x C.M <x D 无法判断 E 以上均否
13.一组数值变量资料中的每个变量值均加(或减)同一数后:
A .M不变,S 改变 B. M 改变,S 不变 C. 两者均改变 D。两者均不变
E 以上均错误
14.反映一组同质的数值变量资料集中趋势的指标是:
巫语 A 标准差 B 标准误 C 频率 D 构成比 E 均数
15.在了解事物的分布类型和便于计算而编制频数表时,分组数目一般为:
A 5~10 B 8~15 C 10~30 D 15~20 E 根据例数n来确定
16.反映一组等比数列资料的平均水平的指标通常用:
A .M B. C .Px D. G E S
17.反映偏态分布资料的集中趋势最好的指标是:
A B M C Px D G E S
18.下列离散程度的指标中,错误的是:
A 平均数 B 极差 C 标准差
D 方差 E 变异
19.对于同一组资料,没有考虑每个观察值变异的指标是:
A 方差 B 总体标准差 C 电子口岸变异系数 D 四分位数间距 E 离均差平方和
20.下列表示离散趋势的指标中,没有单位(量纲)的是:
A 标准差 B 极差 C 变异系数 D 四分位数间距 E 方差系数
21.某地正常成年男子红细胞均数为480万/mm2,标准差为41万/mm2,产生此标准差的原因主要是:
A 个体变异扬州1地升高风险10地升中风险 B 抽样误差 C 测量误差 D 系统误差 E 以上都不对
22.最小组段无下限或最大组段无上限的频数分布资料,描述其集中趋势的指标是:
A 算术平均数 B 标准差 C 中位数 D 几何平均数 E 百分位数
23.关于标准差,说法错误的是:
A 反映全部观察值的离散程度
B 度量了一组数据偏离均数的大小
C 反映了均数代表性的好坏氨气压缩机
D 不会小于算术平均数
E 与均数结合可全面描述正态分布的数值变量资料
24.描述一组数值变量资料的分布特征时:
A 应同时选用算术平均数和标准差
B 应同时选用中位数和四分位数间距
C 根据分布类型选用相应的集中、离散趋势指标
D 应同时选用几何均数和标准差
E 以上都不正确
15.关于四分位数间距,错误的是:
A 适用条件同中
B 反映数值变量资料的离散趋势
C 考虑了每个变量值的变异情况
D 较极差稳定
E 与中位数结合可全面描述偏态分布的数值变量资料
16.下列不是正态分布特征的是:
A 曲线位于横轴上方,均数处最高
B 以零为中心,左右对称
C 总体均数为其位置参数
D 总体标准差为其变异度参数
E 曲线两侧逐渐下滑,但永不与横轴相交
17.均数和标准差的关系是:
A 均数越大,标准差
B 均数越小,标准差越大
C 标准差越小,均数代表性越好
D 标准差越大,均数代表性越好
E 标准差越小,均数代表性越差
18.正态分布是以:
A 零为中心的频数分布
汕头大学学报
B 参数为中心的频数分布
C 变量为中心的频数分布
D 观察例数为中心的频数分布
E 均数为中心的频数分布
19.变异系数表示:
A 变异数 B 对称分布 C 集中趋势 D 相对变异 E 平均水平
20.标准正态分布曲线下,中间90%的面积所对应的横轴尺度u的范围是: