在样本的数据特征中,可用来反映分散程度的有()。
A.平均值
B.中位数
C.变异系数
D.极差
E.标准偏差
A.平均值
B.中位数
C.变异系数
D.极差
E.标准偏差
第2题
A.每一条观察值都是一个不同的个体,可视为独立样本
B.在横截面数据分析中,观察值的顺序并不重要
C.横截面数据往往来自于宏观经济调查
D.横截面数据常见的计量问题是异方差
第4题
A.发掘“疾病诊断+治疗方式”的共性特征对病案数据进行客观分类
B.主要适用于住院医疗费用结算服务
C.客观反映疾病严重程度、治疗复杂状态、资源消耗水平与临床行为规范
D.以医疗服务项目费用支付
E.可应用于医保支付、基金监管、医院管理等领域
第5题
A.级别划分较多的属性不会影响模型效果
B.在某些噪音较大的分类或回归问题上不会过拟合
C.每次学习使用不同训练集,一定程度避免过拟合
D.能够处理高纬度的数据,并且不做特征选择
第7题
A.用来描述样本数据的离散趋势
B.一定是总体或样本中的某一个数据
C.代表样本数据中等水平
D.代表样本数据平均水平
E.不受样本中极端值的影响
第8题
A.样本均值是样本数据中出现频率最高的值
B.样本均值通常小于样本中位数
C.样本均值是反映样本数据集中位置的统计量
D.样本均值不易受样本数据中极端值的影响
E.样本均值是总体均值的无偏估计量
第9题
A.检查并测试接触控制,确保只有经授权的职员才能进入系统
B.输入测试数据,以验证对输入数据进行编辑控制的有效性
C.运用通用审计软件抽取雇员记录样本,确定样本中数据项目的有效性,并以此推断总体情况
D.运用通用审计软件,确认未包括在特定参数中的所有数据
第11题
使用WAGE1.RAW中的数据。
(i)求出样本中的平均受教育程度。最低和最高受教育年数是多少?
(ii)求出样本中的平均小时工资。它看起来是高还是低?
(iii)工资数据用1976年的美元报告。利用(2004年或以后的)《总统经济报告》,求出并报告1976年和2003年的消费者价格指数(CPI)。
(iv)利用第(iii)部分中的CPI值,求以2003年美元度量的平均小时工资。现在,平均小时工资看起来合理了吗?
(v)样本中有多少女人和男人?