建立一个模型,通过这个模型根据已知的变量值来预测其他某个变量值属于数据挖掘的哪一类任务?()
A.建模描述
B.根据内容检索
C.寻找模式和规则
D.预测建模
A.建模描述
B.根据内容检索
C.寻找模式和规则
D.预测建模
第1题
为了确定避孕套的使用在降低有性行为的高中生之间传播性疾病的有效性,一个简单的模型为
其中, inf rate表示有性行为的学生中感染性病的比例, con use表示声称合理地使用了避孕套的男孩子比例,avg inc表示平均家庭收入, 而city则是一个表示所在学校是否处在城里的虚拟变量; 这个模型是在学校这个层次上做的。
(i)在因果性和其他条件不变的模式下解释上述方程,β1的符号应该是什么?
(ii)为什么inf rate和com se可能是联合决定的?
(iii)如果避孕套使用率随着性病感染率的上升而提高,所以在下式中
(iv)令aris表示一个二值变量,若学校有分发避孕套项目则取值1.解释这如何用于通过Ⅳ估计β1(和其他系数)。我们必须在每个方程中对concis做怎样的假定?
第2题
(i)考虑静态非观测效应模型
其中,enrolit表示学区总注册学生人数,lunchit表示学区中学生有资格享受学校午餐计划的百分数。(因此lunchit是学区贫穷率的一个相当好的度量指标。)证明:若平均每个学生的真实支出提高10%,则math4it约改变β1/10个百分点。
(ii)利用一阶差分估计第(i)部分中的模型。最简单的方法就是在一阶差分方程中包含一个截距项和1994~1998年度虚拟变量。解释支出变量的系数。
(iii)现在,在模型中添加支出变量的一阶滞后,并用一阶差分重新估计。注意你又失去了一年的数据,所以你只能用始于1994年的变化。讨论即期和滞后支出变量的系数和显著性。
(iv)求第(iii)部分中一阶差分回归的异方差-稳健标准误。支出变量的这些标准误与第(iii)部分相比如何?
(v)现在,求对异方差性和序列相关都保持稳健的标准误。这对滞后支出变量的显著性有何影响?
(vi)通过进行一个AR(1)序列相关检验,验证差分误差rit=Δuit含有负序列相关。
(vii)基于充分稳健的联合检验,模型中有必要包含学生注册人数和午餐项目变量吗?
第3题
为了检验工作培训项目对工人以后工资的有效性,我们设定了模型
其中,train表示的虚拟变量,在工人参与这个项目时取值1.想象误差项包括了无法观测的工人能力。如果能力越低的工人被选派去参加这个项目的机会就越大,而且你使用了一个OLS分析,那么你认为β1的OLS估计量可能有什么样的偏误?
第4题
A.零成本:可以直接从OMCR收集到移动统计数据
B.快速:使用2-3天的移动统计即可建立干扰模型,天数多会更精确些
C.准确:通过对移动统计数据的充分利用,创建一个真正体现当前蜂窝网络情况的数学模型
D.根据DT测试或者地理信息进行估计
第5题
文件CEOSAL2.RAW包含了177位首席执行官的数据,并可用来考察企业业绩对CEO薪水的影响。
(i)估计一个将年薪与企业销售量和市场价值相联系的模型。让这个模型对每个自变量的变化都具有常弹性。以方程的形式写出结论。
(ii)在第(i)部分的模型中增加profits。为什么这个变量不能以对数形式进入模型?你会说这些企业业绩变量解释了CEO薪水波动中的大部分吗?
(iii)在第(ii)部分的模型中增加ceoten。保持其他条件不变,延长一年CEO任期,估计的百分比回报是什么?
(iv)求出变量log(mktval)和prots之间的样本相关系数。这些变量高度相关吗?这对OLS估计量有什么影响?
第6题
(i) 估计一个将respond与resplast和avggift联系起来的线性概率模型。以通常的形式报告结果, 并解释变量resplast的系数。
(ii)过去捐助的平均水平看来会影响做出捐助响应的概率吗?
(iii) 在模型中增加变量propres p并解释其系数。(这里须注意, propresp增加1是最大可能变化。)
(iv) 在回归中增加propres p以后, resp last的系数有何变化?这讲得过去吗?
(v) 在模型中增加每年寄出邮件的数量mail year。它的估计影响有多大?为什么它不是邮件数量对响应的因果关系的一个较好的估计?
第7题
利用数据集401KSUBS.RAW。
(i)利用OLS估计e401k的一个线性概率模型,解释变量为inc,inc²,age,age²和male。求通常的OLS标准误和异方差-稳健的标准误。它们有重要差别吗?
(iii)对第(i)部分估计的模型求怀特检验,并分析系数估计值是否大致对应于第(ii)部分中描述的理论值。
(iv)在验证了第(i)部分的拟合值都介于0和1之间后,求这个线性概率模型的加权最小二乘估计值。它们与OLS估计值有重大差别吗?
第8题
利用TRAFFIC2.RAW中的数据。
(i)计算变量prefat的一阶自相关系数。你认为prefat包含单位根吗?失业率也一样吗?
(i)估计一个将prcfat的一阶差分Aprcfat与第10章的计算机练习C11第(vi)部分中同样变量相联系的多元回归模型,只是你还应该对失业率进行一阶差分。于是,模型中包含一个线性时间趋势、月度虚拟变量、周末变量和两个政策变量;不要将这些变量进行差分。你发现了什么有意思的结论吗?
(iii)评论如下命题:“在进行多元回归之前,我们总应该将怀疑具有单位根的时间序列进行一阶差分,因为这样做是一种安全策略,而且应该得到与使用水平值类似的结论。”[在回答这个问题时,最好先做(如果你还没有做过的话)第10章的计算机练习C11第(vi)部分中的回归。]
第9题
为了评估一个负担家庭生计者的死亡对家庭所产生的财务影响,根据风险管理的方法可以建立()。
A.资本资产定价模型
B.风险控制模型
C.财产估价模型
D.生命价值分析模型