本题使用CRIME4.RAW。(i)在数据集中增加每个工资变量的对数,然后用一阶差分估计模型。问这些变
本题使用CRIME4.RAW。
(i)在数据集中增加每个工资变量的对数,然后用一阶差分估计模型。问这些变量的引入如何影响例13.9中那些司法变量的系数?
(ii)第(i)部分中的工资变量都有预期的符号吗?它们是联合显著的吗?试解释。
本题使用CRIME4.RAW。
(i)在数据集中增加每个工资变量的对数,然后用一阶差分估计模型。问这些变量的引入如何影响例13.9中那些司法变量的系数?
(ii)第(i)部分中的工资变量都有预期的符号吗?它们是联合显著的吗?试解释。
第1题
教材例13.9并利用CRIME4.RAW中的数据。
(i)假定你在做差分以消除非观测效应后,认为Alog(polpc)与Alog(crmrte)是同时决定的;特别是犯罪的增加与警察人数的增加有关。这对解释教材方程(13.33)中Alog(polpc)的正系数有何帮助?
(ii)变量taxpc表示全县人均征税量。将它排除在犯罪方程之外看上去合理吗?
(iii)在包括了潜在的工具变量Alog(taxpc)后,利用混合OLS估计Alog(polpc)的约简型。Alog(taxpc)看起来是一个很好的备选ⅣV吗?
(iv)假设在几年后,北卡罗来纳州资助某些县扩大其警察规模。你如何利用这个信息估计增加的警察对犯罪率的影响?
第2题
本题使用LOANAPP.RAW中的数据。
(i)有多少个观测的obrat>40,即其他债务负担超过其总收入的40%?
(ii)在计算机习题C7.8中,去掉o brat 40的观测,重新估计第(iii)部分中的模型。white的系数估计值和t统计量将会怎样?
(iii)看起来对所使用的样本过度敏感吗?
第3题
本题使用WAGEI.RAW中的数据。
(i)求出样本中的平均受教育程度。最低和最高受教育年数是多少?
(ii)求出样木中的平均小时工资。它看起来是高是低?
(iii)工资数据用1976年的美元报告。利用(2004年或以后的)《总统经济报告》,求出并报告1976年和2003年的消费者价格指数(CPI) 。
(iv)利用第(iii)部分中的CPI值,求以2003年美元度量的平均小时工资。现在,平均小时工资看起来合理了吗?
(v)样本中有多少女人和男人?
第4题
本题要利用LAWS CH 85.RAW中的数据。
(i)使用与第3章习题4一样的模型,表述并检验虚拟假设:在其他条件不变的情况下,法学院排名对起薪中位数没有影响。
(ii)新生年级的学生特征(即LSAT和GPA) 对解释salary而言是个别或联合显著的吗?
(iii)检验是否要在方程中引入入学年级的规模(clsize) 和教职工的规(faculty) ; 只进行一个检验。(注意解释clsize和faculty的缺失数据。)
(iv)还有哪些因素可能影响到法学院排名,但又没有包括在薪水回归中?
第5题
本题利用JTRAIN3.RAW中的数据。
(i)估计简单回归模型并用常用格式报告结论。基于这个回归,1976年和1977年的工作培训看上去对1978年的真实劳动工资有正的影响吗?
(ii)现在使用真实劳动工资的变化cre=re 78-re 75作为因变量。(由于我们假定1975年之前没有工作培训,所以我们没有必要对train进行差分。也就是说,如果我们定义ctrain=train 78-train75, 那么,由于train75=0,所以ctran=train78。)现在,培训的估计影响有多大?讨论它与第(i)部分估计值的比较。
(iii)利用通常的OLS标准误和异方差-稳健标准误求培训效应的95%置信区间,并描述你的结论。
第6题
本题利用JTRAIN.RAW来判断工作培训资助对每位雇员的平均培训小时数的影响。三年的基本模型为
(i)利用一阶差分估计这个方程。估计中使用了多少个企业?如果每个企业都有这三个时期所有变量的数据(特别是hrsemp的数据) , 那么, 总共将使用多少观测?
(ii)解释grant的系数并评论其显著性。
(iii)grant,是不显著的, 这让你感到意外吗?请加以解释。
(iv)平均而言,越大的企业对其员工的培训是越多还是越少呢?在培训上的差异有多大呢?
第8题
本题利用HPRICE1.RAW中的数据。
(i)估计模型
并以通常的OLS格式报告结论。
(ii)当lotsize=20000,scrft=2500和bdrms=4时,求出log(price) 的预测值。利用6.4节中的方法,在同样的解释变量值的情况下,求出price的预测值。
(iii)就解释price中的变异而言,决定你是偏好第(i)部分中的模型,还是偏好模型
第9题
本题需要使用ELEM 94-95中的数据, 也可参见计算机习题C 4.10。
(i) 利用所有数据, 将lavg sal对bs, lenrol, Istaff和lunch进行回归。报告bs的系数及其常用标准误和异方差-稳健标准误。你对的经济显著性和统计显著性得到什么结论?
(ii)现在去掉四个bs>0.5的观测,即平均福利(假设)占平均薪水50%以上的观测。bs的系数又是多少?利用异方差-稳健标准误来判断,它在统计上显著吗?
(iii)验证bs>0.5的四个观测分别为68、1127、1508和1670。为它们各定义一个虚拟变量。(你可以称它们为d68、d1127、d 1508和d 1670.) 把它们添加到第(i) 部分的回归中, 验证其他变量的OLS系数及其标准
误与第(ii)部分中的结果相同。在5%的显著性水平上,这四个虚拟变量中哪个变量的t统计量在统计上显著不等于0?
(iv)在这个数据集中,验证第(iii)部分回归中具有最大学生化残差(该虚拟变量的t统计量最大)的数据点对OLS估计值具有很大的影响。(即利用除去具有最大学生化残差的数据点之外的所有观测进行OLS回归。)依次去掉bs>0.5的每个观测都具有重要影响吗?
(v) 即便在大样本中, 就OLS对单个观测的敏感性而言, 你有何结论?
(vi) 在第(iji) 部分, 验证LAD估计量对包含这些观测不是很敏感。
第10题
本题利用FERTIL3.RAW中的数据。
(i)将gfr对t和t2回归, 并保留残差, 便得到除趋势的gfrt即。
(ii)将对方程(10.35)中所有变量(包括t和t2)回归。比较得出的R2与方程(10.35)中的R2有何不同。你有何结论?
(iii)在方程(10.35)中加入3后重新进行估计。这个新增变量在统计上显著吗?
第11题
本题利用MEAP93.RAW中的数据。
(i) 估计模型math10=β0+β1log(expend)+β2Inchprg+u,并按照通常的方式报告估计方程,包括样本容量和R2。斜率系数的符号与你的预期一致吗?请加以解释。
(ii)你如何理解第(i)部分中估计出来的截距?特别是,令两个解释变量都等于零说得过去吗?[提示:记住log(1)=0。]
(i)现在做math10对log(expend)的简单回归, 并将斜率系数与第(i)部分中得到的估计值进行比较。与第(i)部分中的结果相比,这里估计出来的支出效应是更大还是更小?
(iv)求山lexpend=log(expend)与Inchprg之间的相关系数。你认为其符号合理吗?
(v)利用第(iv)部分的结果来解释你在第(iii)部分中得到的结论。