多维数据分析试题

高级社会统计学

1、什么是虚拟变量?在多因回归分析中,采用虚拟变量应注意什么?若以“学生来源”(分为城市、县城、乡镇、农村四类)作为自变量对因变量y作回归方程,应如何设置虚拟变量?

2、考察我国31个省市自治区的经济发展状况,所考察指标为:x1地区生产总值,x2居民消费水平,x3基本建设投资,x4职工平均工资,x5居民消费价格指数,x6商品零售价格指数,x7货物周转量,x8工业总产值,观察下表选择主成分的个数、写出它们的贡献率、累计贡献率,并写出前三个主成分的表达式。

Total Variance Explained

Component Matrix(a)


Extraction Method: Principal Component Analysis.

3、 在以“A”“B”为自变量,对“Y”所进行的线性回归分析中(采用逐步回归法),SPSS的部分输出结果如下,简述从中得出的结论。

Model Summary

a Predictors: (Constant), A

b Predictors: (Constant), A, B

Coefficients(a)

a Dependent Variable: Y

4、利用社会科学统计分析软件包SPSS对“159名大学生的身高与体重”数据进行统计分析处理,简述分

析操作。要求:1)如果以中国男大学生的平均身高170cm为计,这批样本数据的男性身高与中国男大学生的身高是否存在显著性差异?2)身高与体重是否存在性别差异?3)身高与体重的关系如何?

5、研究不同学校(school)和不同课程计划(program)对学生学习方式偏好(style)的影响,得到数据如下表1

1

题中有两个自变量:学校和课程计划;一个应变量:学习方式。其中学校变量有三个水平(123),课程计划变量有两个水平(常规、附加)。学习方式变量有三个水平(自修,小组,上课),试就自修与上课两种学习方式相比(下表第一部分),写出logistic回归方程,并进行适当说明。

《多维数据分析试题.doc》
将本文的Word文档下载,方便收藏和打印
推荐:
下载文档
热门推荐
相关推荐