多元统计实验报告
数学1001 李倩 1010810122
在某年级44名学生的期末成绩中,有的课程采用闭卷,有的课程采用开卷(成绩如下),其中X1,X2,X3,X4,X5分别表示力学(闭),物理(闭),代数(开),分析(开),统计(开)。
(1)试用因子分析分析这组数据。
(2)试对闭卷(X1,X2)和开卷(X3,X4,X5)两组变量进行典型相关分析.
(1)首先我们明确因子分析是一种降维的方法,它将多个变量综合为少数几个因子。首先建立数学模型:
对这道题的具体解法如下:
先将数据写入excel 中保存成文本格式,而后用read.table 读取数据。 > chengji
> fact1
> fact1
Call:
factanal(x = chengji, factors = 2, scores = "Bartlett")
Uniquenesses:
X1 X2 X3 X4 X5
0.521 0.582 0.363 0.482 0.005
Loadings:
Factor1 Factor2
X1 0.691
X2 0.135 0.633
X3 0.476 0.640
X4 0.545 0.470
X5 0.997
Factor1 Factor2
SS loadings 1.537 1.510
Proportion Var 0.307 0.302 方差贡献率
Cumulative Var 0.307 0.609 累积方差贡献率
Test of the hypothesis that 2 factors are sufficient.
The chi square statistic is 0.11 on 1 degree of freedom.
The p-value is 0.739
Test of the hypothesis that 2 factors are sufficient.
由此可知两个主成分是足够的
载荷矩阵是用“Bartlett ”方法得到的,根据结果得到这六门课程与两个潜在因子的关系为:
X1=0.691F2
X2=0.135F1+0.633F2
X3=0.476F1+0.640F2
X4=0.545F1+0.470F2
X5=0.997F1
根据F1和F2的系数知道两个因子与五门课程都有正相关性,第一个因子主要和统计(开) 有很强的正相关,相关系数为0.997;而第二个因子主要与力学(闭)、物理(闭)有很强的正相关性分别为0.691、0.633、同时第一个因子和第二个因子与代数(开)、分析(开)均有差不多的正相关性,因此可以讲第一个因子解释为计算因子而将第二个因子解释为理论因子,这样便很好的解释了结果:统计偏向于计算,而力学和物理偏向于理论,代数和分析则于两个因子均有差不多的关系。 如果用promax 方法进行正交旋转则得到下面的结果:
> chengji
> fact1
> fact1
Call:
factanal(x = chengji, factors = 2, rotation = "promax")
Uniquenesses:
X1 X2 X3 X4 X5
0.521 0.582 0.363 0.482 0.005
Loadings:
Factor1 Factor2
X1 0.775 -0.240
X2 0.694 -0.114
X3 0.649 0.247
X4 0.445 0.390
X5 -0.114 1.048
Factor1 Factor2
SS loadings 1.715 1.381
Proportion Var 0.343 0.276
Cumulative Var 0.343 0.619
Test of the hypothesis that 2 factors are sufficient.
The chi square statistic is 0.11 on 1 degree of freedom.
The p-value is 0.739
这时五门课程与两个潜在因子之间的关系变为:
X1=0.775F1-0.240F2
X2=0.694F1-0.114F2
X3=0.649F1+0.247F2
X4=0.445F1+0.390 F2
X5 =-0.114F1+1.048F2
这样的话第一个因子与力学(闭)、物理(闭)、代数(开)有很强的正相关性,相关系数分别为0.775、0.694、0.649,而第二个因子主要与统计(开)有很强的正相关性,相关系数为1.048,分析(开)与两个因子相关性没有太大的区别,同样的我们称第一个因子为“理论因子”称第二个因子为“计算因子”。
显然第二种方法比较好。
(2)数学模型如下:
> ###读取数据
> chengji ###做典型相关分析
> chengji
> ca
$cor
[1] 0.62991255 0.09592154
$xcoef
[,1] [,2]
X1 0.09553760 0.1391077
X2 0.08479416 -0.1459052
$ycoef
[,1] [,2] [,3]
X3 0.13114462 0.05212337 0.1268583
X4 0.07651773 -0.01824329 -0.1823259
X5 -0.07715853 -0.16244197 0.0667433
$xcenter
X1 X2
1.892426e-16 -5.724587e-17
$ycenter
X3 X4
3.521489e-16 -4.522897e-16 -2.996341e-18
> ###计算因子得分
> U
[,1] [,2]
[1,] 0.386196021 -0.015394649
[2,] 0.305518286 0.079553680
[3,] 0.148356423 0.086739285
[4,] 0.095209644 -0.085053774
[5,] 0.119162028 0.115037164
[6,] 0.079826145 -0.036646512
[7,] -0.037999834 0.122222768
[8,] -0.132055100 -0.132737321
[9,] 0.061730807 -0.181004995
[10,] 0.015146945 0.294015827
[11,] 0.002293616 -0.078731473
[12,] -0.240969662 -0.362129030
X5
[14,] -0.034854628 -0.014810522
[15,] -0.050762328 0.056435622
[16,] -0.034945463 -0.321770676
[17,] -0.277936237 0.315712228
[18,] -0.067809265 -0.133600625
[19,] -0.021043733 0.005298861
[20,] -0.018946929 -0.086056666
[21,] -0.187298682 -0.213174853
[22,] -0.003563430 -0.134463928
[23,] 0.259801156 -0.105023569
[24,] 0.159979680 -0.108755959
[25,] 0.064442647 0.011760750
[26,] 0.172742173 -0.042968813
[27,] 0.222128710 -0.018263736
[28,] 0.122831435 -0.044835008
[29,] 0.162167319 0.106848667
[30,] 0.135069728 0.043791020
[31,] 0.047919911 -0.201114378
[32,] -0.176632993 -0.056032180
[33,] -0.111772122 0.227225788
[34,] -0.022616336 0.073815506
[36,] -0.303552059 -0.122822218
[37,] -0.199446140 0.005159272
[38,] -0.073051275 0.094788192
[39,] -0.228640535 0.033457151
[40,] -0.070863636 0.310392819
[41,] -0.131964265 0.174222832
[42,] -0.010468878 -0.144518620
[43,] -0.066670028 0.127681765
[44,] -0.050762328 0.056435622
> V
[,1] [,2] [,3]
[1,] 0.130913472 -0.2536506284 0.0285497642
[2,] 0.192506357 -0.2221985749 0.1248618323
[3,] 0.216507338 -0.0885843063 -0.1618898620
[4,] 0.136968404 -0.1275490453 -0.0098790666
[5,] -0.032787111 -0.1909871285 -0.0457739647
[6,] 0.093548574 -0.0126687962 -0.1052233512
[7,] 0.033900391 -0.0565815681 0.2124558555
[8,] -0.066160788 -0.1947187236 0.1327777664
[9,] -0.138128648 -0.0265865595 0.0289367388
[10,] 0.090390403 0.1038894251 0.0305958954
[11,] -0.022984475 0.0155263033 -0.2536771482
[12,] 0.047425280 -0.1407515604 -0.0320887077
[13,] -0.149497643 0.0107267558 0.2383330591
[14,] 0.069901863 0.1438398347 -0.2176716859
[15,] 0.135629050 0.2550973189 0.2409047172
[16,] -0.163964957 0.0376559223 -0.0317846562
[17,] -0.071819488 -0.1235470277 -0.1283178526
[18,] -0.252236836 0.0007218597 0.1943009251
[19,] -0.005620400 0.2312569412 0.1138309830
[20,] -0.064981724 0.1992214164 0.0654675543
[21,] 0.015196961 0.1103341582 0.0957315082
[22,] -0.193515263 0.1606093815 0.0603896045
[23,] 0.399618514 -0.1677698773 0.1782755697
[24,] 0.155512242 -0.1550387365 -0.1756027601
[25,] 0.228262932 -0.1265040396 0.1604525053
[26,] 0.217812290 0.0268069723 0.0698266635
[27,] 0.127073588 0.0836092104 -0.1175813176
[28,] 0.113877520 0.0868068294 -0.1394038105
[29,] 0.064554094 0.1681319069 -0.0301254996
[30,] -0.008483456 0.1277199630 -0.0001381297
[31,] 0.068461390 0.1091177204 0.0828481885
[32,] 0.090281028 -0.0815066068 -0.0359222900
[33,] -0.091247972 -0.0729322070 0.3208493060
[34,] -0.082345799 -0.0165092215 -0.3020405768
[35,] -0.154827522 0.0009260784 -0.2891296160
[36,] -0.287100508 -0.3500702518 -0.0084789371
[37,] -0.221204094 -0.1803591057 -0.0987176308
[38,] 0.006750874 0.1242420817 -0.1962363411
[39,] -0.292010082 -0.2213545210 -0.0207816215
[40,] 0.016232945 0.1797554402 -0.0215181924
[41,] -0.004693790 0.1152821912 -0.0699369031
[42,] 0.011247703 0.2621979652 -0.1169177590
[43,] -0.153522570 0.1163173570 -0.0574130905
[44,] -0.205440085 0.1400754530 0.2868623340
> ###找对数
> corcoef.chengji
+ m
+ for (k in m:1){
+ lambda
+ Q[k]
+ }
+ s
+ for (k in 1:m){
+ Q[k]
+ chi
+ if (chi>alpha){
+ i
+ }
+ s
+ }
+ i
+ }
> corcoef.chengji(r=ca$cor,n=44,p=2,q=3)
[1] 1
由结果可知只需选一对典型变量就可以了。
U1=0.09553760 X1*+0.08479416X2*
V1=0.13114462X3*+0.07651773X4 *-0.07715853X5*
U1、V1的相关系数为0.62991255,具有正相关关系,但是相关性不高。U1中都是闭卷,权系数都不大,V1中都是开卷,权系数最大的是代数(开)为0.13114462,其次是分析(开)为0.07651773,学好了分析和代数对力学和物理有促进作用,于是(U1、V1)这对典型变量主要反映了基础课--专业课的关系。体现的是考试方法的特点。
0.62991255为第一对典型变量的相关系数,所以比较分散。
0.09592154为第二对典型变量的相关系数,距1更远,所以点更为分散。
相关文章
- 应用多元统计分析实验报告之主成分分析
- [应用多元统计分析]第六章主成分分析实验报告
- 中国临床运动心理学论文的内容分析
- 实验三 多元线性回归模型及非线性回归
- 实验8多元线性回归与非线性回归
- EXCEL统计学实验
- 心理与教育研究方法
- 中_西应用语言学研究方法发展趋势_高一虹
- 教育研究方法-笔记整理
应用多元统计分析实验报告 一.研究目的 下表1是2010年各地区6项重要指标的数据,这6项指标分别是: X1-城市用水普及率(%) X2-城市燃气普及率(%) X3-每万人拥有公共交通车辆(标台) X4-人均城市道路面积(平方米) X5-人 ...
第六章主成分分析实验报告 实验项目 名称 主成分分析的上机实现 实验 目的及要求 目的:通过本次实验,培养学生如下几方面的能力: 1.使学生能够借助于SPSS的因子分析功能,实现主成分分析的方法. 2.使学生对主成分分析的基本原理有更深入的 ...
摘 要:本文对1981年至2010年间我国临床运动心理学研究的680篇论文进行内容分析,以揭示我国临床运动心理学研究的现状与问题.研究结果表明:研究者主要来自体育学院(研究所):运动功能损害和运动退役研究薄弱:.研究主要以认知行为理论为基础 ...
实验三 多元线性回归模型及非线性回归 一.多元线性回归模型 例题3.2.2 建立2006年中国城镇居民人均消费支出的多元线性回归模型. 数据: 地区 2006年消费支出Y 2006年可支配收入X1 2005年消费支出X2 北京 14825. ...
实验 8 多元线性回归分析与非线性回归分析 多元线性回归分析研究多个变量的数量伴随关系,内容主要包括模型的假定与检验.参数的估计与检验.回归诊断与预测.很多非线性回归问题都可以转化为线性回归问题处理,如多项式回归.指数回归.对数回归.幂函数 ...
经济与管理学院 福建农林大学旅游学院 实验报告 课程名称: 统 计 学 专业班级:学 号: 学生姓名: 指导教师: 成 绩: 2008年 12月 1日 EXCEL的数据整理与显示 一.实验目的及要求: (一)目的 1.了解EXCEL的基本命 ...
心理与教育研究方法 问答题 研究的效度 效度通常指的是一个测量工具能够量出它所需要测量的东西或达到某种目的的程度. 研究的效度是指研究真实.正确的揭示了所研究的问题的本质及其规律的程度,即研究结果符合客观实际的程度 研究的效度和信度的关系是 ...
中.西应用语言学研究方法发展趋势 北京大学 高一虹 李莉春 吕 王君 提要:本文描述和分析了中.西应用语言学研究方法的发展趋势,主要材料依据为1978-1997年间四本中文刊物以及1985-1997年四本英文刊物上的应用语言学文章.我们对其 ...
第一章 教育研究概述 一. 教育研究的界说 1. 教育研究的含义 2. 教育研究的意义 (背诵) (1) 改善教育实践 (2) 推进理论建设 (3) 提高教师素质 3. 教育研究的类型 (选择) (1) 按照教育目的:基础研究/纯研究/理论 ...