数据分析统计方法的选择
数据分析的统计方法选择小结
完全随机分组设计的资料
一、
两组或多组计量资料的比较
1. 两组资料:
1) 大样本资料或服从正态分布的小样本资料
(1)若方差齐性,则作成组t 检验
(2)若方差不齐,则作t’检验或用成组的Wilcoxon 秩和检验
2) 小样本偏态分布资料,则用成组的Wilcoxon 秩和检验
2. 多组资料:
1) 若大样本资料或服从正态分布,并且方差齐性,则作完全随机的方差分析。如果方差分析的统计检验为有统计学意义,则进一步作统计分析:选择合适的方法(如:LSD 检验,Bonferroni 检验等)进行两两比较。
2) 如果小样本的偏态分布资料或方差不齐,则作Kruskal Wallis的统计检验。如果Kruskal Wallis的统计检验为有统计学意义,则进一步作统计分析:选择合适的方法(如:用成组的Wilcoxon 秩和检验,但用Bonferroni 方法校正P 值等)进行两两比较。
二、
分类资料的统计分析
1. 单样本资料与总体比较
1) 二分类资料:
(1)小样本时:用二项分布进行确切概率法检验;
(2)大样本时:用U 检验。
2) 多分类资料:用Pearson χ2检验(又称拟合优度检验)。
2.
四格表资料
1)n>40并且所以理论数大于5,则用Pearson χ2
2)n>40并且所以理论数大于1并且至少存在一个理论数
3)n &πουνδ;40或存在理论数
3. 2×C 表资料的统计分析
1) 列变量为效应指标,并且为有序多分类变量,行变量为分组变量,则行评分的CMH χ2或成组的Wilcoxon 秩和检验
2) 列变量为效应指标并且为二分类,列变量为有序多分类变量,则用趋势χ2检验
3) 行变量和列变量均为无序分类变量
(1)n>40并且理论数小于5的格子数
(2)n&πουνδ;40或理论数小于5的格子数>行列表中格子总数的25%,则用Fisher’s 确切概率法检验
4. R×C 表资料的统计分析
1) 列变量为效应指标,并且为有序多分类变量,行变量为分组变量,则CMH χ2或Kruskal Wallis的秩和检验
2) 列变量为效应指标,并且为无序多分类变量,行变量为有序多分类变量,作none zero correlation analysis的CMH χ2
3) 列变量和行变量均为有序多分类变量,可以作Spearman 相关分析
4) 列变量和行变量均为无序多分类变量,
(1)n>40并且理论数小于5的格子数
(2)n&πουνδ;40或理论数小于5的格子数>行列表中格子总数的25%,则用Fisher’s 确切概率法检验
三、
Poisson 分布资料
1. 单样本资料与总体比较:
1) 观察值较小时:用确切概率法进行检验。
2) 观察值较大时:用正态近似的U 检验。
2. 两个样本比较:用正态近似的U 检验。
配对设计或随机区组设计
四、
两组或多组计量资料的比较
1. 两组资料:
1) 大样本资料或配对差值服从正态分布的小样本资料,作配对t 检验
2) 小样本并且差值呈偏态分布资料,则用Wilcoxon 的符号配对秩检验
2. 多组资料:
1) 若大样本资料或残差服从正态分布,并且方差齐性,则作随机区组的方差分析。如果方差分析的统计检验为有统计学意义,则进一步作统计分析:选择合适的方法(如:LSD 检验,Bonferroni 检验等)进行两两比较。
2) 如果小样本时,差值呈偏态分布资料或方差不齐,则作Fredman 的统计检验。如果Fredman 的统计检验为有统计学意义,则进一步作统计分析:选择合适的方法(如:用Wilcoxon 的符号配对秩检验,但用Bonferroni 方法校正P 值等)进行两两比较。
五、
分类资料的统计分析
1. 四格表资料
1)b+c>40,则用McNemar 配对 χ2检验或配对边际χ2检验
2)b+c&πουνδ;40,则用二项分布确切概率法检验
2.C ×C 表资料:
1) 配对比较:用McNemar 配对 χ2检验或配对边际χ2检验
2) 一致性问题(Agreement ):用Kap 检验
变量之间的关联性分析
六、
两个变量之间的关联性分析
1. 两个变量均为连续型变量
1) 小样本并且两个变量服从双正态分布,则用Pearson 相关系数做统计分析
2) 大样本或两个变量不服从双正态分布,则用Spearman 相关系数进行统计分析
2. 两个变量均为有序分类变量,可以用Spearman 相关系数进行统计分析
3. 一个变量为有序分类变量,另一个变量为连续型变量,可以用Spearman 相关系数进行统计分析
七、
回归分析
1. 直线回归:如果回归分析中的残差服从正态分布(大样本时无需正态性),残差与自变量无趋势变化,则直线回归(单个自变量的线性回归,称为简单回归),否则应作适当的变换,使其满足上述条件。
2. 多重线性回归:应变量(Y )为连续型变量(即计量资料),自变量(X1,X2,…,Xp )可以为连续型变量、有序分类变量或二分类变量。如果回归分析中的残差服从正态分布(大样本时无需正态性),残差与自变量无趋势变化,可以作多重线性回归。
1) 观察性研究:可以用逐步线性回归寻找(拟)主要的影响因素
2) 实验性研究:在保持主要研究因素变量(干预变量)外,可以适当地引入一些其它可能的混杂因素变量,以校正这些混杂因素对结果的混杂作用
3. 二分类的Logistic 回归:应变量为二分类变量,自变量(X1,X2,…,Xp )可以为连续型变量、有序分类变量或二分类变量。
1) 非配对的情况:用非条件Logistic 回归
(1)观察性研究:可以用逐步线性回归寻找(拟)主要的影响因素
(2)实验性研究:在保持主要研究因素变量(干预变量)外,可以适当地引入一些其它可能的混杂因素变量,以校正这些混杂因素对结果的混杂作用
2) 配对的情况:用条件Logistic 回归
(1)观察性研究:可以用逐步线性回归寻找(拟)主要的影响因素
(2)实验性研究:在保持主要研究因素变量(干预变量)外,可以适当地引入一些其它可能的混杂因素变量,以校正这些混杂因素对结果的混杂作用
4. 有序多分类有序的Logistic 回归:应变量为有序多分类变量,自变量(X1,X2,…,Xp )可以为连续型变量、有序分类变量或二分类变量。
1) 观察性研究:可以用逐步线性回归寻找(拟)主要的影响因素
2) 实验性研究:在保持主要研究因素变量(干预变量)外,可以适当地引入一些其它可能的混杂因素变量,以校正这些混杂因素对结果的混杂作用
5. 无序多分类有序的Logistic 回归:应变量为无序多分类变量,自变量(X1,X2,…,Xp )可以为连续型变量、有序分类变量或二分类变量。
1) 观察性研究:可以用逐步线性回归寻找(拟)主要的影响因素
2) 实验性研究:在保持主要研究因素变量(干预变量)外,可以适当地引入一些其它可能的混杂因素变量,以校正这些混杂因素对结果的混杂作用
八、
生存分析资:要求资料记录结局和结局发生的时间(如;死亡和死亡发生的时间)
1. 用Kaplan-Meier 方法估计生存曲线
2. 大样本时,可以寿命表方法估计
3. 单因素可以用Log -rank 比较两条或多条生存曲线
4. 多个因素时,可以作多重的Cox 回归
1) 观察性研究:可以用逐步线性回归寻找(拟)主要的影响因素
2) 实验性研究:在保持主要研究因素变量(干预变量)外,可以适当地引入一些其它可能的混杂因素变量,以校正这些混杂因素对结果的混杂作用
相关文章
- 4.企业安全生产标准化信息管理系统用户操作手册(不承担评审组织单位职责安全监管部门业务人员端)
- 统计学实验指导书(20**年)
- 统计设计的原则和方法
- 毕业论文文献综述基于SPSS的多元回归分析模型选取的应用 之文献综述
- 企业经营统计学作业
- 科研方法与论文写作 1
- 统计图的选择教学设计(1)
- 统计软件应用实验报告
- 模型参数估计方法研究
企业安全生产标准化信息管理系统 (不承担评审组织单位职责安全监管部门业务人员端) 用户操作手册 国家安全生产监督管理总局通信信息中心 2016年1月 目 录 1. 登录系统 ................................. ...
统计学实验指导书 唐爱莉 郭彩云 岳志春 鲍 琳 主编 河北工程大学 前 言 当今,统计在经济活动和日常生活中正发挥着越来越大的作用:同时随着计算机的普及,统计分析方法在各个领域得到迅速推广.统计分析常用的软件有SAS .SPSS 和Exc ...
统计设计的原则和方法 中国医学科学院北京协和医学院 韩少梅 这节课我们讲一下统计设计.原则和方法. 现代医学科研中的信息大多数都是以数据的形式加以体现,探索医学数据变化的特有规律,对数据进行整理和分析,得出研究结论是医学统计学的首要任务.医 ...
基于SPSS 的多元回归分析模型选取的应用 文献综述 重庆工商大学 统计学 2010级 统计2班 殷婷 引 言 随着社会的发展,统计的运用范围越来越广泛,统计学作为高等院校经济类专业和工商管理类专业的核心课程,不管是在经济管理领域,或是在军 ...
第一章 绪论 一.思考题 1.简述现代企业的特征和分类. 2.什么是企业经营活动?并说明企业经营活动的过程和内容. 3.什么是企业经营统计学?它有哪些特点? 4.联系实际,简述统计在企业经营管理中的作用. 5.企业经营统计学的研究对象是什么 ...
科研方法与论文写作 全书共有九章,主线为: 科研概述及科研素养---选题----文献查阅---经典研究方法---现代研究方法---数据收集与处理---论文写作与发表---科研管理---知识产权及保护. 第一章 科学研究导论 本章主要介绍科学 ...
第六章 数据的收集与整理 4.统计图的选择(一) 一.学生状况分析 1.学生在小学已经从事过一些统计工作,例如体验了简单数据收集和整理的过程,认识了简单的条形统计图和统计表,能根据统计图表回答简单的问题等.当时学生对统计过程的理解比较单一. ...
实践报告书写要求 实践报告原则上要求学生手写,要求书写工整.若因课程特点需打印的,要遵照以下字体.字号.间距等的具体要求.纸张一律采用A4的纸张. 实践报告书写说明 实践报告中一至四项内容为必填项,包括实践目的和要求:实践环境与条件:实践内 ...
LOGIT 模型参数估计方法研究 金 安 摘 要 离散选择模型,特别是LOGIT 模型在交通需求模型建立过程中,应用非常广泛,许多实际的交通政策问题都涉及到方式选择,然而LOGIT 模型的建立非常困难,尤其是效用函数及参数估计.本文重点就L ...