统计学总结

统计的三种含义:

统计工作或统计实践活动 统计资料 统计学 统计学

统计学是一门关于数据的科学,是一门关于数据的收集、整理、分析、解释和推断的科学。 统计总体

由客观存在的、在同一性质基础上结合起来的许多个别单位所形成的集合,具有客观性、大量性、同质性、变异性、相对性的特点。 总体单位

指构成总体的个体即每一个单位,总体由总体单位构成,要认识总体必须从总体单位开始,总体是统计认识的对象。 总体或总体单位的区分不是固定的:同一个研究对象,在一种情况下是总体,在另一种情况下可能成了总体单位。 统计总体的种类 按限度:

1. 有限总体:指所包含的单位数目有限的总体 2. 无限总体:指所包含的单位数目无限的总体 按大小: 1. 大总体

2. 小总体:指大总体的各组成部分 按可加性:

1. 可加总体:指总体单位可以合计的总体 2. 不可加总体:指总体单位不能合计的总体 样本

从总体中抽取出来并作为总体代表的一部分总体单位组成的集合体。也可以称总体为母体,样本为子样。 样本的每一构成单位都必须取自某一特定的统计总体。

样本单位的抽取应是随机产生的,必须排除人的主观因素影响。 样本是母体的代表,因而能够推断母体;

从一个总体中可以抽取许多样本,每一个样本只是母体的一个子集,且具有随机性。 标志

指总体单位所具有的属性和特征,标志的具体表现称为标志值 品质标志是表明事物“质”的特性的标志

数量标志是表明事物“量”的特性的标志,其中,可变的数量标志又被叫作变量

统计研究是从登记标志开始,并通过对标志的综合来反映总体的数量特征,因此标志是统计研究的起点。 统计指标

反映社会经济现象总体数量特征的概念及其具体数值

构成要素: 时间限制,空间限制,计算方法,指标名称,具体数值,计量单位 统计指标的性质

1. 数量性:统计指标是数量范畴,“没有没有数量的指标”。 2. 具体性:总体在具体时间、地点、条件下的数量特征

3. 综合性:对总体数量特征的综合说明,是由个体数量综合而来的。 标志与指标的联系与区别: 联系:

(1)标志是总体指标的来源和基础,指标则是标志的综合。

(2)数量标志与指标之间存在着变换关系。 区别:

(1)标志是说明总体单位特征的,指标则是说明统计总体数量特征的。

(2)有的标志用数值表示,有的标志用文字表示,而指标都是用数值表示的。 统计指标的基本分类

数量指标:反映的是所研究总体的规模和水平,其大小取决于总体单位数目的多少及其标志水平的高低。 质量指标:反映的是与总体单位数相对应的标志的平均水平或其它数量对比关系。 统计测量

运用某种方法使自然或社会经济现象量化。 统计数据测量尺度的种类 1. 定类测量(尺度、指标)

按现象性质差异进行的辨别与区分。测量结果形成定类变量或定类指标。

定类变量或指标确切的值是以文字表述的,可以用数值标识,但仅起标签作用。 定类变量或指标的各类别间是平等的,没有高低、大小、优劣之分。 2. 定序测量(尺度、指标)

按现象顺序差异进行的辨别与区分。测量结果形成定序变量或定序指标。

定序变量或指标确切的值是以文字表述的,也可以用数值标识,也仅起标签作用。 定序变量或指标各类别间有高低优劣之分,不能随意排列。 3. 定距测量(尺度、指标)

按现象绝对数量差异进行的辨别与区分。测量结果形成定距变量或定距指标。 定距变量或指标各类别间自然有大小之分,但没有绝对的零点,不能乘除计算。 定距变量或指标的值以数字表述,有计量单位,可以进行加减运算。 4. 定比测量(尺度、指标)

按现象绝对差异与相对差异进行的辨别与区分。测量结果形成定比变量或定比指标。 定比变量或指标确切的值也以数字表述,有计量单位,可以进行加减运算。 定比变量或指标有绝对意义上的零点,既可以加减运算,也可以乘除运算。 统计测量尺度的作用:

第一,决定数据的整理、显示方法 第二,决定数据的分析方法 第三,决定计算机的处理方法 总量指标(绝对数)

反映现象总体规模或水平的综合指标,即数量指标,也称为绝对数。 总量指标按反映的内容分类

1. 总体单位总量:总体所包含的总体单位的数量

2. 总体标志总量:总体单位某一数量标志的标志值总和

一个总体中只有一个单位总量,但可以有多个标志总量,它们由总体单位的数量标志值汇总而来。 总量指标按时间状态分类

1. 时期指标:表明现象总体在一段时期内发展过程的总量,具有可加性、数值大小与时期长短有直接关系、需要连续登记汇总

2. 时点指标:表明现象总体在某一时刻(瞬间)的数量状况,不具有可加性、数值大小与时期长短没有直接关系、由一次性登记调查得到 总量指标按计量单位分类 1. 复合单位 2. 双重单位

3. 多重单位

相对指标(相对数)

指应用对比的方法来反映相关事物之间数量联系程度的指标,也称为相对数。 相对指标的表现形式

1. 有名数:用双重计量单位表示的复名数

2. 无名数:用倍数、系数、成数、﹪、‰等表示 相对指标的计算

派生公式

结构相对数

是总体中某部分数值与该总体数值对比的比值, 它反映总体内部构成情况,一般用百分数表示。计算公式(注意:结构相对数的分子分母位置不能互换。)

恩格尔系数与消费结构分析

消费结构:是指各类消费支出在总消费支出中所占的比重。

恩格尔系数:19世纪德国统计学家恩格尔根据对英国、法国、德国、比利时等国居民家庭收支的分析研究,指出:随着家庭收入增加,家庭收入或总支出中用于食品方面的支出比重越来越小,即恩格尔定律,反映这个定律的系数,称为恩格尔系数。

恩格尔系数 = 食品支出总额/消费支出总额 比例相对数

是同一总体某一部分数值与另一部分数值对比的比值, 它反映总体各部分间的内在联系和比例关系,一般用比数表示。计算公式(注意:比例相对数的分子分母同属一个总体,而且分子与分母的位置可以互换。)

比较相对数

是同一时间的同类指标在不同空间对比的比值, 它反映不同国家、不同地区或不同单位之间的差异程度,一般用百分数或倍数表示。

计算公式(注意:比较相对数与比例相对数类似,分子与分母也可以互换。两者的差别为比例相对数是同一总体的不同部分比较,而比较相对数是同类指标的不同空间比较。)

动态相对数

是某一社会经济现象在不同时期两个数值对比的比率。它反映该现象在时间上的发展变化方向和程度,也称为发展速度和指数。计算公式

强度相对数

是两个性质不同而又有联系的指标对比的比率, 它反映现象的强度、密度和普及程度,是一种特殊形式的相对数。计算公式

集中趋势(central tendency)

1. 一组数据向其中心值靠拢的倾向和程度

2. 测度集中趋势就是寻找数据水平的代表值或中心值 3. 不同类型的数据用不同的集中趋势测度值

4. 低层次数据的测度值适用于高层次的测量数据,但高层次数据的测度值并不适用于低层次的测量数据

5. 集中趋势也是表明同类社会经济现象在一定时间、地点条件下所达到的一般水平的综合指标。其数值表现为平均数也称平均指标。 众数(Mode)

1. 一组数据中出现次数最多的变量值 2. 适合于数据量较多时使用 3. 不受极端值的影响

4. 一组数据可能没有众数或有几个众数

5. 主要用于分类数据,也可用于顺序数据和数值型数据 中位数(median )(顺序数据特别适用) 1.排序后处于中间位置上的值 2.不受极端值的影响

3.主要用于顺序数据,也可用数值型数据,但不能用于分类数据 4. 各变量值与中位数的离差绝对值之和最小,即

中位数(位置的确定) 对于顺序数据:

对于数值数据:

算术平均数(均值)(mean) 1. 集中趋势的最常用测度值, 用符号

表示

2.是一组数据的均衡点所在 3.体现了数据的必然性特征 4.易受极端值的影响

5.用于数值型数据,不能用于分类数据和顺序数据

均值的计算方法 1. 简单算术平均数

2.. 加权算术平均数

权数

指变量数列中各组标志值出现的次数,是变量值的承担者,反映了各组的标志值对平均数的影响程度‘ 异众比率(variation ratio)

1. 对品质数据离散程度的测度 2. 非众数组的频数占总频数的比率 3. 计算公式为

5. 用于衡量众数的代表性 极差(range)

1. 一组数据的最大值与最小值之差,又称全距。 2. 离散程度的最简单测度值 3. 易受极端值影响 4. 未考虑数据的分布

平均差(mean deviation)

1. 各变量值与其均值离差绝对值的平均数 2. 能全面反映一组数据的离散程度 3. 数学性质较差,实际中应用较少 4. 计算公式为:

(1)简单平均差——适用于未分组资料

(2)加权平均差——适用于分组资料

方差和标准差(variance and standard deviation) 1.数据离散程度的最常用测度值 2.反映了各变量值与均值的平均差异

3.根据总体数据计算的,称为总体方差或标准差;根据样本数据计算的,称为样本方差或标准差 总体方差和标准差 方差的计算公式 未分组数据:

分组数据:

标准差的计算公式 未分组数据:

分组数据:

标准差的简捷计算

目的:避免离差平方和计算过程的出现

样本方差和标准差 (simple variance and standard deviation) 方差的计算公式 未分组数据:

分组数据:

标准差的计算公式 未分组数据

分组数据:

离散系数(coefficient of variation)

1. 一般用标准差(也可用平均差)与其相应的均值之比 2对数据相对离散程度的测度

3. 消除了数据水平高低和计量单位的影响 4. 用于对不同组别数据离散程度的比较 5. 计算公式为

变异系数指标 平均差系数

标准差系数

抽样推断

按照随机原则从调查对象中抽取一部分单位进行调查,并以调查结果对总体数量特征作出具有一定可靠程度的估计与推断,从而认识总体的一种统计方法 总体参数和样本估计量 总体(population ):全及总体简称总体,是指所要认识对象的全体。全及总体的单位数用N 表示,即使是有限总体,N 一般也都是很大的。 样本(sample ):样本总体简称样本。是从全及总体中随机抽取出来,代表全及总体的部分单位的集合体。样本总体的单位数通常用n 表示,对于N 来说,n 是很小的。把 n/N 叫做抽样比例。 总体参数:指被估计的总体指标,又被称为全及指标 ⒈ 总体平均数(又叫总体均值):

⒉ 总体单位标志值的标准差:

⒊ 总体单位标志值的方差:

⒋ 总体成数:

⒌ 总体是非标志的标准差:

⒍ 总体是非标志的方差:

样本估计量:指根据样本单位的标志值计算的用以估计和推断相应总体指标的综合指标,又被称为估计量或统计量 ⒉ 样本平均数(又叫样本均值):

⒉样本单位标志值的标准差:

⒊ 样本单位标志值的方差:

⒋ 样本成数:

⒌ 样本单位是非标志的标准差:

⒍ 样本单位是非标志的方差:

抽样方案设计的基本准则 ㈠随机原则 ㈡抽样误差最小 ㈢费用最少 抽样方法

1. 重复抽样:又被称作重置抽样、有放回抽样同一总体单位有可能被重复抽中,而且每次抽取都是独立进行 2. 不重复抽样:又被称作不重置抽样、不放回抽样同一总体中每个单位被抽中的机会并不均等,在连续抽取时,

每次抽取都不是独立进行是最为常用的抽样方法,用于无限总体和许多有限总体样本单位的抽样。

样本数:又称样本的可能数目,在考虑顺序的抽样条件下,从总体N 中随机抽取n 个样本单位共有多少种可能的抽选结果。

⒈ 重复抽样的可能样本数目:

⒉ 不重复抽样的可能样本数目:

抽样误差

指样本估计量与总体参数之间数量上的差异,仅指由于按照随机原则抽取样本而产生的代表性误差,不包括登记性误差和系统偏差

影响抽样误差的因素:

1、总体各单位标志值的差异程度 2、样本单位数的多少 3、抽样方法 4、抽样组织方式

抽样平均误差的实际应用计算公式 ⒈ 样本平均数的抽样平均误差 重复抽样时:

不重复抽样时:

⒉ 样本成数的抽样平均误差 重复抽样时:

不重复抽样时:

时间数列

把反映现象发展水平的统计指标数值,按照时间先后顺序排列起来所形成的统计数列 两个构成要素: 1. 现象所属的时间

2. 反映现象发展水平的指标数值 编制时间数列的基本原则

保证数列中各期指标数值的可比性 时间数列常用分析方法

1. 指标分析法:通过时间数列的分析指标来揭示现象的发展变化状况和发展变化程度

2. 构成因素分析法:通过对影响时间数列的构成因素进行分解分析,揭示现象随时间变化而演变的规律 时间数列的种类


© 2024 实用范文网 | 联系我们: webmaster# 6400.net.cn