各地区各行业工资水平的分析--20**年

各地区各行业工资水平的分析(2010年数据)

王红纱 学号:6120906011

1. 研究背景及意义

1.1 研究背景

工资水平是指一定区域和一定时间内劳动者平均收入的高低程度。生产决定分配,只有经济发展才能提供更多的可分配的社会产品,因此一个地区的工资水平在一定程度上反映了其经济发展的水平。 1.2 研究意义

1. 通过多元统计分析方法,探究一个地区的工资水平与其经济发展水平之间的内在联系。

2. 将平均工资水平划分为3类,分析哪些地区、哪些行业的工资水平较高,可以为大学生就业提供宏观上的方向指引。

2. 数据来源与描述

2.1数据描述

本问研究全国31个省市(港、澳、台除外)的工资状况,各省市分别记录了其19个主要行业的平均工资水平,这19个主要行业包括:企业、事业、机关、金融业、制造业、建筑业、房地产业、农林牧渔业等等,具体数据格式参见图-0。 通过聚类分析方法,判断哪些地区平均工资水平较高

聚类分析是依据研究对象的个体特征,对其进行分类的方法,分类在经济、管理、社会学、医学等领域,都有广泛的应用。聚类分析能够将一批样本(或变量)数据根据其诸多特征,按照在性质上的亲疏程度在没有先验知识的情况下进行自动分类,产生多个分类结果。类内部个体特征之间具有相似性,不同类间个体特征的差异性较大。本文采用两种方法进行聚类分析:一种是系统聚类法,另一种是K-均值法(快速聚类法),对工资水平进行分析。

表1国内生产总值指数、就业人员平均工资和城镇居民消费价格指数

年 份 2001 2002 2003 2004 2005 2006 2007 2008 2009 2010

国内生产 总值指数 108.3 109.1 110.0 110.1 111.3 112.7 114.2 109.6 109.2 110.4

就业人员平均工资指数 货币工资 116.1 114.2 112.9 114.0 114.3 114.6 118.5 116.9 111.6 113.3

实际工资 115.3 115.4 111.9 110.4 112.5 112.9 113.4 110.7 112.6 109.8

城镇居民消 费价格指数 100.7 99.0 100.9 103.3 101.6 101.5 104.5 105.6 99.1 103.2

注:数据来自2011中国劳动统计年鉴

表2 各地区分行业平均工资水平(2010年)

地区

农林牧渔

采矿业

制造业

电力、燃气及水的生产和供应业

建筑业

交通运输、仓储和邮政业

信息传输、计算机服务和软件业

北 京 天 津 河 北 山 西 内蒙古 辽 宁 吉 林 黑龙江 上 海 江 苏 浙 江 安 徽 福 建 江 西 山 东 河 南 湖 北 湖 南 广 东 广 西 海 南 重 庆 四 川 贵 州 云 南 西 藏 陕 西 甘 肃 青 海 宁 夏 新 疆

29889 40221 12423 20570 18292 10040 15220 12916 39575 20736 34088 16945 18041 16265 24143 17433 19541 15435 15270 17023 18042 20544 19980 18175 15922 20238 23934 19735 26020 20940 20022

68514 59897 49514 52252 42248 41238 33584 39793 62356 41573 28330 57314 29328 27978 46560 46887 31989 24867 47254 28708 30151 31491 37984 32779 27175 26315 42417 43258 40320 71685 47805

48298 42482 27894 25350 30024 32126 31153 26764 52163 32209 29671 29238 26627 25579 27773 25864 30689 28691 31277 26179 26772 31894 28577 29381 28550 26984 26015 28173 28459 29560 31588

85178 82607 45478 43023 48860 42658 33044 36613 93049 66131 77180 40467 50529 37312 42025 37196 39067 36134 58158 39264 40553 50326 39844 47822 44110 41225 39677 37624 44721 55543 43855

46421 53686 23159 25936 24946 27535 21165 22904 69051 29679 28595 28046 30138 25293 25807 24151 27661 23674 29019 27688 25237 27730 24036 25437 21002 27908 25357 20836 26423 25284 28908

51342 55912 33141 37888 39991 38451 30422 31501 58405 38584 48359 29408 39741 38628 39435 31748 34668 32921 49623 33697 42036 33613 36496 32106 35897 39032 35846 30928 43523 36498 45572

105560 73276 38840 33916 37530 56013 33772 40416 115524 58902 77125 36316 59117 32566 50315 35042 39222 39592 68204 42633 60215 62634 42615 37097 37346 51682 42498 24896 41668 42469 43124

注:数据来自中国劳动统计年鉴

表2 各地区分行业平均工资水平(2010年) 续表1

地区

批发和零售业

住宿和餐饮业

金融业

房地产业

租赁和商务服务业

科学研究、技术服务和地质勘查业

北 京 天 津 64150 44710

31978 22742

164643 89166

50814 47385

63794 28880

88018 80485

水利、环境和公共设施管理业 41376 44067

山 西 内蒙古 辽 宁 吉 林 黑龙江 上 海 江 苏 浙 江 安 徽 福 建 江 西 山 东 河 南 湖 北 湖 南 广 东 广 西 海 南 重 庆 四 川 贵 州 云 南 西 藏 陕 西 甘 肃 青 海 宁 夏 新 疆

18890 24342 28616 22999 25702 61509 31451 39901 26935 32850 24868 23845 22403 25081 27604 38378 26093 23955 29667 29046 27776 26268 39462 23836 20563 24898 29497 32343

15064 21335 21613 17594 20804 32815 24029 24679 18188 22268 18268 21810 20201 20601 19963 24781 17211 18875 21389 22262 18935 16030 22090 18171 17588 18574 17799 21954

47037 45588 53676 43174 42537 155763 71115 98135 46561 70532 38926 53148 41871 49830 44428 90519 60153 62984 58751 52854 61474 60775 98092 48138 35311 41641 53674 53127

17847 26475 28147 23153 21881 48306 43305 42290 27250 36917 25857 29793 28913 30760 27550 37590 27597 26157 32396 29995 22997 22236 43451 37842 22936 21948 28610 23005

19819 31840 24598 23918 28238 60905 29776 32450 28122 24511 21725 28987 24560 26647 25086 41195 25994 20703 25440 34221 22036 23969 27828 28327 21608 42784 26137 22517

33847 40047 48030 38732 39938 83338 60437 56621 36068 41592 30430 45803 36436 45518 36381 69434 36182 30680 55381 53854 29670 34588 63810 48734 34730 48822 36666 38593

16657 27729 24753 18375 18663 44376 30940 32462 20949 26824 19757 25387 24648 21730 22133 31351 20150 20652 21818 20555 20737 17788 32464 23514 23186 25591 25155 25575

注:数据来自中国劳动统计年鉴

表2 各地区分行业平均工资水平(2010年) 续表2

地区

居民服务和其他服务业

北 京 天 津 河 北 山 西 内蒙古 辽 宁 吉 林 黑龙江 上 海 江 苏

27625 23529 34932 20623 39550 25101 17511 29803 35226 34349

65150 66285 33588 30620 43397 41656 31548 34630 69738 49340 教 育

卫生、社会保障和

社会福利业 70182 60149 30645 24049 38375 36638 28476 32095 73470 46337

文化、体育和娱乐业 76415 54182 26208 24927 37805 36478 26684 29827 68533 48360

公共管理和社会

组织 55680 67714 29923 27751 40338 36941 29247 31568 73073 58861

安 徽 福 建 江 西 山 东 河 南 湖 北 湖 南 广 东 广 西 海 南 重 庆 四 川 贵 州 云 南 西 藏 陕 西 甘 肃 青 海 宁 夏 新 疆

23258 33977 22375 32461 23650 26086 23740 29956 21791 20526 26049 24029 21966 18340 44509 26147 21384 32969 23356 18330

32445 40550 29980 38621 33090 34230 31825 42928 32182 40791 37497 34408 30466 32301 52781 39785 29725 42447 35785 35016

31811 40844 31494 38044 31177 33751 36476 52308 33100 35308 44249 39209 29993 28988 48293 34809 28881 37126 31896 32323

28435 35654 30555 41008 28511 32390 32908 47213 32141 29492 34163 32101 24531 24834 50858 29724 28769 38694 34118 32609

33622 42000 29395 35726 28474 34198 30156 53350 33864 39376 36936 35015 29537 31650 54848 33224 30227 40648 33119 35950

3. 聚类分析应用

表3 描述统计量,最大值、最小值、均值和标准差

农林牧渔 采矿业 制造业

电力、燃气及水的生产和供应业 建筑业

交通运输、仓储和邮政业 信息传输、计算机服务和软件业 批发和零售业 住宿和餐饮业 金融业 房地产业

租赁和商务服务业

科学研究、技术服务和地质勘查业 水利、环境和公共设施管理业 居民服务和其他服务业 教 育

卫生、社会保障和社会福利业 文化、体育和娱乐业 公共管理和社会组织

N 31 31 31 31 31 31 31 31 31 31 31 31 31 31 31 31 31 31 31

极小值 10040 24867 25350 33044 20836 29408 24896 18890 15064 35311 17847 19819 29670 16657 17511 29725 24049 24531 27751

极大值 40221 71685 52163 93049 69051 58405 115524 64150 32815 164643 50814 63794 88018 44376 44509 69738 73470 76415 73073

均值 20568.32 41663.35 30516.26 49008.81 28797.16 38884.26 50326.61 30239.29 20868.55 63832.23 31009.58 29283.03 47485.29 25516.94 27041.13 40532.19 39451.74 37240.00 39905.74

标准偏差 7051.542 12689.637 6177.462 15654.385 9961.832 7433.597 20477.664 10587.282 3947.699 30765.755 8811.817 10311.248 15771.144 7241.757 6708.301 11509.982 12399.589 12741.286 12667.597

农林牧渔 采矿业 制造业

电力、燃气及水的生产和供应业 建筑业

交通运输、仓储和邮政业 信息传输、计算机服务和软件业 批发和零售业 住宿和餐饮业 金融业 房地产业

租赁和商务服务业

科学研究、技术服务和地质勘查业 水利、环境和公共设施管理业 居民服务和其他服务业 教 育

卫生、社会保障和社会福利业 文化、体育和娱乐业 公共管理和社会组织 Valid N (listwise)

N 31 31 31 31 31 31 31 31 31 31 31 31 31 31 31 31 31 31 31 31

极小值 10040 24867 25350 33044 20836 29408 24896 18890 15064 35311 17847 19819 29670 16657 17511 29725 24049 24531 27751

极大值 40221 71685 52163 93049 69051 58405 115524 64150 32815 164643 50814 63794 88018 44376 44509 69738 73470 76415 73073

均值 20568.32 41663.35 30516.26 49008.81 28797.16 38884.26 50326.61 30239.29 20868.55 63832.23 31009.58 29283.03 47485.29 25516.94 27041.13 40532.19 39451.74 37240.00 39905.74

标准偏差 7051.542 12689.637 6177.462 15654.385 9961.832 7433.597 20477.664 10587.282 3947.699 30765.755 8811.817 10311.248 15771.144 7241.757 6708.301 11509.982 12399.589 12741.286 12667.597

分析描述统计量的输出结果可知,平均工资水平较高的三个行业分别是金融业(63832.23元),信息传输、计算机服务和软件业(50326.61元),电力、燃气及水的生产和供应业(49008.81元);平均工资水平较低的三个行业分别是农、林、牧、渔业(20568.32元),住宿和餐饮业(20868.55元),水利、环境和公共设施管理业(25516.94元)。

表4显示的是用平方Euclidean 距离计算的近似矩阵表,其实质是一个不相似矩阵,其中的数值表示各个样本之间的相似系数,数值越大,表示两样本距离越大。

表4 近似矩阵表

Case 1:北 京 2:天 津 3:河 北 4:山 西 5:内蒙古 6:辽 宁 7:吉 林 8:黑龙江 9:上 海 10:江 苏 11:浙 江 12:安 徽 13:福 建 1:北 京 0 2.157 10.15 7.753 7.655 10.27 0.756 4.472 3.483 9.61 7.063

2:天 津 2.157 0 6.761 4.909 4.981 7.28 2.107 2.36 1.671 6.453 4.373

3:河 北 10.149 6.761 0 0.639 0.54 0.513 0.693 0.266 12.411 1.854 4.338 0.388 0.863

4:山 西 11.903 7.716 0.639 0 1.368 1 0.44 0.571 14.243 3.192 5.554 0.4 1.708

5:内蒙古 7.753 4.909 0.54 1.368 0 0.508 1.335 0.57 9.327 0.942 2.462 0.882 0.42

6:辽 宁 7.655 4.981 0.513 1 0.508 0 0.647 0.381 9.749 1.122 2.983 0.534 0.445

7:吉 林 11.489 7.861 0.693 0.44 1.335 0.647 0 0.335 14.101 2.822 5.271 0.408 1.372

8:黑龙江 10.271 7.28 0.266 0.571 0.57 0.381 0.335 0 12.623 2.051 4.329 0.315 0.802

9:上 海 0.756 2.107 12.411 14.243 9.327 9.749 14.101 12.623 0 5.706 3.983 12 8.616

10:江 11:浙 苏 4.472 2.36 1.854 3.192 0.942 1.122 2.822 2.051 5.706 0 0.841 2.076 0.637

江 3.483 1.671 4.338 5.554 2.462 2.983 5.271 4.329 3.983 0.841 0 4.547 1.814

11.903 7.716

11.489 7.861

15:山 东 16:河 南 17:湖 北 18:湖 南 19:广 东 20:广 西 21:海 南 22:重 庆 23:四 川 24:贵 州 25:云 南 26:西 藏 27:陕 西 28:甘 肃 29:青 海 30:宁 夏 31:新 疆

7.39 10.07 8.915 10.17 3.591 10.09 9.45 7.262 7.949 10.60 5.557 8.432 7.567 8.104 8.178

4.58 6.66 5.734 6.933 2.396 6.689 5.855 4.587 5.323 7.104 3.595 5.081 4.648 5.082 4.91

0.501 0.335 0.441 0.626 2.232 0.605 0.879 0.719 0.591 0.601 0.791 2.291 0.475 0.484 0.874 0.695 0.923

0.987 0.423 0.746 0.795 3.356 0.552 0.691 1.278 0.885 0.42 0.437 4.035 0.813 0.266 1.191 0.654 0.63

0.22 0.745 0.543 0.823 1.285 0.906 0.892 0.681 0.616 0.991 1.266 1.22 0.616 1.012 0.289 0.966 0.87

0.379 0.442 0.277 0.412 1.165 0.451 0.399 0.298 0.296 0.581 0.674 1.686 0.474 0.703 0.703 0.768 0.376

1.009 0.299 0.335 0.221 3.091 0.205 0.516 0.781 0.514 0.188 0.143 3.427 0.667 0.162 1.258 1.112 0.687

0.487 0.219 0.246 0.243 2.288 0.289 0.548 0.579 0.328 0.303 0.436 2.405 0.518 0.316 0.731 0.889 0.69

9.197 12.504 10.967 12.492 5.084 12.336 11.35 9.153 10.144 12.844 13.57 6.822 10.52 13.799 9.113 10.347 10.111

0.949 2.026 1.419 2.013 0.473 2.005 1.815 0.909 1.308 2.353 2.663 0.581 1.271 2.587 1.263 1.823 1.771

2.459 4.369 3.324 3.999 1.224 3.931 3.252 2.374 3.07 4.424 4.673 1.149 3.035 5.023 2.497 3.924 3.461

11.176 7.49

11.344 7.393

表4 近似矩阵表 续表1

12:安 徽 9.61 6.453 0.388 0.4 0.882 0.534 0.408 0.315 12 2.076 4.547 0 1.125 0.576 0.584 0.147 0.418 0.553 2.347 0.44 0.744 0.752

13:福 建 7.063 4.373 0.863 1.708 0.42 0.445 1.372 0.802 8.616 0.637 1.814 1.125 0 0.889 0.378 0.869 0.451 0.658 0.977 0.682 0.6 0.33

14:江 西 11.247 7.414 0.658 0.47 0.977 0.594 0.231 0.326 13.52 2.482 4.521 0.576 0.889 0 0.746 0.302 0.258 0.123 2.712 0.115 0.288 0.724

15:山 东 7.39 4.58 0.501 0.987 0.22 0.379 1.009 0.487 9.197 0.949 2.459 0.584 0.378 0.746 0 0.444 0.309 0.623 1.17 0.622 0.62 0.387

16:河 南 10.073 6.66 0.335 0.423 0.745 0.442 0.299 0.219 12.504 2.026 4.369 0.147 0.869 0.302 0.444 0 0.239 0.286 2.344 0.279 0.53 0.631

17:湖 北 8.915 5.734 0.441 0.746 0.543 0.277 0.335 0.246 10.967 1.419 3.324 0.418 0.451 0.258 0.309 0.239 0 0.124 1.748 0.153 0.358 0.212

18:湖 南 10.169 6.933 0.626 0.795 0.823 0.412 0.221 0.243 12.492 2.013 3.999 0.553 0.658 0.123 0.623 0.286 0.124 0 2.303 0.092 0.348 0.415

19:广 东 3.591 2.396 2.232 3.356 1.285 1.165 3.091 2.288 5.084 0.473 1.224 2.347 0.977 2.712 1.17 2.344 1.748 2.303 0 2.272 1.979 1.195

20:广 西 10.085 6.689 0.605 0.552 0.906 0.451 0.205 0.289 12.336 2.005 3.931 0.44 0.682 0.115 0.622 0.279 0.153 0.092 2.272 0 0.231 0.44

21:海 南 9.45 5.855 0.879 0.691 0.892 0.399 0.516 0.548 11.35 1.815 3.252 0.744 0.6 0.288 0.62 0.53 0.358 0.348 1.979 0.231 0 0.516

22:重 庆 7.262 4.587 0.719 1.278 0.681 0.298 0.781 0.579 9.153 0.909 2.374 0.752 0.33 0.724 0.387 0.631 0.212 0.415 1.195 0.44 0.516 0

0.386 0.607 2.916 0.44 0.237 0.953 0.295 0.55

0.911 1.135 0.776 0.521 1.281 0.733 1.306 0.888

0.178 0.158 2.855 0.551 0.261 0.978 1.152 0.548

0.773 1.02 1.361 0.257 0.724 0.277 0.624 0.532

0.268 0.467 2.636 0.281 0.122 0.871 0.521 0.488

0.27 0.378 1.823 0.204 0.352 0.581 0.899 0.481

0.188 0.241 2.299 0.471 0.326 0.906 1.215 0.632

2.694 2.845 1.025 1.641 2.991 1.304 1.961 1.618

0.14 0.132 2.375 0.386 0.295 0.851 1.017 0.574

0.365 0.302 2.298 0.531 0.609 0.843 1.084 0.409

0.604 0.743 1.423 0.363 0.864 0.722 1.069 0.689

表4 近似矩阵表 续表2

23:四 川 7.949 5.323 0.591 0.885 0.616 0.296 0.514 0.328 10.144 1.308 3.07 0.461 0.54 0.479 0.29 0.345 0.122 0.304 1.323 0.319 0.493 0.208 0 0.482 0.559 1.809 0.234 0.544 0.491 0.83 0.457

24:贵 州 10.598 7.104 0.601 0.42 0.991 0.581 0.188 0.303 12.844 2.353 4.424 0.386 0.911 0.178 0.773 0.268 0.27 0.188 2.694 0.14 0.365 0.604 0.482 0 0.122 2.946 0.598 0.208 1.057 0.891 0.518

25:云 南 11.176 7.49 0.791 0.437 1.266 0.674 0.143 0.436 13.57 2.663 4.673 0.607 1.135 0.158 1.02 0.467 0.378 0.241 2.845 0.132 0.302 0.743 0.559 0.122 0 3.189 0.707 0.321 1.136 1.189 0.627

26:西 藏 5.557 3.595 2.291 4.035 1.22 1.686 3.427 2.405 6.822 0.581 1.149 2.916 0.776 2.855 1.361 2.636 1.823 2.299 1.025 2.375 2.298 1.423 1.809 2.946 3.189 0 1.714 3.262 1.625 2.98 2.635

27:陕 西 8.432 5.081 0.475 0.813 0.616 0.474 0.667 0.518 10.52 1.271 3.035 0.44 0.521 0.551 0.257 0.281 0.204 0.471 1.641 0.386 0.531 0.363 0.234 0.598 0.707 1.714 0 0.518 0.57 0.665 0.641

28:甘 肃 11.344 7.393 0.484 0.266 1.012 0.703 0.162 0.316 13.799 2.587 5.023 0.237 1.281 0.261 0.724 0.122 0.352 0.326 2.991 0.295 0.609 0.864 0.544 0.208 0.321 3.262 0.518 0 1.014 0.697 0.576

29:青 海 7.567 4.648 0.874 1.191 0.289 0.703 1.258 0.731 9.113 1.263 2.497 0.953 0.733 0.978 0.277 0.871 0.581 0.906 1.304 0.851 0.843 0.722 0.491 1.057 1.136 1.625 0.57 1.014 0 1.02 0.765

30:宁 夏 8.104 5.082 0.695 0.654 0.966 0.768 1.112 0.889 10.347 1.823 3.924 0.295 1.306 1.152 0.624 0.521 0.899 1.215 1.961 1.017 1.084 1.069 0.83 0.891 1.189 2.98 0.665 0.697 1.02 0 0.544

31:新 疆 8.178 4.91 0.923 0.63 0.87 0.376 0.687 0.69 10.111 1.771 3.461 0.55 0.888 0.548 0.532 0.488 0.481 0.632 1.618 0.574 0.409 0.689 0.457 0.518 0.627 2.635 0.641 0.576 0.765 0.544 0

显示的是聚类表,该表反映的是每一阶段聚类的结果,系数表示的是“聚合系数”,第2列和第3列表示的是聚合的类。

表5 聚类表

群集组合

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30

群集 1 18 14 17 24 16 7 7 12 17 5 3 17 5 6 7 3 3 6 10 3 5 30 3 3 1 10 10 1 3 1

群集 2 20 18 23 25 28 24 14 16 22 15 8 27 29 17 21 12 7 13 19 4 6 31 5 30 9 26 11 2 10 3

系数 .092 .119 .122 .122 .122 .166 .188 .192 .210 .220 .266 .267 .283 .337 .341 .343 .448 .457 .473 .509 .510 .544 .692 .752 .756 .803 1.071 2.132 2.477 8.255

首先出现阶群集 群集 1 0 0 0 0 0 0 6 0 3 0 0 9 10 0 7 11 16 14 0 17 13 0 20 23 0 19 26 25 24 28

群集 2 0 1 0 0 0 4 2 5 0 0 0 0 0 12 0 8 15 0 0 0 18 0 21 22 0 0 0 0 27 29

下一阶 2 7 9 6 8 7 15 16 12 13 16 14 21 18 17 17 20 21 26 23 23 24 24 29 28 27 29 30 30 0

图1

图1是冰柱图,是反映样本聚类情况的图,如果按照设定的类数,在那类数的行上从左到右就可以找到各类所包含的样本。

图2

下文使用聚类分析——K-均值法(快速聚类法)对全国各地工资水平进行聚类分析。

电力、燃气及水的生产和供应业 建筑业

交通运输、仓储和邮政业 信息传输、计算机服务和软件业 批发和零售业 住宿和餐饮业 金融业 房地产业

租赁和商务服务业

科学研究、技术服务和地质勘查业 水利、环境和公共设施管理业 居民服务和其他服务业 教 育

卫生、社会保障和社会福利业 文化、体育和娱乐业 公共管理和社会组织

85178 46421 51342 105560 64150 31978 164643 50814 63794 88018 41376 27625 65150 70182 76415 55680

77180 28595 48359 77125 39901 24679 98135 42290 32450 56621 32462 35127 63693 62508 56313 64667

37624 20836 30928 24896 20563 17588 35311 22936 21608

34730 23186 21384 29725 28881 28769 30227

表7 迭代历史记录a

表8表示的是最终聚类中心,可以看出,第1类的平均工资水平最高,第2类居中,第3类最低。

表8 最终聚类中心

1

农林牧渔 采矿业 制造业

电力、燃气及水的生产和供应业 建筑业

交通运输、仓储和邮政业 信息传输、计算机服务和软件业 批发和零售业 住宿和餐饮业 金融业 房地产业

租赁和商务服务业

科学研究、技术服务和地质勘查业

34732 65435 50231 89114 57736 54874 110542 62830 32397 160203 49560 62350 85678

聚类 2 26111 40674 32525 65060 33777 46302 65838 38780 23664 89405 42804 32026 66157

3 18233 39889 28455 42323 25348 36006 42077 25744 19325 50474 27007 25956 40413

水利、环境和公共设施管理业 居民服务和其他服务业 教 育

卫生、社会保障和社会福利业 文化、体育和娱乐业 公共管理和社会组织

42876 31426 67444 71826 72474 64377

34257 33494 55005 53919 51385 59888

22250 25331 35274 33740 31357 33704

表9表示的是最终聚类中心间的距离,可以看出,第2类与第3类之间的距离要比第2类与第1类之间的距离小。

表9

最终聚类中心间的距离

表10

表示的是每个聚类中的案例数,可以看出,第1类有2个样本,第2类中有5个样本。

表10 每个聚类中的案例数

表11是聚类表,表示的是每个个案的分类情况:第3列“聚类”表示的是该案例属于哪一类,第4列“距离”表示该案例与其所属类别重心之间的距离。

表11 聚类成员

案例号 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

地区 北 京 天 津 河 北 山 西 内蒙古 辽 宁 吉 林 黑龙江 上 海 江 苏 浙 江 安 徽 福 建 江 西 山 东

聚类 1 2 3 3 3 3 3 3 1 2 2 3 3 3 3

距离 19080.497 47144.308 21776.914 26950.867 23614.445 21553.810 22471.476 15249.143 19080.497 26331.737 30027.727 21477.409 36523.329 24449.786 20258.021

16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31

河 南 湖 北 湖 南 广 东 广 西 海 南 重 庆 四 川 贵 州 云 南 西 藏 陕 西 甘 肃 青 海 宁 夏 新 疆

3 3 3 2 3 3 3 3 3 3 2 3 3 3 3 3

17730.573 11889.098 19620.749 24566.340 17210.742 29039.875 32583.129 18322.001 22550.694 23158.600 37628.986 16775.004 28183.066 28594.439 35524.708 18458.468

北京与上海属于第1类,工资水平最高,天津、江苏、浙江、广东、西藏属于第2类,其他则属于第3类,工资水平较低。

4.结论

4.1不同行业平均工资水平的比较

平均工资水平较高的三个行业分别是金融业(63832.23元),信息传输、计算机服务和软件业(50326.61元),电力、燃气及水的生产和供应业(49008.81元);平均工资水平较低的三个行业分别是农、林、牧、渔业(20568.32元),住宿和餐饮业(20868.55元),水利、环境和公共设施管理业(25516.94元)。 4.2不同地区平均工资水平的比较

比较系统聚类法和K-均值聚类法(快速聚类法)的输出结果,可以看出,其聚类结果大致相同。比较合理的聚类方法是将所有样本分成3类,第1类包括北京、上海,第2类包括天津、广东、浙江、江苏、西藏,剩下的其他样本属于第3类。很显然,第1类的工资水平(经济发展水平)最高,第2类居中,第3类次之。


© 2024 实用范文网 | 联系我们: webmaster# 6400.net.cn