模糊聚类分析在证券投资中的应用_李星

模糊聚类分析在证券投资中的应用

李 星 陈世平 牛文举 董利歌

(湖南工业大学管理科学与工程研究所,湖南 株洲 412008)

【摘要】基于模糊数学理论,运用模糊聚类分析法研究了证券投资决策问题。首先,在选取6个具有代表性财务指标的基础上,采用模糊聚类分析方法对湖南省上市10只股票的财务指标数据建立模糊相似矩阵,并对其进行模糊聚类分析。然后,通过引进F-统计量以确定最佳l和最优投资股票的分类。实证结果表明,模糊聚类分析为投资者提供了一种有效选股方法,并且模糊聚类分析能够区分不同投资价值的股票。【关键词】模糊聚类分析;股票投资;F-统计量

,,,}糊集合X=,各表示指标属于集合Xi的隶属度,故Xi就间

接描述了各个对象xi的基本特征,可以用一定的方法(相似系数法、距离法)确定xi与xj的相似程度rij。

本文采用较为常用的欧氏距离来计算模糊相似系数:

i

i1

i2

im

ij

d(xi,xj)=

一、引言

随着市场经济的高速发展,人们的金融意识和投资意识日益增强,作为市场经济重要组成部分的股市成为越来越多投资者选择的理财场所。长期以来投资者一直使用基本分析和技术分析的方法进行投资决策,实践投资中有一定的指导作用,但是在受许多因素影响的股票市场中,把握准确的选股标准,仅靠这两种分析方法是不够的。因此许多学者对证券投资分析做出了大量的研究:李敏等用离差平方和法对31家上市公司的股票进行聚类分析,找出真正具有投资价值的股票,进行长期投资;许宗燕依据模糊聚类理论,采用模糊隶属度函数对14家中小企业进行了模糊聚类分析;陈洋洋等基于模糊数学的原理和方法,利用FAHP建立股票长期投资决策模型,并且实证分析了5只上市股票;鲍新中等基于粗糙集的基本理论,提出了一种基于粗集理论的多属性股票投资决策方法,最后进行实证分析。由于股票市场数据的庞大,股票的评价指标繁多且含义不同,人们对股票的先验性知识不足,本文基于模糊理论知识,通过建立模糊相似矩阵对上市公司的股票进行分类,更为简便、实用。

证券投资分析大多数采用概率论与数理统计的方法来处理证券投资中不确定性问题,本文采用模糊聚类分析通过建立模糊相似关系对股票进行分类。运用模糊聚类方法能够帮助投资者了解并把握股票的总体特征,锁定了一定的投资范围,降低投资风险。为了验证模糊聚类分析在股票市场分析中的准确性及实用性,本文选取湖南省上市的10只股票,使用模糊聚类分析方法对上市股票进行归类,并使用F-统计量对聚类结果进行检验,以确定最佳的股票投资类别,从而为投资者提供一些投资参考。

二、股票投资的模糊聚类分析过程(一)选定对象

设对象集Y={y1,y2,Lyn},这里的对象是指上市公司的股票,指标X=集{x,xx},对于被研究的指标应该有明确的实际意义和较强的代表性。并通过直接观测或者采用上市公司的统计资料,可以得到各个对象对应这些指标所取数值的向量,即Xi={xi1,xi2Lxim},其中xik是第i个对象的第k个指标值,得到矩阵X=(xij)n×m,称为原始资料矩阵。

(二)数据标准化

采用标准差变换和极差变换将数据标准化,将数据压缩到[0,1]区间上,以便构造相类似矩阵。

将第i个变量xij进行标准差变换为:

1

2

n

R=rij=1−cd

(3)

       

(xi,xj)                 (4)

k=1

ik

∑(x

−xjk)21≤i,j≤n

其中,c为常数,它使得0≤rij

≤1,可以取c=

1

ij(四)模糊聚类分类

被分类股票构成的集合E={x,x,,x},E上的相似关系R=rij是一个n×n阶矩阵,rij具有自身性和对称性的特点,但是不一定具有传递性的特点。可以通过平方法求得传递闭包得到模糊等价矩阵,从而使得R∗具有传递性特点。具体算法是从模糊矩阵R出发,依次求平方得:

R→R2→R4→

当第一次出现RkRk=Rk(表明Rk具有传递性),“”是算

l

子,此时Rk就是所求的传递闭包R∗。称Rl=(rij)为R的截矩阵,并且元素rijl可以定义为:

1

2

n

(5)

是[0,1]之间的任意实数,当rij≥l时,样本xi和xj可以分

为一类。赋予不同的值,通过计算截矩阵的方法来获得不同的分类。

(五)分类的F检验

模糊聚类分析是动态的,为了给出一个较为明确的分类,需要选择一个最佳的阈值。可以采用F-统计量[11]的方法获得最佳的l值,从而获得最好的股票分类。

                             

1,rij≥lrijl=

0,rij

设对应于

值的分类数是r;n=∑nj表示所有类的样本总数

j=1

(j)

i

r

之和;第j类的样本数为nj,y表示第j类中的第i个样本,其样

(j)(j)(j)

本记为y1,y2,,ynk。第j类聚类的中心向量为:

(j)

=(1,2,,k,,nj)           (6)

(j)

(j)(j)(j)(j)

其中:k=

=

n

1

j

∑x

i=1

nj

(j)ik,(k=1,2,,m),它表示第j类的样本均值。

1rj(j)

∑∑yij=1i=1                  (7)

作F统计量

F=

∑n

j=1

r

j

(j)

−/(r−1)

(j)2

∑∑

j=1i=1

yi(j)−           

(8)/(n−r)

其中:(j)

−=∑(k=1

(j)k

−k)2为(j)

与y()

−)

j类中的样本y()与中心的距离。

()

Yij=

Xij−j

j

(i=1,2,3n;j=1,2,3m)        (1)

1n

∑xij,Sj=i=1

1n

∑xij−−i=1

其中,j

=

(

j

)

2

再次采用极差变化,使标准差变换后的数据,在[0,1]的区间上。

Y−min{Y}Y′=(2)−              经过极差变换后有0≤Yij′≤1,并且消除了量纲的影响。(三)建立相似关系矩阵

把标准化后的相似矩阵的每一行看作各对象在指标集上的模

ij

ij

1≤i≤n

ij

1≤i≤n

ij

1≤i≤n

ij

二、实证分析:以湖南省上市股票为例

本文以湖南省上市公司为例,主要选取了涵盖不同的行业的股票共10只作为评价对象,从盈利能力:每股收益x1、净资产收益率x2、每股现金流量x3;成长能力:主营业务收入增长率x4、净利润增长率x5;和扩张能力:每股净资产x6三个大方面选取具有代表性的财务指标来评价股票的投资价值。

样本的选取上遵守同地域性即以湖南省上市股票为准,并取于2010年6月30前披露上半年业绩报表的10家上市公司组成样本集,本文的财务数据来源于方正证券公司。

根据(1)和(2)式将10家上市公司的财务指标标准化(见表1)。

表1 标准化指标数据

序号[1**********]

证券简称中联重科通程控股酒鬼酒熊猫烟花岳阳纸业湘潭电化步步高山河智能千金药业郴电国际

变量

y2y3y4y5y6

y7y8

y1

x1

1.00000.02640.04340.02290.0125

00.25850.35140.07360.0899

x2

1.00000.29920.32400.3576

00.06240.34400.54220.32380.2586

x3

x4

0.64910.39260.23630.32900.38750.31230.08851.0000

00.1533

x5

0.28290.22200.75810.05330.34311.00000.00080.5492

00.0899

x6

1.00000.05240.0831

00.51050.25300.66900.59290.17110.2957

0.92450.10550.11700.09920.07130.2188

00.65600.11221.0000

y9y10

根据标准化得到的数据,使用欧氏距离来建立相似关系矩阵

R,并且通过平方法经过3次闭包传递得到模糊等价矩阵R∗。

依次赋予不同的值,通过计算截矩阵的方法来获得不同的分类:

表2 动态聚类结果

激进型投资者可以选择;山河智能的各项财务指标较好,盈利能力和成长能力较强,对投资者具有较强的吸引性,稳健的投资者可以选择给股票进行长期投资;郴电国际的每股现金流最高,盈利能力强,但是净利润增长率和主营业务收入增长率都较低,风险较大,投资该股票需要谨慎;酒鬼酒和湘潭电化的净利润增长率是最高的,说明该类股票具有很强的盈利能力,具有较大的投资潜力;通程控股、熊猫烟花、步步高、千金药业这4只股票的每股现金流都是负值,净利润增长率和主营业务收入增长率都较低,并且每股净资产也较低,该类股票各项指标都不突出,目前不益投资。实证结果表明,分类结果使不同类型投资股票得以区分,有利于投资选择适合自己投资风格的股票。模糊聚类分析为投资者提供一种有效选取股票方法,并且模糊聚类分析能够区别出不同投资价值的股票。因此,模糊聚类分析为投资者投资提供了一种有效的参考。

三、结论与展望(一)结论

模糊聚类结果可为广大投资者特别是中小投资者提供理性的投资参考,降低盲目投资带来的风险。本文基于模糊数学理论,运用模糊聚类分析方法对股票投资进行实证分析。

通过实证分析得出:第一,运用模糊聚类分析可以对庞大的数据进行简化,使其计算更为简单,从大量的财务数据中挖掘出有价值的投资股票;第二,从实证结果看,模糊聚类分析得出的分类结果使不同类型的股票得以详细的分类,并且通过F统计量检验得出科学合理的分类类别,有利于不同类型的投资者选取适合自己投资风格的股票,最终取得满意的投资回报;第三,模糊聚类分析为投资者提供一种有效的投资选股方法,从而验证该方法的科学性,实用性。

(二)展望

本方法在处理不同类型属性的能力方面仍需要改进,但模糊聚类分析方法在证券投资分析中具有一定的可行性和实用性,为投资者进行证券投资提供有效工具。本文仅仅选取了湖南省上市公司的财务数据进行分类分析,可以选择不同区域或不同行业的数据进一步深入研究分析。

参考文献

[1]李敏,何理.聚类分析在证券投资基本分析中的应用[J].辽宁师范大学学报(自然科学版),2006,29(2):154-146.

[2]许宗燕.基于模糊综合评价方法的股票投资价值研究[J].天津工业大学学报,2008,27(2):81-84.

[3]陈洋洋,王炬香,张春香,赵丹丹.基于FAHP法的股票长期投资决策分析[J].山东大学学报(工学版),2010,40(2):133-137.

[4]鲍新中,肖明.基于粗糙集理论的证券投资决策[J].系统管理学报,2010,19(5):526-533.[5]谢季坚,刘承平.模糊数学方法及其应用[M].武汉:华中科技大学出版社,2005:106-107.[6]范九伦,吴成茂.模糊F统计量及其应用[J].西安邮电学院学报,2003,8(3):57-61.

由(8)式计算各个所对应的F-统计量的值,并且F统计量服从自由度为(r−1,n−r)的F分布(取)计算结果如表4:

表3 F-统计量确定最佳值

作者简介:

李星,湖南工业大学管理科学与工程研究所研究生。陈世平,湖南工业大学管理科学与工程研究所教授。牛文举,湖南工业大学管理科学与工程研究所研究生。董利歌,湖南工业大学管理科学与工程研究所研究生。

由表3可以看出,有4个F值大于F0.05,分别为=0.9150(6类),=0.9512(7类),=0.9595(8类),=0.9891(9类)。如果F>F(r−1,n−r),根据数理统计方差分析原理可以认定类与类之间的差异是显著的,这说明在的显著水平下分类是相对合理的。但F值越大,类与类之间的差异也越大,分类明显。所以我们选择=0.9150即分为6类是最为合理的。

通过实证分析,本文把选取湖南省上市的10只股票分为6类。中联重科是高盈利能力、高成长能力、高扩张能力的优质股票,投资风险小,故中联重科为10只股票中投资者的首选股票;岳阳纸业的净利润增长率较高,但是每股现金流为负值,净资产收益率最低,说明该股票成长能力较好,但是盈利能力较弱,

a


© 2024 实用范文网 | 联系我们: webmaster# 6400.net.cn