1. 引言
华尔街有这么一句家喻户晓的谚语:不要依靠金融股票分析师的投资评级来买卖股票,但是也不要抛弃它们。股票投资评级中常常包含着许多重要的信息,而投资评级信息的准确性,即其可信度需要第三方给出客观地评判[1] 。
股票市场是信息高度密集型的虚拟市场,股价的涨落对于信息的波动是十分灵敏的,而作为向投资者提供上市公司信息的群体,股票分析师在股票市场中扮演着重要的角色。在美国,金融市场发展日趋成熟,分析师群体对股票市场有很大的影响力。随着中国证券股票市场的发展和成熟,越来越多的投资者(特别是机构投资者)已经开始积极关注并利用分析师的投资报告。但是,许多投资者在获得投资评级数据后,常常因为不能正确利用这些数据,反而会对投资造成不利影响。分析师的投资评级都是相对于一定的时间段给出的,有一个月、三个月、六个月和十二个月,不同投资风格的投资者选择的持股时间是不相同的。即便是在金融市场最发达的欧美,评级为买入的股票也并不一定就比评级为卖出的股票的后续市场表现得更好[2] 。
评估这些投资评级报告与市场实际走向吻合的程度是本文的研究目标。本文通过随机选取中国证券市场30支股票,就其2012年12月25日至2013年12月25日间一个月、三个月、六个月、十二个月的投资评级报告和股票价格数据来对股票收益率和投资评级间的关系进行统计规律的研究,基于这些实证数据分析,判断金融股票分析师的投资评级建议是否有投资价值。
2. 数据准备[3]
本研究的数据准备工作主要包括以下步骤:
步骤一:样本选择
随机选择了中国证券市场中共计30家上市公司的股票,每一家上市公司建立一个独立的报告库,收录相关的股票价格数据和投资评级报告,时间从2012年12月25日至2013年12月25日。
步骤二:标准化
对每份报告设置以下五个要素来描述:报告来源、报告日期、股票名称、股票价格、投资评级。
步骤三:数据量化
每份股票评级报告中的分析师的不同统计时段(一个月内、三个月内、六个月内、十二个月内)的评级有五个等级“买入”、“增持”、“中性”、“减持”、“卖出”分别对应给予赋值“−2”、“−1”、“0”、“1”、“2”。这样量化可以清晰地表明股票投资评级等级间的差别,便于理解。
步骤四:整合数据
数据量化完成后,得到量化后的投资评级报告。对同一支股票,收集如下数据:(1) 评级分,计算不同统计时段投资评级的平均得分;(2) 股票价格数据,计算固定时段的收益率。
步骤五:指标化[4]
不同股票、不同统计时段的投资评级的平均得分记作,
不同股票、不同统计时段的股票收益率记作,记平移后的股票收益率为,,
不同股票、不同时段所对应的前一期的股票收益率记作。
其中,。
3. box-cox变换[5]
通常,在普通的回归模型中,往往使用如下的线性模型:
(1)
给定观测得到的试验数据集,如果用上面的模型(1)来进行拟合,那么就要求给定的数据满足下列条件:
(a) 线性相依性,即对(1)式两端同时取期望,得到;
(b) 等方差性,即要求误差项的各分量是等方差且相互独立;
(c) 正态性,要求误差项。
但是在处理实际问题时,对观测得到的试验数据集经过回归诊断后得知,某些数据不满足gauss-markov条件,需要对数据采取“治疗”措施,即通过检验发现,观测获取的某些数据不完全满足上述线性相依性、等方差性和正态性的条件。实践证明,数据变换是处理有问题数据的一种好方法。出于有效的提高回归精度的目的,可以采取一种常用的数据变换的工具:经典的box-cox变换。该变换的主要特点是引入一个新的参数,通过数据本身估计出参数,继而确定应该采取的数据变换形式。实践证明,box-cox变换对许多实际数据都是行之有效的:对因变量的数据变换能显著地改善数据的正态性、方差齐性以及对称性;同样,对自变量的数据变换能够改善模型的结构,使拟合效果变好。
定义1:设,,,变换
(2)
此处的为一个待定变换参数。称式(2)为的box-cox变换(也称幂变换)。
box-cox变换是一族变换,包括很多常见的变换,譬如对数变换,倒数变换和平方根变换。
通过因变量的box-cox变换后,满足下面的线性模型:
(3)
其中为变换参数,且,box-cox变换的主要目的是找出合适的数据变换参数的估计。由于,因此可以用极大似然的方法来确定。继而使模型(3)的回归拟合效果变得更好。
注意(2)式中的box-cox变换仅适用于正值变量,对于变量可以取负值的情况,往往使用带有平移参数的变换取代(2),即给变量加上平移参数,使得,此时(2)式变为
(4)
平移参数使得任意地,,即要求。
以上是仅对因变量进行box-cox变换,有时也称为单边变换。有时基于实际问题的数据及回归拟合效果的考虑,也可对自变量进行box-cox变换,即
(5)
此时,模型(3)变为双边box-cox变换的广义线性模型
(6)
双边参数、的估计方法与单边变换的估计方法一致。
4. f统计量[6]
在本文的检验评判标准中,将使用一个重要的回归统计量来衡量模型的优良性,即f统计量。
f统计量函数
(7)
其中:
:表示回归平方和;
:表示的校正平方和,且;
:表示回归残差平方和。
在线性回归模型(1)中,按照一般的显著性检验的步骤,在事先给定的显著性水平下,当时,就认为和之间确实存在线性关系[7] 。
f统计量函数是回归分析的重要指标,在实际的回归模型中,较大的值,表明线性回归模型拟合的效果较好。所以,在本文的模型选择中,一个重要的依据就是使回归模型的统计量函数达到极大值的作为因变量的box-cox变换中的数据变换参数。从根本上来讲,本文中模型的选择相当于解最优化问题:
得出。
5. 实证分析
选用不同时段对应的前一期股票收益率和投资评级的平均得分一同来对加上平移参数后的当期股票收益率做二元线性回归。模型如下:
.
对于不同统计时段,判断模型的可行性,回归系数、的显著性,特别是投资评级变量的系数的显著性。为方便说明,记为系数的值,为系数的值。
不同时段的回归结果如下:
1) 当统计时段为一个月,即时,
通过对上述模型回归系数的显著性及置信区间分析可以得到:,,则回归系数显著,从而表明一个月内,收益率与前一个月的收益率存在线性关系,并且两者间正相关;而,,则回归系数不显著,从而表明一个月内,收益率与投资评级变量之间没有线性关系。
2) 当统计时段为三个月,即时,
通过对上述模型回归系数的显著性及置信区间分析可以得到:,,则回归系数显著,从而表明三个月内,收益率与前三个月的收益率间存在线性关系,并且两者间正相关;而,,则回归系数不显著,从而表明三个月内,收益率与投资评级变量之间没有线性关系。
3) 当统计时段为六个月,即时,
通过对上述模型回归系数的显著性及置信区间分析可以得到:,,则回归系数显著,从而表明六个月内,收益率与前六个月的收益率间存在线性关系,并且两者间正相关;而,,则回归系数不显著,从而表明六个月内,收益率与投资评级变量之间没有线性关系[8] 。
4) 当统计时段为十二个月,即时,
(8)
由拟合结果知,,超出了通常可接受错误的边界水平,回归结果的可信程度减弱。并且通过对上述模型回归系数的显著性及置信区间分析可以得到:,,则回归系数不显著,从而表明十二个月内,收益率与前十二个月的收益率间没有线性相关关系;同样地,,则回归系数也不显著,从而表明十二个月内,收益率与投资评级变量之间也没有线性关系。
对于统计时段为十二个月,即时,上述模型(8)的可信程度较弱,需要找寻更较为恰当的模型。下面对(8)中因变量进行单边box-cox变换得到,其中变换参数,此时当统计时段为十二个月,即时,
(9)
此处的是通过matlab编程,极大化得到的。通过比较模型(8)、(9)的回归结果发现,对因变量收益率进行box-cox变换后,模型的各项评判指标的优良性均有提高,特别是,判定回归结果可信度高,具有真实的显著性和统计学意义[9] 。
通过对上述模型(9)中回归系数的显著性及置信区间分析得到:,,则回归系数显著,从而表明十二个月内,box-cox变换后的收益率与前十二个月的收益率之间存在线性关系,并且两者之间呈负相关关系;而,,则回归系数不显著,从而表明十二个月内,box-cox变换后的收益率与投资评级变量之间没有线性关系。
模型(8),box-cox变换前,不能确定十二个月内的收益率与前一期收益率之间是否存在线性关系,而在模型(9)中,box-cox变换后,建模确定两者之间存在负相关的线性关系。由此可知看出,box-cox变换对于建模寻找变量之间的相关关系,是一种可以尝试的有用途径。
6. 结论
基于本文中随机选取的30支股票2012年12月25日至2013年12月25日的实证分析结果表明,股票收益率与前一期收益率之间存在相关性,而分析师的投资评级与股票收益率的后续表现无关。基于此[10] ,投资者在作出投资决策时,不应该受分析师投资评级的干扰,应该根据股票市场可以得到的数据分析前期的股票收益率表现,作出合理的决策。短期中,一个月、三个月、六个月内,股票收益率与其相应的前期收益率之间都存在正相关关系,并且根据回归系数的区间估计得,统计时段为六个月时,股票收益率与前六个月的收益率之间的正相关性最强,投资者可以选择股票市场中短期收益率表现良好的股票进行投资或选取最优的投资组合;而长期中,十二个月内,股票收益率与其相应的前期收益率之间呈现负相关关系,表明股票的涨势一般不会持续太长时间,去年的明星股,一般不是今年的明星,投资者应更加关注短期内的明星股,继而作出优化、合理的投资决策。
notes
1随机选取的30支股票取自大智慧365软件,其代码为:600000、600004、600016、600028、600029、600031、600036、600048、600050、600060、600064、600071、600085、600104、600109、600111、600119、600127、600130、600150、600159、600162、600176、600183、600192、600198、600221、600261、600345、600401。
参考文献