文档库 最新最全的文档下载
当前位置:文档库 › 多因子Alpha系列报告之(七)——大浪淘金,Alpha因子何处寻?(1)

多因子Alpha系列报告之(七)——大浪淘金,Alpha因子何处寻?(1)

大浪淘金,Alpha因子何处寻?

——2011年金融工程研讨会专题报告系列之二

罗军 金融工程 分析师 胡海涛 金融工程 分析师

电话:020-********-8655 电话:020-********-8406

eMail:lj33@https://www.wendangku.net/doc/9d8596851.html, eMail: hht@https://www.wendangku.net/doc/9d8596851.html,

Alpha的来源

现代金融理论认为,证券投资者所获得的收益分为两部分:来自市场的平均收益(即Beta收益)以及独立于市场的超额收益(即Alpha收益)。一般来说,来自市场的beta收益比较容易获得,只要通过调节投资组合中的现金和股票指数基金(或者股指期货)的比率便可实现,但是要获取超越市场的Alpha收益则非常困难,因此,beta是在茫茫股海中,通过跟随大势获取的平均收益,但“水可载舟,亦可覆舟”!而想要在滔滔浪沙中淘到金子则需要“真本领”!

建立多维度的Alpha因子度量指标

因子有效性的度量是本文研究的核心,我们认为一个有效的Alpha因子应该能够带来长期且稳定的Alpha收益,同时因子在各期的表现应该具备较好的持续性,即具备较低的波动性,另外,根据因子挑选出来的超低配组合是否具备较高的胜率也是我们考察的标准之一。本文将因子度量指标分为有效性指标和单调性指标,采用多个指标相结合的方式来考察各个因子的有效性。

备选Alpha因子共计69个,覆盖9大类

个股的Alpha收益由不同的Alpha因子驱动所产生,考虑到更多和更有效的因子往往能够有效增强模型信息捕获能力,为了有效捕捉个股Alpha收益,因此本文以“多维度+海选”的方式进行备选因子分类及挑选,首先根据经济逻辑和市场经验将因子分为9类,它们分别为:盈利因子、成长性因子、规模因子、估值因子、杠杆因子、流动性因子、波动因子、技术因子以及一致预期因子,在9类Alpha因子中,我们共选取了69个我们认为较有代表性的备选Alpha因子。

小盘子、低流通、薄利多销型股票备受市场青睐!

本节我们从2007 年 3 月至2011年6月共52个月期间,对69个备选因子进行回溯测试,并综合采取前面提到的几个度量标准来考察各个因子是否能够获得稳定和显著的alpha收益。统计结果发现,以1个月股价反转和14天RSI为代表的技术因子以及以流通市值为代表的规模因子与股价的IC最高,而估值因子则具有最高的IR,另外,流动性因子和波动性因子在优选个股方面也有不俗的表现。综合各个因子的结果,在样本期间,盘子小,股票短期流动性较差且属于薄利多销型的公司通常下个月的股价增长较大,另外,股价的反转以及RSI强弱指标均显示出较明显的反转效应!

.

目录索引

一、Alpha的来源 (5)

二、研究思路 (6)

(一)因子回报 (6)

(二)数据选择及预处理 (6)

(三)A LPHA因子度量指标 (7)

(四)挑选有效A LPHA因子 (7)

三、备选Alpha因子 (8)

四、回溯测试 (11)

(一)回溯方法 (11)

(二)A LPHA因子整体表现 (11)

(三)A LPHA因子整体表现分析 (21)

(四)部分有效A LPHA因子回溯表现 (22)

图表索引

图1:alpha 收益来源 (5)

图2:基于多因子的alpha策略框架图 (8)

图3:因子驱动alpha收益示意图 (8)

图4:alpha 因子覆盖情况 (9)

图5:Alpha因子回溯测试流程 (11)

图6:alpha 因子按IC排名 (14)

图7:alpha 因子按IR排名 (14)

图8:alpha 因子按胜率排名 (15)

图9:alpha 因子按收益排名 (15)

图10:alpha 因子按t检验概率排名 (16)

图11:销售净利率各月IC (23)

图12:销售净利率五档累积收益 (23)

图13:销售净利率超低配组合月收益率 (23)

图14:销售净利率组合滚动12月收益率 (23)

图15:经营活动产生的现金流量净额(同比)各月IC (24)

图16:经营活动产生的现金流量净额(同比)五档累积收益 (24)

图17:经营产生现金净额(同比)超低配组合月收益率 (24)

图18:经营产生现金净额(同比) 组合滚动12月收益率 (24)

图19:流通市值/总市值各月IC (25)

图20:流通市值/总市值五档累积收益 (25)

图21:流通市值/总市值超低配组合月收益率 (25)

图22:流通市值/总市值组合滚动12月收益率 (25)

图23:流通市值自然对数各月IC (26)

图24:流通市值自然对数五档累积收益 (26)

图25:流通市值自然对数超低配组合月收益率 (26)

图26:流通市值自然对数组合滚动12月收益率 (26)

图27:PB各月IC (27)

图28:PB五档累积收益 (27)

图29:PB超低配组合月收益率 (27)

图30:PB组合滚动12月收益率 (27)

图31:主营业务收入/总市值各月IC (28)

图32:主营业务收入/总市值五档累积收益 (28)

图33:主营业务收入/总市值流通市值自然对数超低配组合月收益率 (28)

图34:主营业务收入/总市值组合滚动12月收益率 (28)

图35 :相对PB各月IC (29)

图36:相对PB五档累积收益 (29)

图37:相对PB超低配组合月收益率 (29)

图38:相对PB组合滚动12月收益率 (29)

图39:相对SP各月IC (30)

图40:相对SP五档累积收益 (30)

图41:相对SP超低配组合月收益率 (30)

图42:相对SP组合滚动12月收益率 (30)

图43:最近3个月平均成交量各月IC (31)

图44:最近3个月平均成交量五档累积收益 (31)

图45:最近3个月平均成交量超低配组合月收益率 (31)

图46:最近3个月平均成交量组合滚动12月收益率 (31)

图47:总资产周转率各月IC (32)

图48:总资产周转率五档累积收益 (32)

图49:总资产周转率超低配组合月收益率 (32)

图50:总资产周转率组合滚动12月收益率 (32)

图51:换手率各月IC (33)

图52:换手率五档累积收益 (33)

图53:换手率超低配组合月收益率 (33)

图54:换手率组合滚动12月收益率 (33)

图55:成交金额/股价波动率各月IC (34)

图56:成交金额/股价波动率五档累积收益 (34)

图57:成交金额/股价波动率超低配组合月收益率 (34)

图58:成交金额/股价波动率组合滚动12月收益率 (34)

图59:hight/low各月IC (35)

图60:hight/low五档累积收益 (35)

图61:hight/low超低配组合月收益率 (35)

图62:hight/low组合滚动12月收益率 (35)

图63: 一个月股价动量/反转各月IC (36)

图64:一个月股价动量/反转五档累积收益 (36)

图65:一个月股价动量/反转超低配组合月收益率 (36)

图66:一个月股价动量/反转组合滚动12月收益率 (36)

图67:RSI14各月IC (37)

图68:RSI14 (37)

图69:RSI14超低配组合月收益率 (37)

图70:RSI14组合滚动12月收益率 (37)

图71:一致预测ESP环比各月IC (38)

图72:一致预测ESP环比五档累积收益 (38)

图73:一致预测ESP环比超低配组合月收益率 (38)

图74:一致预测ESP环比组合滚动12月收益率 (38)

表1:alpha因子分类 (9)

表2:备选因子表 (9)

表3:Alpha因子整体表现情况 (12)

表4:alpha因子分档表现情况(1/2) (16)

表5:alpha因子分档表现情况(2/2) (18)

表6:部分有效Alpha因子整体表现 (22)

表7:销售净利率 (23)

表8:经营活动产生的现金流量净额(同比) (24)

表9:流通市值/总市值 (25)

表10:流通市值自然对数 (26)

表11:PB (27)

表12:主营业务收入/总市值 (28)

表13:相对PB (29)

表14:相对SP (30)

表15:最近3个月平均成交量 (31)

表16:总资产周转率 (32)

表17:换手率 (33)

表18:成交金额/股价波动率 (34)

表19:hight/low (35)

表20:一个月股价动量/反转 (36)

表21:RSI14 (37)

表22:一致预测ESP环比 (38)

一、Alpha的来源

阿尔法(Alpha--α)是古希腊第一个字母,欧米伽则是最后一个,圣经中上帝曾说:“我既是阿尔法,也是欧米伽”,意为我既是创造者同时也是毁灭者,从此阿尔法便被赋予了“新生”的意思,而欧米伽则意味着“毁灭”。

金融领域中阿尔法的概念最早来自于二十世纪中期,由于当时约75%的股票型基金无法跑赢大盘指数。学术界将该现象归因于股票市场的有效性,即认为:“在一个有效的金融市场,任何寻找超额收益(alpha)的努力都是徒劳的,投资者只能获得基准收益率(beta)”。该理论催生了许多给投资者提供便宜贝塔的指数基金等产品。

现代金融理论则认为,证券投资者所获得的收益分为两部分:来自市场的平均收益(即Beta收益)以及独立于市场的超额收益(即alpha收益)。近年来,随着大牛市行情的消失以及结构性行情的到来,个股出现严重分化的现象屡出不穷,许多投资者渐渐把目光投向了个股的alpha收益,因此专门寻找alpha收益的alpha策略也开始兴起,相比传统的投资策略,阿尔法策略具有更强的主动性,投资者不再被动等待交易时机,而是通过主动选取具备Alpha正收益的股票,随时进场进行交易。由于阿尔法策略是一种中性策略,因此投资者在弱势和振荡行情中也能获得稳定收益,不需要判断大盘走势。

一般来说,来自市场的beta收益比较容易获得,只要通过调节投资组合中的现金和股票指数基金(或者股指期货)的比率便可实现,但是要获取超越市场的Alpha收益则非常困难,因此,beta是在茫茫股海中,通过跟随大势获取的平均收益,但“水可载舟,亦可覆舟”!而想要在滔滔浪沙中淘到金子则需要“真本领”!

图1:alpha 收益来源

资料来源:广发证券发展研究中心

Alpha收益的获取方式五花八门,但万变不离其宗,或是选取表现优于大盘的股票,或是把握合适的买卖时机,抑或是运用衍生品工具套取绝对收益。不同的Alpha策略中Alpha收益的来源各不相同,其所蕴含的风险也不一。本研究的目的便是发掘出驱动个股产生alpha收益的alpha因子,进而根据发掘出的有效alpha因子设计相应的选股策略,以寻找超越市场的股票超额收益!

二、研究思路

明确了本研究的目标——挖掘有效Alpha因子,接下来就是如何设计Alpha挖掘方法,考虑到市场所包含的数据相当庞大,各种选股因子也非常之多,因此,量化选股的一个大前提,就是要建立一个尽可能完备的数据库,基于这个数据库,从中挖掘历史以及当前市场中所包含的特征!

具体而言,我们分四个步骤来挖掘alpha因子,首先给出因子回报的定义:

(一)因子回报

因子回报的一个直观意义就是,运用股票的超额收益来度量因子的有效性及重要程度。目前主流的计算方法有两种:回归法以及排序法。其中回归法将因子的取值(风险暴露)与下期股票收益进行线性回归分析,并以回归得到的因子系数作为该因子的回报。本文采用的排序法则将股票按照其在单个因子上暴露值大小进行排序,并以超配排名靠前股票同时低配排名靠后股票的组合下一期平均收益作为因子回报,该方法目前已经得到了广泛使用。

(二)数据选择及预处理

标的股票:中证800成分股。中证800指数的成份股由中证500和沪深300成份股一起构成,综合反映了沪深证券市场内大中小市值公司的整体状况,我们认为其作为投资标的能够很好地代表沪深两市全部股票的运行情况。

样本期间:2007年3月30日-2011年6月30日共52个月。

基准指数:沪深300指数。

财务数据:本文所采用的财务数据来自wind数据库收录的上市公司年报和季报,考虑到上市公司最迟延后3个月才发布其财务数据,为了使得财务因子的横截面数据具备可比性,我们对模型中的财务因子数据按照如下方法进行时间对准:

上一年的10月底、11月底、12月底以及今年的1月底、2月底和3月底使用上一年的三季度的财务报表数据;

今年的4月底、5月底、6月底以及7月底使用上一年度的年报数据;

今年的8月底和9月底使用今年的半年报数据。

数据预处理:数据的预处理主要包含两部分,即去极值化以及标准化。

去极值化:本文采用“中位数去极植法”进行去极值化,公式如下:

D i,upper=D m+n×D MAD, if D i≥D m+n×D MAD

D i, lower =D m -n×D MAD, if D i≤D m+n×D MAD

其中D i为第i个描述性变量的观察值,D m为所有观察值的中位数,D m记作观测值与中位数的绝对偏离,即D i,AD=| D i - D m |,D MAD记作D i,AD的中位数,D i,upper和D i, lower分别表示中位数去极值化后描述性变量的上下限,n为用于控制D i,upper和D i, lower的常数,本文取n=3。考虑到不同的描述性变量由于其样本数据集中度不同,很难确定一个相同的常数n,因此本研究中我们对源数据重复进行两次去极值化处理,试验结果表明,该方法有利于获得各个因子序列的集中区间,从而避免出现数据失真。

标准化:由于各个描述性因子所衡量的单位不同,导致因子数值范围差异较大,因此在进行因子分析之前,必须对其进行标准化,本研究采用最常见N(0,1)正态标准化处理之,公式如下:

标准化后向量=(原向量-均值)/标准差

(三)Alpha因子度量指标

因子有效性的度量是本文研究的核心,我们认为一个有效的Alpha因子应该能够带来长期且稳定的Alpha收益,同时因子在各期的表现应该具备较好的持续性,即具备较低的波动性,另外,根据因子挑选出来的超低配组合是否具备较高的胜率也是我们考察的标准之一。

综上所述,本文采用多个指标相结合的方式来考察各个因子的有效性,指标可分为两类:有效性指标和单调性指标。

有效性指标:通过跟踪超低配组合的表现来考察因子的有效性,包含IC,IR,组合胜率、组合月收益率、组合滚动1年收益率以及组合收益t检验概率。

(1)因子IC(信息系数):即每个时点因子在各个股票的暴露值与各股票下个期回报的相关系数,本文认为如果一个因子的IC值高于2%(或低于-2%),则认为该因子在优选个股alpha收益上有较好的效果,IC为正表示该因子与股票的未来收益有正相关关系,应该超配因子暴露值高的股票,反之若IC为负则超配因子暴露值低的股票。

(2)因子IR(信息比):即因子在样本期间的平均年化收益与年化平均标准差的比值,IR的绝对值越高,表面该因子在优选个股alpha收益上效果越好,另外,经统计发现,IR的绝对值高于0.7时,Alpha因子的选股效果通常比较明显,另外,若IR为正,则代表应该超配因子暴露值高的股票,反之若IR为负,则应该超配因子暴露值低的股票。

(3)组合胜率:用于衡量Alpha因子是否在多数时间内有效。

(4)组合收益:包括因子月平均收益和因子滚动12个月累计收益,用于衡量因子Alpha是否具有稳定且可持续收益。

(5)t检验概率:用于衡量Alpha因子是否具有显著的因子回报,因子的t检验概率越小,说明该因子的选股效果越好,经统计发现,t检验的概率小于0.2时,相应的Alpha 因子具有较好的选股效果!

单调性指标:通过分析各档股票组合的表现是否具备显著的单调性,从而考察因子的有效性,包含各档累积收益率、各档相对基准累积收益率、各档平均年收益率以及各档相对基准平均年收益率。一般来说,IC和IR较高且为正时,各档组合的收益表现呈现单调递增的规律,IC和IR较高且为负时,各档组合的收益表现呈现单调递减的规律。

(四)挑选有效Alpha因子

如何根据Alpha因子在各个度量指标上的表现来挖掘有效的Alpha因子并在此基础上构造相应的Alpha策略,是下一步需要进行探讨的课题,本研究侧重于对有效选股因子的挖掘,而关于多因子Alpha策略将在同系列的其他报告里进行介绍。

综合考虑各个Alpha因子在各项度量指标上的表现,本研究进一步从各类Alpha因子中挑选出具有较强代表性以及选股效果最佳的Alpha因子。

图2:基于多因子的alpha策略框架图

资料来源:广发证券发展研究中心

三、备选Alpha因子

个股的Alpha收益由不同的Alpha因子驱动所产生,因此为了有效捕捉个股Alpha 收益,初始因子的选择必须考虑足够的维度,同时各个因子还需具备比较合理的经济学

意义,这是因子选股中最关键也是最难解决的一个问题。

图3:因子驱动alpha收益示意图

资料来源:广发证券发展研究中心

考虑到更多和更有效的因子往往能够有效增强模型信息捕获能力,因此本文以“多维度+海选”的方式进行备选因子分类及挑选,首先根据经济逻辑和市场经验将因子分为

9类,它们分别为:盈利因子、成长性因子、规模因子、估值因子、杠杆因子、流动性

因子、波动因子、技术因子以及一致预期因子,各类因子的覆盖情况及其意义描述如表

1所示:

图4: alpha 因子覆盖情况

表 1:alpha 因子分类

因子 数量 描述 盈利 12 企业自身盈利能力 成长 14 企业业绩成长性 规模 6 企业市值及股本规模大小

估值 10 企业内在价值 杠杆 4 企业负债及资产关系 流动 9 企业资产及股价流动性 股价波动 6 股价近期波动情况 技术 6 技术类指标

预测

2

分析师预测数据

数据来源:Wind ,广发证券发展研究中心 数据来源:Wind ,广发证券发展研究中心

在9类Alpha 因子中,我们共中选取了69个我们认为较有代表性的备选Alpha 因子,考虑到沪深两市中,金融行业股票所占市值比例较大,且金融类上市公司的盈利模式与其它行业有所区别,因此在运用运营类因子、现金流因子以及流动性因子进行选股时,我们都剔除了金融行业的股票。

表 2:备选因子表

编号 因子分类 初始因子 适用金融行业

1 销售净利 否

2 ROE(净资产收益率) 是

3 ROA(资产收益率)

是 4 毛利率 否 5 营业费用比例 否 6 净利润现金含量 否 7 财务费用比例(%) 是 8 销售净利率(同比) 否 9 ROE 净资产收益率(同比) 是 10 ROA 资产利润率(同比)

是 11 毛利率(同比) 否 12 盈利

营业费用比例(同比)

否 13 每股净资产增长 否 14 ROE(净资产收益率)增长率 是 15 主营业务收入增长率 否 16 每股收益(EPS)增长率

是 17 净利润增长率 是 18 总资产增长率 是 19 股东权益增长率 是 20

成长性 每股收益增长率(同比)

21 总资产增长率(同比) 是 22 每股净资产增长率(同比) 否 23 净资产收益率增长率(同比) 是 24 主营业务收入增长率(同比)

是 25 净利润增长率(同比) 是 26 经营活动产生的现金流量

净额(同比)

是 27 流通股本/总股本 是 28 流通市值/总市值

是 29 流通市值自然对数

是 30 流通股本 是 31 总资产自然对数 是 32 规模

股权集中度

是 33 PB 是 34 每股派息/股价 是 35 CFP:每股现金流/股价

否 36 PE

是 37 SP:主营业务收入/总市值

否 38 每股负债比(%)

是 39 相对PE 是 40 相对PB 是 41 相对SP 否 42 估值

相对CFP 否 43 负债/资产

是 44 长期负债比率(%) 是 45 固定比(%) 是 46 财务杠杆

流动负债率(%) 是 47 最近3个月平均成交量

是 48 总资产周转率 否 49 换手率(算术平均)

是 50 流动比率

否 51 速动比率 否 52 存货周转率 否 53 总资产周转率(同比) 否 54 存货周转率(同比) 否 55 流动性

速动比率(同比) 否 56 月收益率标准差(60个月) 是 57 月收益率标准差(24个月)

是 58 成交金额/股价波动率

是 59 hight/low 是 60 Beta(24个月) 是 61

波动性

两个月价格波动

62 一个月股价动量/反转 是 63 三个月股价动量/反转 是 64 六个月股价动量/反转

是 65 RSI14 是

66 RSI20 是 67 技术

RSI40 是 68 一致预测ESP 是 69

一致预期 一致预测ESP 环比

数据来源:Wind ,广发证券发展研究中心

四、回溯测试

本节我们将对各个Alpha 因子在样本期间内的市场表现进行回溯测试,并综合采取前面提到的几个度量标准来考察各个因子是否能够获得稳定和显著的alpha 收益。

从2007 年 3 月至2011年6月共52个月期间,对69个备选因子进行回溯测试,检验其过往的市场表现。

(一) 回溯方法

各个因子的回溯方法如下:

(1) 组合的更新频率为一个月,每个月末将中证800的成分股按照每个因子值大小进行排序,根据排序从小到大将股票组合平均分为5档;

(2)每个月末,以超配前20%(第5档)的股票,同时低配后20%(第1档)的股票作为下一个月的资产组合,同时跟踪五档的市场表现;

(3)以沪深 300 指数作为资产组合的基准指数。

图5:Alpha 因子回溯测试流程

资料来源:广发证券发展研究中心

(二)Alpha 因子整体表现

我们对各个因子及其对应的资产组合在2007年3月至2011年6月的市场表现进行

回溯测试,回溯期间,统计的指标主要包含各个因子的IC 、组合IR 、因子胜率、组合年化收益率以及各档的累积超额收益率等指标,各指标统计结果如下表。

表 3:Alpha 因子整体表现情况

因子分类

初始因子 IC IR 胜率 组合年化 收益率 T 检验 1 销售净利率(%) -2.95% -0.4744 38.46% -7.96% 0.3281 2 ROE(净资产收益率) -0.89% -0.131 46.15% -2.82% 0.7863 3 ROA(资产收益率)

-0.64% -0.0827 51.92% -1.53% 0.8641 4 毛利率 -0.37% 0.0213 46.15% 0.28% 0.9649 5 营业费用比例(%) 1.42% 0.4045 55.77% 5.58% 0.4037 6 净利润现金含量 0.72% 0.127 53.85% 0.78% 0.7926 7 财务费用比例(%) -0.50% -0.0796 48.08% -0.77% 0.8690 8 销售净利率(同比) -0.13% -0.0944 53.85% -0.99% 0.8449 9 ROE 净资产收益率(同比) -0.48% 0.0247 51.92% 0.27% 0.9591 10 ROA 资产利润率(同比)

-1.31% -0.3341 50.00% -3.36% 0.4899 11 毛利率(同比) -0.88% -0.6563 36.54% -4.50% 0.1779 12 盈利利率 营业费用比例(同比) -0.58% 0.2348 48.08% 1.38% 0.6272 13 每股净资产增长率(%) -1.10% -0.2374 44.23% -2.87% 0.6233 14 ROE(净资产收益率)增长率 -0.04% 0.0514 57.69% 0.45% 0.9152 15 主营业务收入增长率(%) -0.18% -0.0703 40.38% -0.72% 0.8843 16 每股收益(EPS)增长率(%)

-0.27% -0.1479 48.08% -1.55% 0.7594 17 净利润增长率(%) -0.38% -0.1465 55.77% -1.66% 0.7616 18 总资产增长率(%) -0.96% -0.0564 44.23% -0.76% 0.9070 19 股东权益增长率(%) -1.54% -0.2639 42.31% -4.07% 0.5851 20 每股收益增长率(同比) 0.16% -0.223 53.85% -1.24% 0.6444 21 总资产增长率(同比) 0.37% -0.002 53.85% -0.01% 0.9966 22 每股净资产增长率(同比) -0.05% -0.5466 42.31% -3.88% 0.2605 23 净资产收益率增长率(同比) 0.36% -0.4383 46.15% -2.10% 0.3658 24 主营业务收入增长率(同比) 0.10% -0.306 48.08% -1.92% 0.5270 25 净利润增长率(同比) 0.57% 0.025 57.69% 0.14% 0.9588 26 成长性 经营活动产生的现金流量净额

(同比) -0.71% 0.6029 51.92% 4.48% 0.2095 27 流通股本/总股本 1.81% 0.7567 65.38% 7.12% 0.1214 28 流通市值/总市值 2.15% 0.821 61.54% 8.93% 0.0935 29 流通市值自然对数

-5.43% -0.7514 36.54% -16.23% 0.1240 30 流通股本 -3.83% -0.6155 40.38%

-10.64% 0.2059 31 总资产自然对数 -3.79% -0.3598 44.23% -7.54% 0.4573 32

规模 股权集中度

-1.06%

-0.1494

46.15%

-2.43%

0.7571

相关文档