耀世娱乐

热线电话:
耀世娱乐
热门搜索:
你的位置: 耀世娱乐 > 产品展示 >

「广发金工」基于隔夜相关性的因子研究

产品展示 点击次数:156 发布日期:2025-12-05 15:17

(来源:广发金融工程研究)

研究背景:股票市场存在一定的隔夜相关性特征,日度收益可以拆解为隔夜收益和日间收益。结合近期学术成果,本报告从日间、隔夜等特征相关度出发,刻画相似股票的关联特征。

隔夜涨跌幅相关性研究思路:将多空信号和交易执行进行分离,通过信号与执行分离的机制,只捕捉跨股票的信息效应。基于夜收益和日间收益来构建相关性矩阵,然后划分领先群组(Leader)和滞后群组(Lagger),在此基础上构建交易策略,仅从领先群组生成信号,仅在滞后群组内交易。

实证研究:基于相关文献方案,潜在的问题在于股票之间的特征值差异相对较小,进一步尝试直接基于特征进行KMEANS聚类分析,并基于平均数值强度确认领先群组和滞后群组。测算显示,日度调仓下,A股的领先滞后效应呈现反转效应,即基于领先群组发出预期看多信号后,空头组合表现相对更加强势,发出看空信号则相反,且策略相对适用于中小盘股票。

因子研究:基于隔夜相关信息构建周度月度选股因子。直接构建领先滞后相关性因子,选股区分度不够突出。进一步引入常规相关性,即先筛选隔夜收益和日间收益相关性最高的股票群组,再计算常规相关性,该因子与常规方法计算的相关性因子内部相关性不高于60%,提供边际增量,其中corr_combined1的月度RANK_IC为8.13%,多头年化收益为18.2%,周度RANK_IC为6.59%,多头年化收益为22.1%。

相关性分析:因子内部相关性方面,隔夜日间和常规相关性因子的相关程度相对较低。与风格因子的相关程度方面,相关性因子与残差波动等风格呈现一定相似性。

风险提示:本专题报告所述模型用量化方法通过历史数据统计、建模和测算完成,所得结论与规律在市场政策、环境变化时可能存在失效风险;策略在市场结构及交易行为的改变时有可能存在策略失效风险;因量化模型不同,本报告提出的观点可能与其他量化模型结论存在差异。

一、研究背景

背景介绍

(一)羊群效应

传统金融市场理论通常假设市场上的每个投资者都是完全理性的,都能高效地获取并分析市场信息,并做出最优决策。然而,现实中的金融市场往往是非理性的,在A股市场上,个人投资者占比较高,卖空存在限制,股价异象繁生。

无论是国外还是国内,投资者的投资行为一直是学术界及实业界热门研究的领域之一。而投资者的羊群行为,在行为金融学领域,一直是其中研究的一个热点。羊群行为通常被定义为投资者对他人行为的模仿。Devenow and Welch (1996)提出造成这一现象的原因有三点。第一个原因来源于报酬的外部性,指一个行为带来的回报随着实施这一行为的人数增加而增加。例如,投资者倾向于同时交易,这样能为他们带来更好的流动性。第二个原因来自于声誉问题与委托代理理论。当一个基金经理人的业绩是相对于一个基准来评估时,例如,通过使用其他经理人的平均业绩或市场/行业指数的业绩评价该经理人的绩效,那么该经理人更加倾向于模仿这个基准的做法。虽然这样做会使得经理人丧失比平均水平表现的更好的潜力,但却能够防止由于相对表现较差而带来的损失。第三个原因是信息的外部性,指投资者通过观察其他投资人的行为来获取信息。这种外部性可能非常强,以至于投资者甚至会忽略自己的信息而依赖这种噪音信息。

羊群行为的存在对市场有效假说提出了挑战,市场有效假说认为所有投资者都是理性的,并且有着相同的信息集,因此可以形成一致的股价预期,市场上的股票价格能够真实的反映股票的内在价值。但是羊群行为的投资不一定是理性的。投资者不是通过对于公司的理性分析,而是通过观察和跟踪其他投资者的行为来进行投资,即不是所有的市场参与者都完全知情,因此羊群行为可能会使得股票价格偏离其基本面,从而影响股票的实际价值。

Tan, Chiang, Mason (2008)等人的研究表明羊群行为会增加市场波动性和套利机会。羊群行为可能还会影响股票的价格变动过程,根据Grinblatt (1995)和Wermers (1999)等人的研究结果,羊群行为有利于信息的快速传递,从而使得股价能够随着信息快速变化,有助于价格发现过程。通常认为,短期羊群效应会伴随着价格的反转,即当出现买入(卖出)羊群行为时,未来股价可能会下跌(上涨)。同时,买入(卖出)效应越强烈,未来价格下跌(上涨)的幅度越大,即未来价格变动和羊群行为的剧烈程度相关。

(二)关联度信息

传统的有效市场假说认为,在完全有效的金融市场上,价格能够及时、充分反映资产的所有公开信息以及私有信息。但是,Kalok等(2005)、刘菁哲(2010)等众多学者通过实证研究发现,股票市场中存在着“领先滞后效应”,即不同公司对相同基本面信息的反应速度存在差异,一些公司能够迅速对新信息做出反应,另一些公司对于新信息的反应存在时滞。

以行业关联信息为例,Cohen和Lou(2012)实证检验,面对影响全行业的信息事件,单一经营部门公司的股价能够更迅速的反映新信息,同时对于多经营部门公司未来股票收益存在显著预测能力。胡聪慧等(2015)采用A股上市公司数据验证了这一结论,并证实了集团公司股价变动的滞后性主要在于投资者关注度与处理能力有限性,以及行业估值的复杂性。向诚等(2018)实证说明了行业内受关注度最高的30%公司组合的收益率,显著引领受关注度最低30%公司组合的未来收益率。段丙蕾等(2022)认为行业关联回报率仅在月度层面显著,在周度层面不显著。同时,Parsons和Sabbatucci(2018)对于行业关联公司的收益预测能力的有效性提出质疑。他们认为,随着证券分析师覆盖率不断提升,股票价格的有效性增强;随着个股证券分析师重复率上升,股票价格反映的行业一致预期信息越多,因此基于行业关联构建的股票投资策略效果可能衰减。

综上所述,金融市场存在羊群效应,即股票之间存在一定领先滞后效应,通过挖掘股票之间的相似性信息,可以捕捉潜在的投资机会。过往相似性主题研究从行业、产业链、财务基本面等角度出发刻画相应特征,结合近期学术成果,本报告从日间、隔夜等特征相关度出发,刻画相似股票的关联特征。

二、隔夜涨跌幅相关性研究思路

(一)

基程

(一)基本研究思路

首先,日度收益可以拆解为隔夜收益和日间收益。

股票市场存在一定的隔夜相关性特征,即两个交易日之间的涨跌幅变动可以拆分为日间收益和隔夜收益两部分,Lou et al.(2019)的研究证明,美国市场中,单只股票维度,隔夜的上涨往往伴随着日间交易时间段的下跌,即隔夜收益和日间收益存在显著的负相关关系,而两者的负相关关系可能来源于噪音相关的套利行为。

上述过往研究停留于单一股票层级,而实际投资场景中,投资者的投资决策通常是构建一篮子的股票组合,因此套利等行为也可能在多个股票之间扩散。

因此,关于股票之间的隔夜收益关联特征研究,基于隔夜收益预测日间收益,核心是需要找到哪些股票具备领先或滞后关系,即找到领先群组的股票,计算其隔夜收益,基于隔夜收益预测滞后股票的日间收益表现。

其次,构建股票的相关性矩阵。

具体而言,是以隔夜收益和日间收益来构建相关性矩阵,以此来确定领先股票群组和滞后股票群组。该定义反映的是某只股票的隔夜收益是否能预测另一只股票的日间收益,以此形成有向加权矩阵,矩阵中元素的绝对值越大,表面影响程度越高,即具备相对明显的预测效果。而隔夜和日间的相关性构建,在矩阵中的数据具备不对称性,以此呈现出领先和滞后的结构特征。

然后,基于矩阵信息,划分群组。

具体而言,采取定向谱聚类算法 d-LE-SC(directed Likelihood Estimation Spectral Clustering),划分领先群组(Leader)和滞后群组(Lagger),即滞后群组受领先群组的影响。

在此基础上构建交易策略,仅从领先群组生成信号,仅在滞后群组内交易,若领先群组平均收益为正,则在滞后群组中做多“受领先群组正影响”的股票,做空“受领先群组负影响”的股票;反之方向相反。

关于算法 d-LE-SC,主要特点在于其方向性,目的是为了识别领先群组(Leader)和滞后群组(Lagger)。

传统谱聚类中,在无向网络(如相关矩阵)中,数值仅反映相似程度,没有方向性,若直接用普通谱聚类,只能识别出相关性较高的股票群组,而无法揭示领先滞后关系。

参考相关文献,衡量聚类好坏的标准,可以用两个指标刻画网络的方向性特征,净流量(NF)与总流量(TF)。

净流量Net Flow (NF):衡量两个群体之间的信息“单向性”。基于网络的邻接矩阵,若净流量大,说明一方对另一方具有明显的方向性影响;若净流量小,则信息流是双向均衡的,难以区分主次。换句话说,净流量衡量的是领先滞后的强度。

总流量Total Flow (TF):衡量两个群体之间的总体连接程度。若两个群体间的总流量太小,意味着它们之间几乎没有联系,聚类结构不显著;若总流量很大,但净流量很小,则表明双方互动频繁但无明确方向。

目标函数:联合刻画方向性与连通性算法,希望在聚类结果中同时获得强方向性(净流量大)和连通性(总流量适中且显著)。通过最大化该似然函数,算法在“方向性”和“连通性”之间找到平衡。

使用谱松弛(spectral relaxation)方法优化上述离散目标函数,即将邻接矩阵转换为归一化的有向拉普拉斯矩阵,计算其主特征向量,作为节点的潜在嵌入表示,再用k-means对节点嵌入向量聚类,得到最终的领先群组和滞后群组。

(二)投资组合构建流程

总体框架方面,将多空信号和交易执行进行分离。传统反转或动量策略往往依赖单只股票的自身收益序列,而该策略的创新点在于通过信号与执行分离的机制,只捕捉跨股票的信息效应。

第一步,构建相关性矩阵。在每个交易日,基于回溯N个交易日滚动窗口计算出相关性矩阵,由于矩阵既包含方向又包含正负值,首先对矩阵取绝对值,此矩阵代表领先关系的强度,用作网络的邻接矩阵。

第二步,识别领先群组和滞后群组,确定主导簇。

第三步,提取交易信号。从领先群组提取信号。计算每只股票的平均影响得分,选取得分最高的前50%股票形成子集 ,计算其平均收益,表示市场在该日的方向性信号。若信号为正,则暗示滞后群组在日间上涨,若为负,则相反。

第四步,计算滞后群组中每只股票的受影响程度,根据该得分进行排序:若第三步的信号为正,则做多滞后群组前20%,做空后20%;若信号为负,则方向相反。

三、实证研究

(一)群组识别

相关文献中,主要是针对美股头部10%的股票做相应的研究。本报告中,针对A股,分别尝试在沪深300、中证1000和全市场所有股票中进行尝试测算。

基于参考文献测算方式,潜在的问题在于股票之间的特征值差异相对较小,且受随机种子影响较明显,因此群组区分效果不够理想。如沪深300成分股内作群组区分,会出现某一群组股票不足5只的情况。可能的原因在于,一方面,中美的股市特征存在一定的差异,另一方面,如沪深300成分股的股票,内部相关性相对比较高。

因此,对滞后群组和领先群组的划分,我们进一步尝试基于领先和滞后的相关性矩阵特征,进行群组分类。测算结果显示,该方法下,群组分类结果相对稳定。

(二)组合回测

区分群组之后,基于平均信息流强度,确认主导簇和受影响簇,即领先群组和滞后群组。参考相关文献方法,在领先群组中,选取得分最高的前50%股票形成子集 ,计算其平均收益,表示市场在该日的方向性信号,以此决定滞后群组的多空配置方向。

关于滞后群组多空组合的构建,尝试两种持仓周期。一种是次日开盘,收盘卖出,即只考虑日间收益部分;另一种是次日开盘买入,后一日开盘卖出并买入新的股票,以此对比两种方案的收益差异。另外,引入理想情况下,当日收盘买入,次日收盘调仓的情况以作对比。

全市场股票方面,在滞后群组内,根据信号筛选前20%和后20%构建多空组合,测算结果显示,和文献于美国市场的测算结果不完全一致。

一方面,A股的领先滞后效应呈现反转效应,即基于领先群组发出预期看多信号后,空头组合表现相对更加强势,发出看空信号则相反。

另一方面,多头组和空头组的区分度相对明显,即在回溯期内,采取统一次日开盘调仓的方案,多空收益能实现约8.81%的年化收益,但多头组和空头组的表现会受到市场波动影响。

若只考虑日间收益,则多头组和空头组的收益区分度相对不够明显,但只保留日间收益,多头组和空头组的净值表现更加突出,说明市场的上涨更多来源于日间,而非隔夜。

若考虑理想情况下的收盘调仓,则特征和次日开盘调仓的特征基本一致。

筛选股票池,只保留中证1000成分股后,总体特征和全市场股票的特征基本一致,多空组合(空头组-多头组)在回测区间内能实现约10.51%的年化收益。而在沪深300成分股中,多空组合的区分度相对不够突出,说明该策略相对适用于中小盘股票。

四、因子构建研究

(一)数据说明

前一章的研究,采取的是日度调仓的方案,实际投资场景中可能更偏好采取周频或者月频的方案,进一步测算相对月度和周度换仓频率下的组合表现,即上述研究同样可以作为选股因子应用于投资组合中。过往研究,我们从行业、产业链、财务基本面等角度出发刻画相应特征构建选股因子,本篇报告进一步基于隔夜相关信息,构建选股因子,观察隔夜信息在因子端的效果。

关于因子的回测,总体采取如下的回测框架。

选股范围:全市场;

股票预处理:剔除非上市、摘牌、ST/*ST、涨跌停板、上市未满1年股票;

因子预处理:MAD去极值、Z-Score标准化;

分档方式:根据当期股票的因子值,从小到大分为十档 ;

调仓周期:滚动每月/周的最后一个交易日的次日均价;

交易费用:千分之三(卖出时收取)。

(二)因子构建及组合回测

参照上一章的思路,构建因子,同时引入领先群组作为选股池(滞后组作为信号)以作对比。测算结果显示,无论是多头组还是多空组的表现,在月频和周频换仓维度下,均没有明显的区分度特征。

进一步尝试对因子进行改进调整。

一方面,过往的因子方向信号,仅基于1个交易日的涨跌幅,调整为基于滚动5个交易日、21个交易日,即基于过去1个月或者1周的涨跌幅确认信号的多空方向。

另一方面,参考过往研究成果,基于相关性靠前的50只股票作因子构建,并引入常规相关性因子,观察收益差异特征。

测算结果显示,基于滚动5个交易日、21个交易日调整因子方向后,未出现明显变化。相对而言,将相关性从日间隔夜相关性调整为普通相关性后,因子IC提升明显,说明隔夜相关性对于股票在周频月频的预测效果不够理想,常规的日度涨跌幅相关性更加适用。

在上述测算结果的基础之上,进一步衍生至全市场股票维度,检验相关因子的选股效果。

1.基于隔夜日间相关性,不区分领先和滞后群组,以所有其他股票的隔夜收益和该股票的日间收益相关性均值作为因子,分别尝试回溯21个交易日和60个交易日。

2.基于隔夜日间相关性,不区分领先和滞后群组,筛选相关性最高的前50只股票、后50只股票的隔夜收益和该股票的日间收益相关性均值作为因子,以及将两者相减作为因子。

3. 基于隔夜日间相关性,不区分领先和滞后群组,基于相关性绝对值,重复“2”中的思路。

测算结果显示,调整为全市场股票池后,隔夜相关性有边际提升,如corr_lag_21因子和corr_lag_60因子在周度的多空收益等方面提升较明显,但总体显著性低于常规相关性因子的计算结果。

进一步测算常规相关性的因子效果。

一方面,参考前述的方案,基于常规相关性,不区分领先和滞后群组,筛选相关性最高的前50只股票、后50只股票的相关性均值作为因子,以及将两者相减作为因子。

另一方面,筛选隔夜收益和该股票的日间收益相关性最高的前50只股票、后50只股票的常规相关性均值作为因子,即将两者进行结合。

测算结果显示,常规相关性在周度和月度换仓频率下的区分度相对明显,其中factor_top50_allday的月度RANK_IC为8.11%,多头年化收益为18.3%,周度RANK_IC为6.57%,多头年化收益为22.4%。

另外,基于领先滞后关系筛选相关股票群组,领先滞后相关性数值最小的50只股票,基于常规性构建因子,即factor_small50_corr_by_lag,仍旧具备一定的预测效果。

(三)相关性检验

进一步测算相对显著因子的内部相关性情况。

测算显示,隔夜日间和常规相关性因子的相关程度相对较低。常规相关性因子方面,内部总体相关程度高于和隔夜日间数据计算的因子的相关程度,而基于领先隔夜日间数据筛选股票群组,和直接基于常规数据计算股票群组结果来看,因子值内部相关性不高于60%,说明能带来边际的增量。

(四)部分因子信息详情

将相关性较低的factor_small50_corr_by_lag和factor_top50_allday等权加权,进一步观察因子的具体表现。corr_combined1的月度RANK_IC为8.13%,多头年化收益为18.2%,周度RANK_IC为6.59%,多头年化收益为22.1%。

1. 月度换仓

2. 周度换仓

3. 相关性分析

与风格因子的相关性方面,相关性因子与残差波动等风格等风格呈现一定相关性。

五、风险提示

(1)本专题报告所述模型用量化方法通过历史数据统计、建模和测算完成,所得结论与规律在市场政策、环境变化时可能存在失效风险;(2)本专题策略模型在市场结构及交易行为改变时有可能存在策略失效风险。(3)因量化模型不同,本报告提出的观点可能与其他量化模型结论存在差异。

产品展示