(来源:市场投研资讯)
本文来自方正证券研究所于2024年3月13日发布的报告《股票舆情热度的反转效应与“热点反应”因子构建—多因子选股系列研究之二十二》,欲了解具体内容,请阅读报告原文,分析师:曹春晓 S1220522030005。
“凸显效应”因子样本外表现
“凸显效应”因子在发布后表现符合预期,但在2024年9月市场反弹以来,该因子的IC呈现横盘态势,表明其在该阶段内阶段性失效。我们认为,失效的原因主要源于市场微观交易结构的变化。在此期间,市场热度较高的股票动量效应更为持久,导致短期内高热度股票仍能维持超额收益,削弱了因子的有效性。
“热点漂移”因子
我们根据股票热度平稳变化,构建了“热点漂移”因子,该因子刻画了投资者对于股票舆情的热度变化。“热点漂移”因子在回测时间段因子周度IC为3.7%,年化ICIR为5.53,IC周胜率达到78%,因子多空年化收益率达到27.3%,信息比率3.74%。
“热点反转”因子
我们尝试识别情绪剧烈变化的关键时间段,并计算相关时间段涨跌幅构建“热点反转”因子,该因子的周频均值IC为4.54%,年化ICIR达到6.14,IC周胜率高达80.99%,多空年化收益率达到19.1%,显示出较强的稳健性和可交易性。
“热点反应”因子
我们结合“热点漂移”与“热点反转”因子进行等权合成,构成“热点反应”因子。“热点反应”因子的周度IC均值5.08%,年化ICIR 7.34,周胜率85.21%,多空年化收益20.05%,信息比率(IR) 2.9,表现稳健。在与常见风格因子的相关性上,该因子与残差波动率的相关性为0.27,其余风格因子相关性均在0.1左右或以下。
1 前言
长久以来,如何从新闻数据和热度数据中提取有效信息,甚至可以借助日益强大且推理成本不断下降的大模型来构建量化策略,成为量化从业者关注的焦点。尽管市场对新闻舆情的关注度日益提高,但如何系统性地量化市场注意力效应并将其转化为可交易信号仍然存在诸多挑战。
在我们此前的研究《新闻中的有限注意力和"凸显效应"因子构建》中,团队尝试利用大模型对每天数以万计的新闻文本进行逐条打分,期望从中挖掘出有效的投资信号。然而,最终策略效果未达预期,我们总结出以下几个关键原因:
新闻数据的信噪比较低——大量噪音信息充斥其中,使得真正有价值的信息往往被淹没,难以稳定提取可交易信号;多头端的有效信息是否会以新闻形式出现?——即便某些关键信息能够通过新闻传播,市场可能会快速定价,使得这些信息难以转化为可持续的交易策略。尤其是在非事件驱动策略中,单从新闻文本难以判断市场是否已经消化相关信息。于是我们在之前研究中借助同花顺的高频股票热度数据,构建相关策略。这样的构建方式能够帮助我们避免处理繁琐复杂的新闻文本数据,直接获得结构化数据,且该数据能够足够高频,便于我们结合高频交易信息。
本研究在之前研究基础上,复盘“凸显效应”因子发布后表现,且进一步去研究股票热度变化、以及股票热度剧烈变化时间点的交易信息,构建相关策略。
2 新闻舆情热度alpha来源
随着大模型泛化推理能力的持续提升,非结构化数据向结构化特征因子的转化效率显著提高,为因子挖掘提供了新维度。根据本团队前期研究《新闻中的有限注意力和"凸显效应"因子构建》的实证结论,新闻舆情热度指标(包括新闻数量、传播热度等)呈现显著负向alpha特征,其收益主要源于空头组合的预测能力,而多头端贡献度存在统计显著的非对称性。通过观察同花顺股票热度数据中最高和最低的明细,可更深入了解该指标的内在逻辑。
从图表1的热度榜可以看出,同花顺公司提供的股票热度数据存在映射逻辑的瑕疵。例如,"机器人"概念自2023年6月起持续占据热度榜首,我们推测这一异常主要源于行业主题新闻量的脉冲式增长与投资者搜索行为的共振,但相关上市公司主体实际并无匹配的舆情事件驱动。这种关键词聚合算法与实体企业映射失准的现象,在能源产业链(如农业光伏)和战略新兴产业等板块同样存在数据噪声。
结合图表1和图表 2可以发现,热度高(空头组)股票的收益来源可能与大市值股票的beta有较强关联,因为大公司更容易吸引投资者的关注和搜索;而热度低(多头组)股票的超额收益来源则可能与小市值特征密切相关。
2.1“凸显效应”因子样本外表现
在本次研究中,我们重点回顾此前提出的“凸显效应”因子(详见《新闻中的有限注意力和“凸显效应”因子构建》),并对其样本外表现进行评估和回溯分析。我们将考察该因子在不同市场环境下的稳健性,包括其收益特征、IC表现以及在极端行情中的有效性。同时,结合市场结构变化,我们进一步分析因子收益的驱动因素。
自2024年9月市场反弹以来,该因子的IC呈现横盘态势,表明因子在该阶段内阶段性失效。
如图表5所示,因子失效的主要原因在于空头组合的超额收益显著收缩,同时市场对新闻舆情热度较高的个股表现出较强的偏好,使其获得显著的正向超额收益,
这一现象与市场整体风格变迁相一致。此外,在2024年小盘股大幅回撤期间,因子多头组合的回撤幅度相对可控,未因小盘股的大幅下挫导致多头收益大幅回撤,表明该因子在极端市场环境下具备一定的稳健性。
2.2 “热点漂移”因子
在上一节中,我们回顾了“凸显效应”因子在过去一年的样本外表现,并分析了其在极端市场环境下的有效性。“凸显效应”因子主要关注股票舆情热度的绝对水平,而在本节中,我们进一步关注舆情热度的动态变化对股票表现的影响。基于此,我们提出一个新的因子,该因子的计算方法如下:
首先计算每日股票舆情热度变化的绝对值变化,然后以周度为单位计算该变化的平均值,并归一化处理(即除以标准差)。该因子旨在衡量股票舆情热度变化的幅度与波动性,进而捕捉市场情绪的动态效应,我们称为“热点漂移”因子。
“热点漂移”因子在回测时间段因子周度IC为3.7%,年化ICIR为5.53,IC周胜率达到78%,因子多空年化收益率达到27.3%,信息比率3.74%。
该因子基于类似“凸显效应”的逻辑,其核心机制在于投资者注意力的波动导致股票的过度定价。当个股舆情热度异常上升时,通常意味着市场多头情绪积聚,且与动量效应相关,可能引发短期内的过度上涨;相反,当股票舆情热度急剧下降时,通常表明市场关注度减弱,这为资金收集筹码提供了机会,此时股价可能进入低估状态,后市往往呈现反转回升的潜力。因此,该因子通过监测舆情热度的波动,能够有效捕捉市场中的非理性定价效应,进而提供显著的投资信号。
我们重点考察该因子在极端市场环境下的表现。自2024年9月市场反弹以来,该因子的IC呈现横盘态势,表明其在该阶段内出现阶段性失效。
然而,该因子的表现与“凸显效应”因子存在显著差异。例如,该因子的空头端(即新闻热度上升较多的股票)在此期间仍保持较好表现,且多头端并未出现明显回撤
;但在市场情绪较强的时间段,该因子多头未能提供显著的正向超额收益。
从图表12我们看到该因子与常见风格因子的相关性,“热点漂移”因子与市值、波动率及流动性存在一定程度的线性相关性,但整体相关性较低,均维持在10%左右。整体上“热点漂移”因子具有一定的alpha属性,能为原始因子组合提供一定信息增益。
根据图表13,不同行业的IC表现显示,“热点漂移”因子在商贸零售、纺织服饰、传媒、房地产等行业的IC较高。这表明,在这些行业中,个股新闻热度的上升通常伴随负向超额收益,而热度下降的股票在后续阶段往往表现更佳。该现象可能反映出市场对这些行业的情绪波动较大,投资者的注意力变化对股价影响较为显著,从而提供了可供捕捉的交易信号。
根据图表14我们可以看到“热点漂移”因子在沪深300指数里几乎无效,而在中证500、中证1000里还保持着良好的表现。
进一步剥离常见风格因子后,我们分析了“热点漂移”因子的纯因子表现(图表15至图表18)。结果显示,该因子的多头端收益并未出现显著衰减,且整体多空收益在样本内保持较高的稳定性。具体来看,该因子的周度IC均值达到1.72%,年化ICIR为4.7,多空组合的年化收益率为12.9%,验证了因子在剥离风格效应后的稳健性和可交易性。
通过图表19-20,我们分析了个股热度水平及热度变化的十分组表现。在回测区间内,我们观察到股票热度越高,其未来收益越低的现象,表明市场可能存在对高热度股票的过度定价。然而,该效应在2024年9月后出现波动,热度高和热度低的股票均能获得显著超额收益。这一变化可能归因于市场情绪高涨时期,热度较高的股票动量效应更为持久,使得短期内高热度股票仍能维持超额收益。
从股票热度变化的角度来看,回测区间内,该指标整体呈现负向 Alpha,表明市场通常对热度迅速上升的股票存在短期过度反应,导致未来收益受损。然而,自 2024 年 9 月以来,该逻辑同样受到挑战。在热度较高的股票中,我们观察到热度保持稳定或持续上升的股票,未来能够获得显著超额收益。这可能反映出在市场情绪较强的环境下,投资者的注意力溢出效应增强,高热度股票的正向趋势更易被强化,进而支撑其超额收益表现
2. 3 热度异常变化蕴含的交易信息与“热点反转”因子
在上一节中,我们构建了衡量热度平稳变化的因子。本节进一步结合交易信息,研究市场情绪剧烈波动时的交易特征。我们认为,并非所有热度变化的时点都蕴含有效信息,舆情热度的剧烈时刻可能包含更多信息量。因此,我们首先
识别情绪剧烈变化
的关键时间段,即市场关注度与投资者情绪发生显著变动的时间段。随后,围绕这些时间段深入分析个股交易数据,评估市场对情绪冲击的反应,并提取潜在的交易信号,从而优化因子的有效性。
在图表21中,我们选取了某只股票过去7天(包含5个交易日)的热度变化趋势。我们观察到,市场情绪的剧烈变化往往集中在特定时间段,因此需要精准识别这些关键时点。为此,我们首先计算每15分钟的热度变化值,并进一步计算这些变化的均值与标准差。随后,我们以超过特定阈值的热度变化作为判定标准,将超出上下界限的部分定义为热度剧烈变化时间段。在具体阈值的设定上,我们测试了不同参数下的触发频率。若采用±2倍均值标准差作为边界,发现触发频率过高,可能导致噪声干扰。因此,本研究最终选择±5倍均值标准差作为判定标准,以确保所识别的时间段更具信息含量。
我们把热度异常变化分成4个场景,热度异常上升时股价下跌、热度异常下跌时股价上涨、热度异常上涨时股价上涨、热度下跌时股价下跌四个场景,分别计算热度异常时的平均涨跌幅作为因子。
热度异常下降,股价上涨:该场景提供显著的负向 Alpha,表明在热度下降但股价异常走强的情况下,后续收益往往不佳。这可能对应于真实投资场景中,主力资金通过拉升股价吸引市场关注,但热度未能同步提升,或资金借助短期情绪波动进行派发。
热度异常下降,股价同步下跌:此场景下,我们发现该因子的涨跌幅指标能够提供正向 Alpha。在整体下跌过程中,相对抗跌的个股可能具有更好的后续表现,表明市场在下行阶段对特定标的的抗跌性存在一定定价偏差。
热度异常上涨,股价同步上涨:该因子在此场景下提供负向 Alpha,意味着在整体上涨过程中,受市场关注度极高、情绪亢奋的股票,后续回调幅度较大。这可能反映出市场对热门个股的短期追涨效应,导致估值或价格偏离合理水平。
热度异常上涨,股价反向下跌:该因子在此场景下同样提供正向 Alpha,表明在市场情绪升温但股价未能同步上涨的情况下,跌幅较大小的个股后续表现较好,而跌幅较大的股票往往意味着主力正在派发筹码。这可能反映市场对于部分热点题材炒作的退潮效应,导致股价进一步走弱。
基于四种不同的热度异常场景,我们筛选出信息含量较高且稳定性较强(ICIR 较高)的两个关键场景进行深入研究,即热度变动方向与股价涨跌幅方向相反的情况。在此基础上,我们构建了“热点反转”因子。具体而言,我们回溯过去 5 个交易日,识别个股热度异常变动的时刻,并计算对应个股的平均涨跌幅。由于该因子专注于热度变化方向与股价表现不一致的情境,因此能够刻画市场对热点股票的过度反应或注意力切换所带来的价格偏离,为后续超额收益提供有效信号。
从图表 28-30 可以观察到,“热点反转”因子仍然保持较强的空头特征,并且自 2024 年 9 月市场反弹以来,几乎未受极端市场环境的影响,能够持续贡献稳定的因子收益。该因子的周频均值 IC 为 4.54%,年化 ICIR 达到 6.14,IC 周胜率高达 80.99%,多空年化收益率达到 19.1%。
从风格因子相关性来看,“热点反转”因子与常见风格因子存在一定程度的相关性,与残差波动率的相关性最高,为 0.24,而与其他风格因子的相关性均在 0.1 或以下。根据图表31,我们发现该因子在不同指数成分股中表现较为均衡。在沪深 300 指数中,其 IC 平均值达到 2.91%,在中证 500 和中证 1000 指数中分别为 2.89% 和 4.09%,说明“热点反转”因子不仅适用于中小盘股票,在大盘股中亦能保持一定的有效性。
2.4 “热点反应”因子
我们认为,在面对新闻舆情带来的冲击时,投资者通常面临两重冲击:第一重是新闻舆情本身,可用新闻热度变化来表征。回测结果表明,新闻舆情的变化带来负向Alpha收益,即在正常市场环境下,热度上升幅度越大,未来平均收益越不理想。其次,我们发现,在舆情热度冲击时刻,股价的反应至关重要。当舆情热度上升且股价同步上升时,未来收益通常显著为负;而当舆情热度上升但股价下降时,未来反而可能获得正向超额收益。基于以上发现,我们在本节中结合前两节的“热点漂移”与“热点反转”因子,通过等权合成构建了“热点反应”因子。
如图表34-37所示,“热点反应”因子的周度IC均值5.08%,年化ICIR 7.34,周胜率85.21%,多空年化收益20.05%,信息比率(IR) 2.9,表现稳健。在与常见风格因子的相关性上,该因子与残差波动率的相关性为0.27,其余风格因子相关性均在0.1左右或以下。
3 总结
本研究首先回顾了“凸显效应”因子的样本外表现,并对其进行复盘。结果显示,自2024年9 月市场反弹以来,该因子的IC 呈现横盘态势,表明其在该阶阶段表现不佳。我们认为,失效的原因主要源于市场微观交易结构的变化。在此期间,市场热度较高的股票动量效应更为持久,导致短期内高热度股票仍能维持超额收益,削弱了因子的有效性。
我们根据股票热度平稳变化,构建了“热点漂移”因子,该因子刻画了投资者对于股票舆情的热度变化。 “热点漂移”因子在回测时间段因子周度IC为3.7%,年化ICIR为5.53,IC周胜率达到78%,因子多空年化收益率达到27.3%,信息比率3.74%。
我们尝试识别情绪剧烈变化的关键时间段,并计算相关时间段涨跌幅构建“热点反转”因子,该因子的周频均值 IC 为 4.54%,年化 ICIR 达到 6.14,IC周胜率高达 80.99%,多空年化收益率达到 19.1%,显示出较强的稳健性和可交易性。
我们结合“热点漂移”与“热点反转”因子进行等权合成,构成“热点反应”因子。“热点反应”因子的周度IC 均值5.08%,年化ICIR 7.34,周胜率85.21%,多空年化收益20.05%,信息比率(IR) 2.9,表现稳健。在与常见风格因子的相关性上,该因子与残差波动率的相关性为0.27,其余风格因子相关性均在0.1左右或以下。
4 风险提示
近期报告