【专题报告】新晋品种碳酸锂为什么也适合日内交易策略

  国投期货研究院

  日内交易对于品种的选择有较为严格的要求。尽管日内价格波动与大部分宏观基本面因素已经不存在紧密关联,但不同品种的价格走势形态所体现出的资金行为和活跃度千差万别,一概而论地采用同一套交易机制往往导致偏离预期的收益特征。从传统定义考量,成交活跃度、波动幅度和交易成本是影响日内策略收益表现的三大要素。碳酸锂期货自2023年上市以来,交易所对平今仓手续费实行免收政策,而且当前其成交量和波动率在所属板块中均位于前列。除了已被广泛应用于日内的品种如铁矿、甲醇、玻璃等以外,年轻的碳酸锂开始成为不少交易者的更优选择。

  针对碳酸锂期货的波动特点,我们尝试同步采用线性模型和非线性模型,基于动量、波动率、资金流、流动性及量价相关性等多维度数据进行建模。实证结果显示,相较于基准策略,XGB模型胜率提升16%、盈亏比提升1.7、最大回撤降低0.5%。同时,模型在样本内与样本外表现出较为稳定的预测胜率。尽管样本内平均波动和趋势性要好于样本外,但样本外展现出了稳定的风险控制能力,通过动态调整减少短期交易频次,降低频繁开平仓造成的磨损。同时,策略在样本外保持了较优的夏普比,这也反映出XGB模型在碳酸锂等高波动品种预测中趋势和反转兼顾的优势。

  正文

  碳酸锂价格波动剧烈,产业基本面因素相对复杂。它不仅受到上游锂矿开采、中游锂盐厂加工产能和库存等基本面因素驱动,也紧密关联下游新能源汽车销量、产业政策变动以及市场交易情绪。当交易聚焦于日内波动,基本面数据的影响被淡化,市场资金行为、突发消息新闻成为主要影响因素。

  在高波动、价格频繁跳空的市场中,基本面模型面临较大的预测困境,核心原因在于输入数据与市场动态会出现较大偏移。另一方面,线性模型依赖于静态、线性且具有可加性的关系假设,而实际市场却呈现出强烈的动态非线性、交互性及突变性特征。具体来看,观察碳酸锂期货日内走势,当突发消息引发价格跳越时,市场定价逻辑会发生结构性突变,导致因子与价格之间的关系不再是固定不变的状态。同一个因子在不同市场环境下,其影响方向和作用力可能完全不同,这也相应使得线性模型拟合的固定系数容易失效。

  图:碳酸锂期货历史波动率

  同时,因子间复杂的交互作用需要模型不断拟合,而线性模型依赖人工预设交互项,难以捕捉市场真实的决策逻辑。同时高波动市场伴随着大量噪声,许多短期的价格波动是随机的、由流动性等因素驱动,并不能反映出市场真实趋势。而线性模型对噪声和信号的区分能力不足,往往在平滑噪声的同时过滤掉了关键突变信号,导致其在市场剧烈变动时刻容易失灵。因此,线性模型较为静态的范式难以适应高波动市场的动态特征,灵活度相对较弱。

  在此领域,XGBoost等树模型相较于传统线性模型,展现出多方面的显著优势。首先,XGBoost的核心优势在于其强大的非线性关系捕捉能力。针对日内价格跳越等现象,模型可以通过树的分裂结构自动识别并拟合数据中隐藏的复杂非线性模式,更好的对市场行为进行归纳。其次,XGBoost能够自动学习高阶特征交互效应。在日内交易中,信号的强度通常会依赖于多个条件的组合。例如,成交量急剧放大与价格突破两个条件同时发生时,其意义远大于单一信号。相比传统线性模型需要手动构造交互项,过程繁琐且易遗漏隐含信息。XGBoost在构建树的过程中,天然地通过多特征组合分裂来发掘并利用这些复杂的交互作用,从而做出更为精准的判断。最后,XGBoost在实践上更具鲁棒性和灵活性。首先模型对数据的分布没有严格的假设,可以更好地处理金融时间序列中常见的尖峰厚尾和数据噪声,此外,相比于深度学习模型,树模型在处理小样本数据过程中具有较快的速度与更好的稳定性。同时模型中内置的正则化机制也可以有效防止高维特征空间下的过拟合风险,保障了模型的泛化能力。

  总的来说,综合碳酸锂期货日内行情特征与XGBoost模型处理非线性数据与交互特征等优势,本文选择XGBoost作为策略基础,构建碳酸锂日内预测体系。

  1、 因子构建与测试

  文章当前分析基于碳酸锂期货的日内分钟级别数据,构建了一系列技术面因子,旨在从多个维度捕捉市场的短期波动规律。采用的因子类型包括动量趋势、资金流、波动率、流动性、量价高阶特征、量价相关性以及跨期结构等。具体的,动量趋势类因子通过计算不同时间窗口下的价格相对位置或短期收益率,识别价格延续性行为;波动率因子衡量价格在一定周期内的震荡幅度,反映市场的风险水平与不确定性;资金流类因子结合成交与持仓变化,分析资金进出方向,辅助判断价格变动的有效性;流动性因子关注市场交易成本与活跃度变化,体现市场即时交易意愿与情绪强度;量价高阶特征因子则从统计分布出发,挖掘偏度、峰度等非正态特征,揭示潜在的市场状态转换信号;而跨期因子则是通过比较不同期限合约间的价差与强弱关系,捕捉期限结构变化所传递的市场预期与传导信号。

  图:文章中主要量价因子类别

  我们通过对主要因子进行历史ICIR分析,发现各因子类别内部在预测方面呈现出一定共性。其中,部分价格类因子具有明显的均值回复特性,在预测未来5~15分钟的价格区间时,动量与量价相关性等因子IC值均稳定为负,反应当价格在短期内偏离前期中枢水平,或量价关系出现异常波动时,市场在较短时间内出现回调或反转的概率较高。此外,分析还发现因子的预测能力会随时间的延长而逐步衰减。部分因子的IC绝对值与ICIR稳定性随着预测周期的扩展而下降,说明其有效预测信号主要集中在相对较短的时间窗口内。

  基于以上分析,我们将最优预测区间确定为未来15分钟。在该时间范围内,因子既具备较强的预测能力,也保持了较好的信号稳定性。因此,当前策略将核心关注点集中于捕捉未来5至15分钟内的价格反转或趋势性机会,以提升策略的整体胜率。

  图:量价因子ICIR绝对值分布图

  基于上述特征,本文中最优预测区间被界定在未来15分钟左右范围,在此窗口内,因子同时具备了预测强度与信号稳定性。基于上述分析,当前策略我们主要将核心注意力集中于捕捉未来5-15分钟内的价格反转或趋势机会,以实现最高的策略胜率。

  2、碳酸锂T0策略

  文章将历史数据分位样本内与样本外两个部分,全样本为2024年月至2025年9月碳酸锂主力日内分钟数据,其中样本外区间为2025年6月至2025年9月。对于样本内数据我们采用时序Kfold方法(如下图)进行模型参数的调整与特征筛选。结合特征重要度与Shap值,排名靠前的5个因子(对应下图factor1~factor5),分别为:日内价差,成交量加权价格,波动率,RTI,量价相关性。

  图:模型数据划分方法示意图

  在模型构建方面,我们首先将未来15分钟的涨跌状态转化为二分类标签:若涨幅大于0,则设定预测标签为1,反之则设为0。随后,将因子数据输入分类模型进行训练,模型输出为对应的预测概率。在策略信号生成环节,我们依据模型输出的概率值设定开仓阈值。经样本内测试,将开仓阈值分别设定为0.4与0.6:即当输出概率大于0.6时,发出开多信号;小于0.4时,发出开空信号;介于两者之间则不发出任何信号。在回测参数设置方面,我们设定保证金比率为100%,交易费率则根据历史实际费率进行动态调整,以贴近真实交易环境。

  图:信号开仓逻辑

  基于碳酸锂主力合约分钟数据的回测结果显示,策略在样本内与样本外均保持了较高的胜率,分别为85.7%与84.5%,反映出策略整体具备较好的稳定性。然而,样本外阶段的盈亏比出现明显下降,反映出平均盈利与平均亏损之间的比值有所收窄。通过回溯碳酸锂日度波动率走势,我们发现2025年7月之后,受产业基本面消息与政策预期的共同影响,市场波动性显著上升。在此背景下,策略年化波动率从样本内的10.3%上升至样本外的24.5%。与此同时,策略的日内平均开仓次数较样本内提升了约22%,而平均持仓时间则下降了25.4%。这表明,在高波动市场环境中,策略倾向于通过缩短持仓周期、提高交易频率来应对风险并捕捉短期机会。然而,价格频繁跳空与快速反转也导致持仓利润更容易被反向波动侵蚀,增加了触发止损或提前平仓的概率,从而对样本外阶段的盈亏比造成了一定程度的磨损。

  图:碳酸锂期货T+0策略净值(样本内)

  表:碳酸锂期货T+0策略表现统计

  国投期货

  高级分析师  王锴  期货投资咨询证号:Z0016943

  分析师 张婧婕 期货投资咨询证号:Z0022617