AI Investment Frontier

深度收益模型需要组合现实层

A new Journal of Empirical Finance paper on deep learning for market return predictability is a useful prompt to separate forecasting accuracy from deployable portfolio value.

Kaizhi Tang

06 Jun 2026 • 10 min read

一篇新发表在 Journal of Empirical Finance 上、关于深度学习用于市场收益预测和投资组合配置的论文之所以值得关注，是因为它正好落在投资 AI 最容易过度自信的位置：从“更好的预测”跳到“更好的组合”。今天的前沿信号并不只是神经网络可以用于收益预测。这一点已经不新鲜。真正重要的问题是：一个 AI 系统能否把不稳定、噪声很大、受市场状态影响很强的收益估计，转化为能够经受成本、约束、换手率和模型风险审查的配置决策。

前沿信号

ScienceDirect 显示，Journal of Empirical Finance 收录了题为 “Deep learning in market return predictability and portfolio allocation” 的文章，并于 2026 年 6 月 1 日在线发布。公开摘要将论文放在两个相互连接的任务上：用深度学习预测市场收益，并将这些预测用于投资组合配置。

这个组合在当下很重要，因为投资领域关于 AI 的讨论已经从“AI 能不能预测某些东西？”转向“AI 能不能改善投资流程，而不制造隐藏的脆弱性？”一个收益模型即使在统计指标上更好，如果它带来不稳定权重、过度交易、风险集中，或者捕捉到下一轮宏观状态变化后就消失的关系，仍然可能作为组合输入而失败。

这篇文章最好被视为学术证据，而不是产品声明或生产部署。公开可得的元数据不足以支持我们编造业绩数字、模型细节或真实交易结论。不过，这篇论文的时效性在于，它指出了一个实际的构建问题：投资领域的深度学习研究应该从一开始就通过投资组合视角来评估，而不是等一个预测论文看起来不错之后，再把它外接到配置引擎上。

行业背景也在朝同一个方向移动。T. Rowe Price 最近发布文章，认为 AI 正在作为研究、数据处理和决策支持的增强层，被嵌入投资工作流，而不是替代投资判断。这不是经过基准检验的业绩声明。但它是一个有用的部署信号：真实资产管理机构正在把 AI 当作工作流基础设施，而研究前沿仍在测试更灵活的模型能否从噪声很高的金融数据中提取有用结构。

投资者为什么在意

投资者在意，是因为市场收益预测是机器学习中最诱人、也最危险的领域之一。它诱人，是因为目标具有明确经济意义。它危险，是因为信噪比低、样本有限、市场状态变化频繁，而且很多评估选择都可能让弱证据看起来比实际更强。

对投资组合经理来说，收益模型的输出很少是最终决策。它会成为仓位大小、风险预算、对冲、现金管理、回撤控制，以及向客户或投资委员会沟通的输入。模型的实际价值取决于它进入优化流程之后的行为，而不仅仅是它单独评分有多好。

这正是深度学习既可能有帮助、也可能带来伤害的地方。灵活模型可能捕捉宏观变量、估值指标、情绪、流动性、趋势和跨资产信息之间的非线性互动。但灵活性也提高了控制要求。模型可能以很强的信心响应噪声。组合优化器可能把很小的预测差异放大成很大的配置变化。回测于是看起来很复杂，却悄悄依赖数据泄漏、过高换手率或幸运样本。

因此，这里受影响的投资流程不只是预测。它包括研究设计、信号验证、投资组合构建、风险管理和模型治理。构建者不应该只问深度模型能否预测收益。更好的问题是：整个系统是否能在现实摩擦下，产生稳定、可审计、具有经济合理性的配置。

技术解读

这个研究方向隐含的技术模式可以分为四层。

第一层是数据构建。市场收益预测通常会组合时间序列特征、宏观指标、估值比率、波动率指标、趋势变量、流动性代理变量，有时还会加入文本或另类数据。关键工程问题是时间。每个特征都需要有 as-of 时间戳、发布滞后、修订规则和可用性规则。没有这些，深度模型可能无意中学习到决策时点尚不可得的信息。

第二层是模型训练。深度学习模型可以表达线性回归可能错过的非线性关系和时间依赖。根据设计不同，系统可能使用前馈网络、循环模型、时间卷积、注意力架构或集成模型。但具体架构的重要性低于验证纪律。金融时间序列会惩罚随机训练测试划分。滚动前推评估、滚动再训练、隔离期和状态诊断，比漂亮的架构图更重要。

第三层是从预测到组合的转换。这是很多 AI 投资系统变脆的地方。收益预测不应该在没有风险模型、约束、不确定性估计、换手惩罚、现金或基准政策的情况下直接流入权重。如果模型说某个资产的预期收益略高，配置器需要知道这个差异是否足够稳健，值得交易。预测幅度、置信度、波动率、相关性和交易成本都需要相互作用，然后组合才应该变化。

第四层是监控。部署后的系统不仅要跟踪已实现收益，还要跟踪预测校准、不同市场状态下的命中率、回撤贡献、换手率、集中度、风险因子暴露、成本拖累和模型漂移。对于深度模型来说，可解释性不是奢侈品。即使模型本身复杂，周围系统也应该解释哪些数据家族正在驱动配置变化，以及这些驱动因素是否仍在预期范围内运行。

从 Kaizhi 的开发视角看，架构教训很清楚：要把投资组合层作为一等公民。模型可以实验性强一些，但配置契约应该保守。一个有用的 AI 投资系统应该能够说明：这是预测，这是不确定性，这是风险影响，这是采取行动的成本，这是权重变化或没有变化的原因。

现实校验

最大的风险是过拟合。与现代深度模型的参数容量相比，市场收益数据集很小。即使数据矩阵看起来很大，独立市场状态的数量也有限。一个在某个历史阶段有效的模型，可能学到的是宏观环境，而不是持久关系。

第二个风险是泄漏。金融数据常常存在修订历史、发布延迟、幸存者偏差、指数成员变化和公司行为调整。深度学习不会原谅脏的时间规则。它通常会更有效地利用这些问题。

第三个风险是优化器放大。一个很小的预测优势，一旦通过均值方差优化器或对杠杆敏感的配置规则，可能变成很大的组合押注。这会让原本温和的模型误差，以回撤、集中或换手率的形式出现。

第四个风险是经济意义。模型可以改善统计损失函数，却产生在成本之后毫无意义的交易。学术回测对于测试想法很有价值，但它不等于生产部署。除非论文报告真实运行结果、容量分析、实施约束和成本假设，否则正确标签仍然是学术回测证据。

第五个风险是组织采用。T. Rowe Price 的 AI 文章提醒我们，机构投资是一套工作流，而不是一个 Kaggle 排行榜。即使模型有用，也必须适配分析师审阅、投资组合经理判断、风险监督和合规文档。模型的运营可解释性，可能决定它是否真的能影响资本。

构建者要点

在追求更好的深度模型之前，先构建从预测到组合的转换层。要求每个预测都经过不确定性、风险、换手率和成本检查。
把滚动前推测试和 as-of 数据测试作为默认基础设施。随机划分和时间戳松散的特征不适合收益预测。
把配置稳定性作为指标。一个改善预测损失、却造成权重频繁震荡的模型，对真实组合可能更差。
在仪表盘和文档中区分学术证据与部署证据。回测、供应商声明、内部论文复现和生产结果，不应该共享同一种信心标签。
围绕组合决策增加模型风险解释，而不只是解释神经网络。系统应该说明资本为什么移动、为什么保持不动，以及什么情况会使信号失效。

链接 / 来源

Journal of Empirical Finance / ScienceDirect: “Deep learning in market return predictability and portfolio allocation,” 2026 年 6 月 1 日在线发布。本文的主要研究信号来源，连接深度学习收益预测与组合配置决策。https://www.sciencedirect.com/science/article/pii/S0927539826000204
T. Rowe Price: “AI Is Reshaping the Investment Landscape,” 2026 年 5 月 28 日发布。行业背景来源，说明 AI 正作为研究、数据处理和投资工作流增强层，而不是自主替代判断。https://www.troweprice.com/financial-intermediary/us/en/insights/articles/2026/q2/ai-is-reshaping-the-investment-landscape-na.html
Journal of Financial Data Science: “Machine Learning for Financial Market Forecasting.” 背景参考，说明机器学习用于金融预测的长期挑战，以及评估设计的重要性。https://jfds.pm-research.com/content/early/2026/04/22/jfds.2026.1.180

Read in English →