本文来源:时代财经 作者:赵姝婵 庞宇


图片来源:视觉中国

2026年美加墨世界杯小组赛硝烟散尽,32强完整名单正式揭晓。在绿茵场上传统强队与黑马球队激烈角逐的同时,绿茵场之外,一场由人工智能主导的“预测人机大战”也迎来了阶段性“结算”。

在联想集团联合咪咕视频发起的“世界杯预测人机大战”中,12家国内主流AI大模型和人类专家分别对104场赛事的结果进行了预测。最终数据显示,AI阵营的整体预测准确率超越人类专家,且部分AI模型更是押中佛得角等并无世界杯历史数据的冷门球队,得出一些“反共识”的结果。


图片来源:联想官方供图

从5月28日到世界杯开赛前,联想天禧AI作为“总召集人”,向12家国内主流AI大模型和人类专家发送了一份《2026世界杯32强竞猜统一考试》答题卡,要求在赛前提交自己的“答卷”。

北京时间6月28日,随着J组收官战阿尔及利亚队与奥地利队以3:3握手言和,各家AI预测的排名也随之揭晓。其中,腾讯混元以命中29支晋级球队的成绩位列榜首,MiniMax与讯飞星火则以命中28支的成绩紧随其后。AI阵营的整体胜率达到61.9%,领先人类专家7.3%。

更具看点的是,在赛前预测时,12家AI里就有四家大胆看好“新军”佛得角。这一“反共识”的预测,被佛得角的战绩一一印证——该队连续逼平西班牙、乌拉圭等传统强队,以不败战绩出线。

商汤科技技术总监马林向时代财经记者解释称,之所以AI大模型能押中佛得角这匹“最大黑马”,原因在于模型能够穿透纸面实力的表象,挖掘深层数据。佛得角虽为世界杯“新军”,但其球员多在欧洲联赛体系下成长,且近年来预选赛表现强势。AI模型通过捕捉其足球防守纪律、反击效率以及球员结构等深层数据变量,得出了比人类经验更为理性的结论。

不过,AI在展现“反共识”能力的同时,也暴露出在极端不确定性下的局限。以佛得角对阵沙特为例,这场比赛12家AI判断结果分化为三种:DeepSeek、Kimi、阶跃、讯飞星火预测沙特阿拉伯胜;通义千问、中移九天、天禧AI、腾讯混元、商汤小浣熊预判双方平局;百度文心、智谱、MiniMax看好佛得角取胜。尽管最终结果是平局,但没有任何一家模型精准命中0:0的最终比分。

这一现象揭示了当前AI预测普遍存在“进攻火力高估”盲区。即便有5家模型预判了平局,它们给出的比分也均包含至少1粒进球。据联想官方数据,在小组赛出现的9场平局中,AI的预测命中率不足3%。由此看来,AI大模型更擅长处理结构化数据与确定性趋势,但对于足球这种集临场心理、突发伤病及偶然性多重因素的团体运动,还是有AI大模型无法估测的部分。

这届世界杯黑马频出,让AI的预测变得五花八门。这其实暴露出大模型“底层逻辑趋同”的短板。因为大模型本质上是靠历史数据做推演的“概率压缩器”。在强弱分明的常规比赛里,大家吃着同样的数据,自然得出同样的结论;但一旦遇到没见过的球队,或是比赛中出现了创新战术或者极端打法,AI就会因为缺乏历史参照而“集体失灵”。因为它们并没有真正理解比赛,只是在面对未知时,各自凭概率猜测。

事实上,对世界杯结果预测的“人机大战”并非联想一家的独角戏,多家头部大模型厂商也早已下场参与:千问上线了专属的足球预测AI助手,不仅覆盖了全部104场比赛供用户与AI同台竞猜,还同步发起了“球场计划”——当用户的竞猜积分达到一定数额后,千问将为乡村学校捐建足球场。

月之暗面(Kimi)也搭建了300个专属Agent,分别负责战术分析、球员状态追踪、赛程计算以及赔率监测等细分方向,最终生成了一份长达224页的深度预测报告,展现其多智能体协同处理复杂任务的能力。此外,Anthropic的Claude Fable 5模型也基于赛事结构(48队参赛、冠军需踢8场)、北美夏季高温以及球队阵容年龄曲线等宏观变量给出预测。

这些多元化的参与方式,不仅让AI预测从单纯的“胜负竞猜”演变为涵盖数据分析、多Agent协同、公益互动及宏观推演的综合技术展示,也让这场围绕世界杯的“人机大战”成为各大厂商检验大模型落地能力的绝佳试验场。但从更高维度看,在商业决策、宏观经济研判乃至社会治理等复杂系统中,AI同样面临着“数据完备”与“现实混沌”的博弈。