AI预测“世界杯32强”准确率超人类：押中“黑马”佛得角，却常常高估球队进攻火力

本文来源：时代财经作者：赵姝婵庞宇

图片来源：视觉中国

2026年美加墨世界杯小组赛硝烟散尽，32强完整名单正式揭晓。在绿茵场上传统强队与黑马球队激烈角逐的同时，绿茵场之外，一场由人工智能主导的“预测人机大战”也迎来了阶段性“结算”。

在联想集团联合咪咕视频发起的“世界杯预测人机大战”中，12家国内主流AI大模型和人类专家分别对104场赛事的结果进行了预测。最终数据显示，AI阵营的整体预测准确率超越人类专家，且部分AI模型更是押中佛得角等并无世界杯历史数据的冷门球队，得出一些“反共识”的结果。

图片来源：联想官方供图

从5月28日到世界杯开赛前，联想天禧AI作为“总召集人”，向12家国内主流AI大模型和人类专家发送了一份《2026世界杯32强竞猜统一考试》答题卡，要求在赛前提交自己的“答卷”。

北京时间6月28日，随着J组收官战阿尔及利亚队与奥地利队以3:3握手言和，各家AI预测的排名也随之揭晓。其中，腾讯混元以命中29支晋级球队的成绩位列榜首，MiniMax与讯飞星火则以命中28支的成绩紧随其后。AI阵营的整体胜率达到61.9%，领先人类专家7.3%。

更具看点的是，在赛前预测时，12家AI里就有四家大胆看好“新军”佛得角。这一“反共识”的预测，被佛得角的战绩一一印证——该队连续逼平西班牙、乌拉圭等传统强队，以不败战绩出线。

商汤科技技术总监马林向时代财经记者解释称，之所以AI大模型能押中佛得角这匹“最大黑马”，原因在于模型能够穿透纸面实力的表象，挖掘深层数据。佛得角虽为世界杯“新军”，但其球员多在欧洲联赛体系下成长，且近年来预选赛表现强势。AI模型通过捕捉其足球防守纪律、反击效率以及球员结构等深层数据变量，得出了比人类经验更为理性的结论。

不过，AI在展现“反共识”能力的同时，也暴露出在极端不确定性下的局限。以佛得角对阵沙特为例，这场比赛12家AI判断结果分化为三种：DeepSeek、Kimi、阶跃、讯飞星火预测沙特阿拉伯胜；通义千问、中移九天、天禧AI、腾讯混元、商汤小浣熊预判双方平局；百度文心、智谱、MiniMax看好佛得角取胜。尽管最终结果是平局，但没有任何一家模型精准命中0:0的最终比分。

这一现象揭示了当前AI预测普遍存在“进攻火力高估”盲区。即便有5家模型预判了平局，它们给出的比分也均包含至少1粒进球。据联想官方数据，在小组赛出现的9场平局中，AI的预测命中率不足3%。由此看来，AI大模型更擅长处理结构化数据与确定性趋势，但对于足球这种集临场心理、突发伤病及偶然性多重因素的团体运动，还是有AI大模型无法估测的部分。

这届世界杯黑马频出，让AI的预测变得五花八门。这其实暴露出大模型“底层逻辑趋同”的短板。因为大模型本质上是靠历史数据做推演的“概率压缩器”。在强弱分明的常规比赛里，大家吃着同样的数据，自然得出同样的结论；但一旦遇到没见过的球队，或是比赛中出现了创新战术或者极端打法，AI就会因为缺乏历史参照而“集体失灵”。因为它们并没有真正理解比赛，只是在面对未知时，各自凭概率猜测。

事实上，对世界杯结果预测的“人机大战”并非联想一家的独角戏，多家头部大模型厂商也早已下场参与：千问上线了专属的足球预测AI助手，不仅覆盖了全部104场比赛供用户与AI同台竞猜，还同步发起了“球场计划”——当用户的竞猜积分达到一定数额后，千问将为乡村学校捐建足球场。

月之暗面（Kimi）也搭建了300个专属Agent，分别负责战术分析、球员状态追踪、赛程计算以及赔率监测等细分方向，最终生成了一份长达224页的深度预测报告，展现其多智能体协同处理复杂任务的能力。此外，Anthropic的Claude Fable 5模型也基于赛事结构（48队参赛、冠军需踢8场）、北美夏季高温以及球队阵容年龄曲线等宏观变量给出预测。

这些多元化的参与方式，不仅让AI预测从单纯的“胜负竞猜”演变为涵盖数据分析、多Agent协同、公益互动及宏观推演的综合技术展示，也让这场围绕世界杯的“人机大战”成为各大厂商检验大模型落地能力的绝佳试验场。但从更高维度看，在商业决策、宏观经济研判乃至社会治理等复杂系统中，AI同样面临着“数据完备”与“现实混沌”的博弈。