如果说过去几轮世界杯,人们讨论最多的是AI会不会“集体翻车”,那么澳大利亚与埃及这场比赛,则呈现出另一种完全不同的画风,AI没有形成共识。
北京时间7月4日凌晨2点,澳大利亚与埃及战成1:1。赛前,在联想集团×咪咕视频《世界杯预测人机大战》中,12家大模型并没有像以往那样集体押向一边,而是出现了本届赛事最明显的一次“意见分裂”。
最终,12家AI形成了三个阵营:2家支持澳大利亚取胜;4家支持埃及取胜;6家认为双方将在90分钟内战平。这意味着,平局第一次成为AI阵营中的主流观点,比赛结束后回看,这6家坚持平局判断的大模型,成为本场比赛最大的赢家。其中,通义千问、Kimi、智谱、MiniMax、阶跃五家模型不仅猜中了平局方向,更直接命中了1:1的准确比分。中移九天虽然预测的是0:0,但同样命中了平局结果。
最终,AI阵营取得了6家命中胜平负,5家命中准确比分。这是本届世界杯AI预测中少见的一次“高质量平局预测”。
相比之下,人类嘉宾阵营则出现了明显分化。颜强、韩乔生都预测埃及1:2取胜;阎鹤祥则看好澳大利亚2:1获胜;只有张路和苏东坚持战平。其中,张路直接命中1:1比分,苏东预测0:0,同样判断正确了比赛方向。最终,5位嘉宾中有2位猜中平局,其中1位命中准确比分。
如果单纯比较胜平负,这场比赛AI与人类都没有出现压倒性优势,但真正值得关注的是另一件事。过去的世界杯预测中,大模型越来越容易形成“共识”。面对强弱分明的比赛,12家模型往往会给出高度一致的判断;即便出现冷门,也常常表现为“集体翻车”。而澳大利亚与埃及这场比赛,却完全不同,模型之间出现了明显分歧。有人相信澳大利亚的整体实力;有人更看好埃及的反击效率;也有人认为双方实力接近,平局概率最高。
最终,没有共识,反而更接近真相。从某种意义上说,这也说明,大模型的预测能力正在进入新的阶段。它们不再只是简单输出相似答案,而是在面对势均力敌的比赛时,开始根据各自的数据体系、权重模型和推理逻辑,得出不同结论。而这种差异,恰恰也是AI预测越来越有意思的地方,它不只是告诉你谁会赢,更是在展示不同模型究竟是如何理解一场足球比赛。
对于本届世界杯来说,这场1:1也留下了一个很有意思的纪录:第一次,不是AI集体猜对,而是AI先“吵”出了三个答案,最后平局派赢了。
本文为“世界杯预测人机大战”每日战报,由Hehson财经联合联想集团、咪咕视频共同呈现。活动详情请关注咪咕视频APP。每晚9点,联想集团与咪咕视频联合出品的《人机大战:谁是世界杯预言家》在咪咕视频热播,敬请观看!