一项针对人工智能模型预测世界杯32强表现能力的专项评估于近日完成。结果显示,混元大模型在预测准确度方面位居首位。
参与本次评估的还包括DeepSeek、智谱AI等多家机构研发的模型。其中,智谱AI研发的模型位列第二,月之暗面研发的模型排名第三,DeepSeek研发的模型则排在第四位。
本次评估聚焦于各模型对参赛球队综合实力、比赛胜负趋势等足球领域关键问题的分析与预判能力。评估数据反映出,不同模型在足球专业知识的理解深度、逻辑推理水平及任务适配性等方面存在一定差异。