MiniMax 昨晚扔出王炸 —— 开源了训练成本只要 53.47 万美金的 M1 模型,最绝的是,它的输出长度飙到了 8 万 Token,输入更是能扛 100 万 Token,直接刷新了开源模型的上下文窗口纪录!
这模型性能简直猛到不行。在数学推理上,AIME 2024 拿了 86 分,超过了 Claude 4 Opus;编程任务更厉害,LiveCodeBench 测试中,65 分的成绩把 DeepSeek-R1 远远甩在身后。就连 AI 研究员都激动到不行,有人说它具备 46 亿活跃参数,推理能力快赶上最前沿水平了。

消息一出来,整个 AI 圈都炸了锅。Hugging Face 的工程师直呼 “太牛了”,vLLM 团队当天就适配了模型,还有开发者发现,它在 tau bench retail 上的表现,直接超越了 Gemini 2.5 Pro。
M1 能这么猛,全靠混合专家架构搭配闪电注意力机制,还有新提出的 CISPO 算法,把训练效率拉满。实测下来,处理 10 万 Token 生成任务时,计算量只有 DeepSeek R1 的四分之一,训练效率比 o1 高了 1.5 万到 2 万倍。
现在已经有不少人上手实测了。不管是生成 UI 元件、开发互动应用,还是做可视化工具、开发游戏,M1 都能轻松搞定。MiniMax 还贴心提供了 8 万 Token 和 4 万 Token 两个版本,部署起来也很方便。
作为 2021 年成立的中国 AI 公司,MiniMax 这次可算是在国际舞台上狠狠露了脸。53 万美金训出这么强的模型,不仅给全球开源社区注入了新活力,也让大家看到了国产开源模型的实力。看来,开源大模型的新时代,真的要来了!