炸裂！53 万美金训出超牛模型，直接干翻一众大佬！

By adminmysql360On 2025年6月19日2025年6月18日

MiniMax 昨晚扔出王炸 —— 开源了训练成本只要 53.47 万美金的 M1 模型，最绝的是，它的输出长度飙到了 8 万 Token，输入更是能扛 100 万 Token，直接刷新了开源模型的上下文窗口纪录！

这模型性能简直猛到不行。在数学推理上，AIME 2024 拿了 86 分，超过了 Claude 4 Opus；编程任务更厉害，LiveCodeBench 测试中，65 分的成绩把 DeepSeek-R1 远远甩在身后。就连 AI 研究员都激动到不行，有人说它具备 46 亿活跃参数，推理能力快赶上最前沿水平了。

消息一出来，整个 AI 圈都炸了锅。Hugging Face 的工程师直呼 “太牛了”，vLLM 团队当天就适配了模型，还有开发者发现，它在 tau bench retail 上的表现，直接超越了 Gemini 2.5 Pro。

M1 能这么猛，全靠混合专家架构搭配闪电注意力机制，还有新提出的 CISPO 算法，把训练效率拉满。实测下来，处理 10 万 Token 生成任务时，计算量只有 DeepSeek R1 的四分之一，训练效率比 o1 高了 1.5 万到 2 万倍。

现在已经有不少人上手实测了。不管是生成 UI 元件、开发互动应用，还是做可视化工具、开发游戏，M1 都能轻松搞定。MiniMax 还贴心提供了 8 万 Token 和 4 万 Token 两个版本，部署起来也很方便。

作为 2021 年成立的中国 AI 公司，MiniMax 这次可算是在国际舞台上狠狠露了脸。53 万美金训出这么强的模型，不仅给全球开源社区注入了新活力，也让大家看到了国产开源模型的实力。看来，开源大模型的新时代，真的要来了！

浏览量: 184

炸裂！53 万美金训出超牛模型，直接干翻一众大佬！

相关文章：

发表回复 取消回复

发表回复取消回复