阿里通义团队推出了基于Qwen2大语言模型的新一代数学模型Qwen2-Math,包含不同参数规模的模型,其中旗舰模型Qwen2-Math-72B-Instruct在权威数学测评集MATH上以84%的准确率超越了多个竞争对手,展现了其在代数、几何、计数与概率、数论等数学领域的强大能力。

Qwen2-Math在多个英语和中文数学基准上进行了评估,采用了Few-shot CoT方法,确保了评估的公正性和准确性。团队对预训练和微调数据集进行了去污染处理,移除了与测试集重叠的样本,保证了模型的纯净性和可靠性。

此外,Qwen2-Math计划推出支持中英文的双语模型,并进一步开发多语言版本,这将大大扩展其应用场景,满足更多用户的需求。阿里通义团队的这一创新举措,无疑将推动数学模型的发展,为解决复杂数学问题提供更强大的支持。