中国移动宣布联合央企和产业各方发布《通用大模型评测标准》。该标准由中国移动与电子标准院以及16家央企共同制定,第一阶段围绕通用领域和四个重点行业领域,进行评测标准制定、评测基地建设和评测试点应用等工作。目前,通用大模型评测标准已初步完成。

评测标准基于“2-4-6”框架制定。“2”是指评测从理解和生成两类视角入手,聚焦行业实际需求,确保符合国家标准;“4”是指评测涉及工具、数据、方式和指标四类要素,确保评测工作的实施性;“6”则涵盖功能性、准确性、可靠性、安全性、交互性和应用性六大评测维度。这些维度综合考虑了大模型在实际应用中的核心能力,以此确保大模型评估的全面性和客观性,为大模型在各行业的应用提供保障。

电子标准院、中国电信、国家电网、中国石油、南方电网、阿里巴巴、科大讯飞等多家央企和企业共同参与了此次评测标准的制定。