科技巨头加速开放模型发展

不同于 OpenAI 的闭源大模型,Google、Meta 等科技巨头正在发力开放模型来实现弯道超车。

Gemma 的诞生

2 月 21 日,Google 推出新一代开放 AI 模型——Gemma,这是一个轻量级的模型,比肩 Meta 的 Llama 2 模型。Gemini 设计的灵感就是来源于 Gemini,拉丁语 Gemma,有“宝石”之意。Gemma 可以被视为 Gemini 的更小、更轻的版本,旨在让开发人员和研究人员更容易访问和使用。

Gemma 的特点与性能

Gemma 是由 Google DeepMind 和其他 Google AI 团队共同开发而成,采用与 Gemini 模型相同的研究和技术,建立在序列模型、Transformer、基于神经网络的深度学习方法和分布式系统上大规模训练技术至上。模型训练的上下文长度为 8192 个 tokenGemma 拥有两种尺寸,分别为 Gemma 2B(20 亿参数)和 Gemma 7B(70 亿参数),每种尺寸都发布了预训练和指令调整变体。 Gemma 在性能上达到了同类最佳水平,特别是在数学、Python 代码生成、常识和常识推理任务的几个基准测试中优于竞争对手。

Google 对负责任 AI 的承诺

Google 特别强调 Gemma 的设计是以 AI 原则为首要考量的。他们通过自动化技术过滤训练集中的个人信息和敏感数据,并使用了大量的微调和人类反馈强化学习,以确保 Gemma 模型的负责任行为。Google 还发布了新的《负责任的生成式人工智能工具包》,旨在帮助开发人员优先构建安全、负责任的人工智能应用。

开源与开放模型的区别

虽然 Gemma 模型可以免费获取,但并非开源。Google 强调了开源和开放模型的区别,指出开源虽然有诸多好处,但并不总能直接适用于 AI 系统。Gemma 模型遵循开放模型的原则,允许用户自由访问、重新分配和创建模型变体,但使用条款根据模型的具体使用而有所不同,以确保负责任地使用技术。

对 Gemma 的展望

Gemma 的发布标志着 Google 在开放 AI 研究领域的重要贡献,并为开发者提供了一个强大的工具。这一举措将促进 AI 技术的发展与应用,并推动行业走向更加开放、负责任的方向。

最后,Gemma 的面世引发了广泛关注,对于 AI 技术的未来发展充满期待。在 Google 不断推出新模型的同时,我们也期待更多负责任、创新的 AI 技术不断涌现,为社会带来更多的价值与便利。