为什么AutoGPT 会决定不再使用向量数据库？

By adminmysql360On 2023年10月15日2023年10月15日

背景介绍

在 AI 技术的风起云涌中，AutoGPT 作为全球最著名的 AI 项目之一，近期却做出了一个令人意外的决定——不再使用向量数据库。这一转变无疑引发了技术圈的关注和思考。

事情发展：从火热到转身

AutoGPT，于今年 3 月 30 日推出，与其他类似的 AI 智能体 LlamaIndex 和 LangChain 一同，引发了广大开发者的关注。不同于以往需要人为输入的 AI 模型，AutoGPT 能自动执行任务、并解决复杂问题。起初，它运用向量数据库来管理和检索智能体的长期记忆，被视为整个方案中的核心部分。

但最新的动态是，AutoGPT 删除了所有向量数据库的实现，转而使用 JSON 文件作为其存储记忆和嵌入的默认方式。

原因：技术还是策略？

那么，这样的转变背后隐藏着什么原因呢？

首先，Reinier van der Leer——AutoGPT 的维护者，早在今年 5 月就提出过关于增加不同存储方式的想法。他提议放弃大部分存储方法，集中精力实现 Redis VectorMemoryProvider。对此，开发者社区中有支持者，也有反对者。但总体上，AutoGPT 团队发现向量数据库似乎并未带来特殊的附加价值。

流数据库公司 RisingWave 的创始人 & CEO 吴英骏也对此发表了自己的看法。他认为，AutoGPT 起初选择向量数据库是为了快速开发初代产品。但随着项目的深入，可能发现使用和运维向量数据库的成本已超出其带来的好处，因此选择了重新自主研发。

具体分析：为何不选向量数据库

早在 4 月，有网友就认为 AutoGPT 的选择使用向量数据库是“小题大做”。事实上，他们认为即使采用最简单的暴力算法，也完全不需要优化。对于是否选择向量数据库，吴英骏老师认为关键在于应用对矢量存储与查询的依赖程度。

而 Andrej Karpathy 在 Twitter 上也表示，对于大型模型应用，使用 Python 库中的简单功能，如 np.array，已经足够了。

写在最后：看未来走向

目前，很多知名的 AI 项目，如 GPT Engineer、GPT Pilot 和 GitHub Copilot 等，都不采用向量数据库，但这并不意味着向量数据库的价值被忽视。关键还是要看项目的实际需求和目标。

AutoGPT 的这次选择，是为了更好地聚焦于其价值提供，而不是纠结于技术选择。而未来，是否有向量数据库的再度回归，还需要时间来证明。

向量数据库是否是 AI 技术革命中的重要组成部分，还是只是一个空洞的口号？这个问题的答案，可能每个人心中都有不同的解读。但无论如何，技术的选择和变迁都是为了更好地服务于人类，创造更多的价值。

浏览量: 277