Google 的 AI 为什么连 “Google” 都拼不对？

By adminmysql360On 2026年5月31日2026年5月30日

Google 最近再次因为 AI Overview（AI 搜索摘要）闹出笑话：当用户问“Google 这个单词里有几个字母 P”时，它竟然回答有两个；“poop”里有几个 r 时，它说有一个；甚至把“Trump”拼成了“t-r-p-u-m”。

这些错误看起来荒唐，但实际上暴露了当前大语言模型（LLM）一个非常基础却长期存在的技术限制：AI 并不像人类那样真正“阅读”文字。

AI 其实不认识字母

人类看到单词“Google”，会自然地把它拆解成：

G – o – o – g – l – e

然后逐个统计字母。

但像 Google Gemini、OpenAI GPT 等大型语言模型并非这样工作。

它们会先把文本转换成所谓的“Token（词元）”。一个 Token 可能是：

一个完整单词
一个词根
一个音节
几个字符的组合

例如，“Google”很可能被模型当作一个整体 Token，而不是六个独立字母。

因此对于模型来说：

Google = 某种语义编码

而不是：

G + o + o + g + l + e

加拿大 University of Alberta 的 AI 研究员 Matthew Guzdial 解释说，模型知道“The”这个词代表什么含义，却未必知道它由 T、H、E 三个字母组成。

为什么 AI 会写代码，却数不清字母？

这正是许多人觉得不可思议的地方。

AI 可以：

几秒钟生成 App
解决复杂数学问题
编写数百行程序
总结大量文档

却经常在数数和拼写上翻车。

原因在于：

语言模型本质上是“预测下一个最可能出现的词”。

它擅长发现海量文本中的统计规律，但并不真正理解文字的内部结构。

换句话说：

“编程”属于模式识别问题；
“统计单词里的字母数量”属于符号操作问题。

而后者恰恰不是 Transformer 架构最擅长的领域。

为什么这个问题很难彻底解决？

研究人员认为，这并不是简单修个 Bug 就能解决的问题。

因为 Token 化（Tokenization）本身就是现代 LLM 的基础架构。

来自 Northeastern University 的博士生 Sheridan Feucht 指出：

很难定义什么才是最完美的 Token 切分方式。

即使未来改进 Tokenizer，模型仍然可能继续把信息“打包”成更大的语义块，而不是回到逐字母处理模式。

因此，这类拼写和计数错误可能会长期存在。

真正值得关注的不是拼写

事实上，Google 已经修复了一些更严重的问题。

此前搜索“disregard”时，AI Overview 竟然把用户提示词误当成词典释义进行展示。

相比之下，把 “journalism” 拼错虽然搞笑，却不会直接误导用户。

真正的问题在于：

这些错误提醒我们，AI 并不是全知全能的。

当模型能流畅回答复杂问题时，人们很容易产生“它一定是对的”的错觉。

但实际上：

AI 会幻觉（Hallucination）
会引用错误来源
会计算失误
会拼写错误
会编造事实

结语

Google AI Overview 的拼写翻车并不是偶然事故，而是当前大语言模型底层架构的天然局限。

这些系统在理解语义、生成内容方面已经达到惊人的水平，但在某些看似幼儿园级别的任务上仍可能失败。

AI 很强大，但不是权威。

无论是 Google、Gemini、ChatGPT，还是其他生成式 AI，最重要的使用原则始终没有改变：

把 AI 当作助手，而不是事实的最终裁判。

浏览量: 50