Google 最近再次因为 AI Overview(AI 搜索摘要)闹出笑话:当用户问“Google 这个单词里有几个字母 P”时,它竟然回答有两个;“poop”里有几个 r 时,它说有一个;甚至把“Trump”拼成了“t-r-p-u-m”。

这些错误看起来荒唐,但实际上暴露了当前大语言模型(LLM)一个非常基础却长期存在的技术限制:AI 并不像人类那样真正“阅读”文字。

AI 其实不认识字母

人类看到单词“Google”,会自然地把它拆解成:

G – o – o – g – l – e

然后逐个统计字母。

但像 Google Gemini、OpenAI GPT 等大型语言模型并非这样工作。

它们会先把文本转换成所谓的“Token(词元)”。一个 Token 可能是:

  • 一个完整单词
  • 一个词根
  • 一个音节
  • 几个字符的组合

例如,“Google”很可能被模型当作一个整体 Token,而不是六个独立字母。

因此对于模型来说:

Google = 某种语义编码

而不是:

G + o + o + g + l + e

加拿大 University of Alberta 的 AI 研究员 Matthew Guzdial 解释说,模型知道“The”这个词代表什么含义,却未必知道它由 T、H、E 三个字母组成。

谷歌
谷歌

为什么 AI 会写代码,却数不清字母?

这正是许多人觉得不可思议的地方。

AI 可以:

  • 几秒钟生成 App
  • 解决复杂数学问题
  • 编写数百行程序
  • 总结大量文档

却经常在数数和拼写上翻车。

原因在于:

语言模型本质上是“预测下一个最可能出现的词”。

它擅长发现海量文本中的统计规律,但并不真正理解文字的内部结构。

换句话说:

  • 编程”属于模式识别问题;
  • “统计单词里的字母数量”属于符号操作问题。

而后者恰恰不是 Transformer 架构最擅长的领域。

为什么这个问题很难彻底解决?

研究人员认为,这并不是简单修个 Bug 就能解决的问题。

因为 Token 化(Tokenization)本身就是现代 LLM 的基础架构。

来自 Northeastern University 的博士生 Sheridan Feucht 指出:

很难定义什么才是最完美的 Token 切分方式。

即使未来改进 Tokenizer,模型仍然可能继续把信息“打包”成更大的语义块,而不是回到逐字母处理模式。

因此,这类拼写和计数错误可能会长期存在。

真正值得关注的不是拼写

事实上,Google 已经修复了一些更严重的问题。

此前搜索“disregard”时,AI Overview 竟然把用户提示词误当成词典释义进行展示。

相比之下,把 “journalism” 拼错虽然搞笑,却不会直接误导用户。

真正的问题在于:

这些错误提醒我们,AI 并不是全知全能的。

当模型能流畅回答复杂问题时,人们很容易产生“它一定是对的”的错觉。

但实际上:

  • AI 会幻觉(Hallucination)
  • 会引用错误来源
  • 会计算失误
  • 会拼写错误
  • 会编造事实

结语

Google AI Overview 的拼写翻车并不是偶然事故,而是当前大语言模型底层架构的天然局限。

这些系统在理解语义、生成内容方面已经达到惊人的水平,但在某些看似幼儿园级别的任务上仍可能失败。

AI 很强大,但不是权威。

无论是 Google、Gemini、ChatGPT,还是其他生成式 AI,最重要的使用原则始终没有改变:

把 AI 当作助手,而不是事实的最终裁判。