Google 最近再次因为 AI Overview(AI 搜索摘要)闹出笑话:当用户问“Google 这个单词里有几个字母 P”时,它竟然回答有两个;“poop”里有几个 r 时,它说有一个;甚至把“Trump”拼成了“t-r-p-u-m”。
这些错误看起来荒唐,但实际上暴露了当前大语言模型(LLM)一个非常基础却长期存在的技术限制:AI 并不像人类那样真正“阅读”文字。
AI 其实不认识字母
人类看到单词“Google”,会自然地把它拆解成:
G – o – o – g – l – e
然后逐个统计字母。
但像 Google Gemini、OpenAI GPT 等大型语言模型并非这样工作。
它们会先把文本转换成所谓的“Token(词元)”。一个 Token 可能是:
- 一个完整单词
- 一个词根
- 一个音节
- 几个字符的组合
例如,“Google”很可能被模型当作一个整体 Token,而不是六个独立字母。
因此对于模型来说:
Google = 某种语义编码
而不是:
G + o + o + g + l + e
加拿大 University of Alberta 的 AI 研究员 Matthew Guzdial 解释说,模型知道“The”这个词代表什么含义,却未必知道它由 T、H、E 三个字母组成。

为什么 AI 会写代码,却数不清字母?
这正是许多人觉得不可思议的地方。
AI 可以:
- 几秒钟生成 App
- 解决复杂数学问题
- 编写数百行程序
- 总结大量文档
却经常在数数和拼写上翻车。
原因在于:
语言模型本质上是“预测下一个最可能出现的词”。
它擅长发现海量文本中的统计规律,但并不真正理解文字的内部结构。
换句话说:
- “编程”属于模式识别问题;
- “统计单词里的字母数量”属于符号操作问题。
而后者恰恰不是 Transformer 架构最擅长的领域。
为什么这个问题很难彻底解决?
研究人员认为,这并不是简单修个 Bug 就能解决的问题。
因为 Token 化(Tokenization)本身就是现代 LLM 的基础架构。
来自 Northeastern University 的博士生 Sheridan Feucht 指出:
很难定义什么才是最完美的 Token 切分方式。
即使未来改进 Tokenizer,模型仍然可能继续把信息“打包”成更大的语义块,而不是回到逐字母处理模式。
因此,这类拼写和计数错误可能会长期存在。
真正值得关注的不是拼写
事实上,Google 已经修复了一些更严重的问题。
此前搜索“disregard”时,AI Overview 竟然把用户提示词误当成词典释义进行展示。
相比之下,把 “journalism” 拼错虽然搞笑,却不会直接误导用户。
真正的问题在于:
这些错误提醒我们,AI 并不是全知全能的。
当模型能流畅回答复杂问题时,人们很容易产生“它一定是对的”的错觉。
但实际上:
- AI 会幻觉(Hallucination)
- 会引用错误来源
- 会计算失误
- 会拼写错误
- 会编造事实
结语
Google AI Overview 的拼写翻车并不是偶然事故,而是当前大语言模型底层架构的天然局限。
这些系统在理解语义、生成内容方面已经达到惊人的水平,但在某些看似幼儿园级别的任务上仍可能失败。
AI 很强大,但不是权威。
无论是 Google、Gemini、ChatGPT,还是其他生成式 AI,最重要的使用原则始终没有改变:
把 AI 当作助手,而不是事实的最终裁判。








苏公网安备32021302001419号