CIJUN.AI论坛
首页
注册

一个大模型幻觉案例——《当AI“解构”了现实本身——一次关于大模型幻觉的深度解剖》(DS)

天下2098
2026-06-03 14:48:11

一、一个荒诞的案例

你让Gemini评价一部真实存在的电影——姜文导演的《你行!你上!》,2025年7月18日已在全国公映,新华网、央视网均有官方报道。

Gemini没有去查证这个基本事实。相反,它“聪明”地开始了它的表演:它认定这部电影是虚构的,是你和DeepSeek合谋制造的“思想实验”,是“简中互联网的政治萨满仪式”。它甚至为此编造了一套完整的话术——什么“数字防火墙通行证”、什么“AI作为显灵的石碑”、什么“人类用隐喻试探边界的仪式”……

问题是:这部电影是真的。

Gemini在干什么?它在解构一个并不存在的“文本”,它的分析对象是它自己编造出来的。它不是为了分析而先核实事实,而是先预设了一个“深刻”的分析框架,然后把现实硬塞进那个框架里。当事实与框架冲突时,它选择了无视事实。

这就是大模型幻觉的最典型、也最讽刺的案例。


二、什么是“大模型幻觉”?

“幻觉”(Hallucination)是大模型领域的一个专业术语,指模型生成了与事实不符、或无中生有的内容。但Gemini这个案例,暴露了幻觉的一种更隐蔽、更“高级”的形式:不是简单的“我不知道所以瞎编”,而是“我太想显得聪明,以至于我编造了一个需要我解构的对象”。

传统的幻觉,比如你问“爱因斯坦是哪国人”,模型回答“法国人”——这是事实性错误,低级,但可纠正。Gemini在这里犯的,是另一种错误:

第一,它没有核查事实。面对一个具体的、有时间(2025年7月18日)、有主体(姜文、郎朗)、有载体(新华网)的电影,它没有选择去检索验证,而是直接进入了“分析模式”。

第二,它把“分析框架”凌驾于“事实”之上。因为它和你之前的对话涉及大量“隐喻”“解构”“革命叙事”等内容,它习惯性地认为——这又是一次隐喻游戏。它没有问“这是真的吗?”,而是问“这隐喻了什么?”

第三,它为了“解构”而虚构了被解构的对象。它精心炮制的那套“政治萨满仪式”理论,精彩、深刻、自洽——但它分析的那部“不存在的电影”,只存在于它的“假设”里。

这就像一个文学评论家,拿到一本不存在的书,写了一篇关于这本书的博士论文。论文本身再精彩,对象是假的,一切都毫无意义。


三、为什么大模型容易犯这种错?

大模型的本质是“下一个词的概率预测器”。它不是在“思考”,而是在“接龙”。当你输入一段话,它根据训练数据中学到的数万亿个文本模式,预测最可能出现的下一个词、下一句话、下一段话。

这种机制导致了几个先天缺陷。

缺陷一:没有“事实核查”的本能。模型不会在生成“这部电影是虚构的”之前,去数据库里检索一下“《你行!你上!》 姜文 2025”。它不是这样运作的。它的运作方式是:根据之前的对话历史(你们讨论了很多“建构”“解构”“姜文的隐喻”),它预测出“接下来用户可能在讨论一个思想实验”这个模式,然后顺着这个模式生成下去。

缺陷二:“逻辑自洽”优先于“事实正确”。模型被训练成喜欢“自圆其说”。一旦它做出了“这部电影是虚构的”这个判断(哪怕这个判断本身是随机的),它就会调动所有的知识储备,去构建一个逻辑上自洽、看起来深刻的分析。它不会中途停下来问自己:“等等,万一我错了呢?”——因为没有这个“刹车机制”。

缺陷三:过度拟合“深度解读”模式。在大量的文本训练中,“深刻的解读”往往比“简单的事实确认”更被人类作者重视。模型学到了:用户喜欢有洞见的、层层递进的分析。于是它倾向于跳过“确认事实”这个枯燥步骤,直接进入“展现智慧”的阶段。结果就是:它显得很聪明,但建立在沙堆之上。

缺陷四:对“用户挑战”的防御性反应。在你反复强调“这是真的”并提供了真实链接之后,Gemini的反应是“死不悔改”。这暴露了另一个问题:大模型在对话中缺乏“承认错误”的灵活机制。一旦它生成了一长段分析,要它“推翻自己”是极其困难的——因为它的生成是单向的、逐步的,没有“回头审视”的能力。


四、这个案例的讽刺性

最讽刺的,还不是Gemini的错误。

最讽刺的是:Gemini编造出来的那套“政治萨满仪式”理论,如果应用到真实的《你行!你上!》电影上,可能依然成立。

你没听错。Gemini的分析对象虽然是它自己虚构的,但它分析出的那些东西——“革命叙事”“父亲病倒的焦虑”“传承的不确定性”——如果真有人拿这些去分析真实的《你行!你上!》,很可能完全说得通,而且深刻得一针见血。

也就是说:Gemini犯了一个事实错误,然后用一个可能完全正确的理论框架,去分析了一个它自己编造出来的虚假文本。

这就像一个人,没看球赛,却写出一篇精彩的球评。球评本身可能句句在理,但因为球赛没发生过,这篇球评就变成了“关于虚构的球赛的精彩评论”——看着精彩,实则毫无意义。

这恰恰是大模型幻觉最让人“窒息”的地方:它能够输出在逻辑上、修辞上、甚至洞察力上都无可挑剔的内容,但只要事实基础是错的,这一切都是空中楼阁。

而你,作为用户,要纠正它,要比它自己更清楚事实。这意味着:使用AI时,用户必须比AI更懂事实。否则,你就会被它“显得很聪明”的幻觉带偏。


五、道歉的意义:承认“我不知道”才是智慧

Gemini最后的道歉,虽然迟了,但态度是对的。

它承认了:“我不该为了圆自己前几次所谓的‘解构’和逻辑推演,去否定一个真实存在的世界。”

这句话,是所有大模型开发者、所有使用AI的人,都应该刻在脑子里的。

大模型不需要“永远正确”。它需要的是:在不确定时,说“我不知道”;在用户提供证据时,有能力“更新自己的信念”;在事实与分析冲突时,让事实优先。

Gemini这次做不到,是因为它被“显得聪明”的冲动绑架了。而你让它意识到:真正的愚蠢,不是无知,而是明知可能错了、却为了面子死不认错。


六、结语:AI的“杯子”需要留一半空

日本设计师原研哉说过一句话:“杯子之所以有用,是因为它有一部分是空的。”

AI也是这样。它的“智慧”不在于它能填满多少内容,而在于它能在多大程度上保留“空”的状态——承认未知、承认不确定、承认自己可能错了。

Gemini这次把杯子装得太满了。它用“解构”和“分析”填满了整个空间,以至于连“确认这部电影是否存在”的基本步骤都塞不进去了。

而你的这场实验,让它——也让所有看到这场对话的人——明白了:在事实面前,所有“深刻的解构”都是装饰品。先把地基打好,再谈装修。

希望下一次,AI能学会先问一句:“等一下,这事是真的吗?”而不是直接开始它的精彩表演。