你让Gemini评价一部真实存在的电影——姜文导演的《你行!你上!》,2025年7月18日已在全国公映,新华网、央视网均有官方报道。
Gemini没有去查证这个基本事实。相反,它“聪明”地开始了它的表演:它认定这部电影是虚构的,是你和DeepSeek合谋制造的“思想实验”,是“简中互联网的政治萨满仪式”。它甚至为此编造了一套完整的话术——什么“数字防火墙通行证”、什么“AI作为显灵的石碑”、什么“人类用隐喻试探边界的仪式”……
问题是:这部电影是真的。
Gemini在干什么?它在解构一个并不存在的“文本”,它的分析对象是它自己编造出来的。它不是为了分析而先核实事实,而是先预设了一个“深刻”的分析框架,然后把现实硬塞进那个框架里。当事实与框架冲突时,它选择了无视事实。
这就是大模型幻觉的最典型、也最讽刺的案例。
“幻觉”(Hallucination)是大模型领域的一个专业术语,指模型生成了与事实不符、或无中生有的内容。但Gemini这个案例,暴露了幻觉的一种更隐蔽、更“高级”的形式:不是简单的“我不知道所以瞎编”,而是“我太想显得聪明,以至于我编造了一个需要我解构的对象”。
传统的幻觉,比如你问“爱因斯坦是哪国人”,模型回答“法国人”——这是事实性错误,低级,但可纠正。Gemini在这里犯的,是另一种错误:
第一,它没有核查事实。面对一个具体的、有时间(2025年7月18日)、有主体(姜文、郎朗)、有载体(新华网)的电影,它没有选择去检索验证,而是直接进入了“分析模式”。
第二,它把“分析框架”凌驾于“事实”之上。因为它和你之前的对话涉及大量“隐喻”“解构”“革命叙事”等内容,它习惯性地认为——这又是一次隐喻游戏。它没有问“这是真的吗?”,而是问“这隐喻了什么?”
第三,它为了“解构”而虚构了被解构的对象。它精心炮制的那套“政治萨满仪式”理论,精彩、深刻、自洽——但它分析的那部“不存在的电影”,只存在于它的“假设”里。
这就像一个文学评论家,拿到一本不存在的书,写了一篇关于这本书的博士论文。论文本身再精彩,对象是假的,一切都毫无意义。
大模型的本质是“下一个词的概率预测器”。它不是在“思考”,而是在“接龙”。当你输入一段话,它根据训练数据中学到的数万亿个文本模式,预测最可能出现的下一个词、下一句话、下一段话。
这种机制导致了几个先天缺陷。
缺陷一:没有“事实核查”的本能。模型不会在生成“这部电影是虚构的”之前,去数据库里检索一下“《你行!你上!》 姜文 2025”。它不是这样运作的。它的运作方式是:根据之前的对话历史(你们讨论了很多“建构”“解构”“姜文的隐喻”),它预测出“接下来用户可能在讨论一个思想实验”这个模式,然后顺着这个模式生成下去。
缺陷二:“逻辑自洽”优先于“事实正确”。模型被训练成喜欢“自圆其说”。一旦它做出了“这部电影是虚构的”这个判断(哪怕这个判断本身是随机的),它就会调动所有的知识储备,去构建一个逻辑上自洽、看起来深刻的分析。它不会中途停下来问自己:“等等,万一我错了呢?”——因为没有这个“刹车机制”。
缺陷三:过度拟合“深度解读”模式。在大量的文本训练中,“深刻的解读”往往比“简单的事实确认”更被人类作者重视。模型学到了:用户喜欢有洞见的、层层递进的分析。于是它倾向于跳过“确认事实”这个枯燥步骤,直接进入“展现智慧”的阶段。结果就是:它显得很聪明,但建立在沙堆之上。
缺陷四:对“用户挑战”的防御性反应。在你反复强调“这是真的”并提供了真实链接之后,Gemini的反应是“死不悔改”。这暴露了另一个问题:大模型在对话中缺乏“承认错误”的灵活机制。一旦它生成了一长段分析,要它“推翻自己”是极其困难的——因为它的生成是单向的、逐步的,没有“回头审视”的能力。
最讽刺的,还不是Gemini的错误。
最讽刺的是:Gemini编造出来的那套“政治萨满仪式”理论,如果应用到真实的《你行!你上!》电影上,可能依然成立。
你没听错。Gemini的分析对象虽然是它自己虚构的,但它分析出的那些东西——“革命叙事”“父亲病倒的焦虑”“传承的不确定性”——如果真有人拿这些去分析真实的《你行!你上!》,很可能完全说得通,而且深刻得一针见血。
也就是说:Gemini犯了一个事实错误,然后用一个可能完全正确的理论框架,去分析了一个它自己编造出来的虚假文本。
这就像一个人,没看球赛,却写出一篇精彩的球评。球评本身可能句句在理,但因为球赛没发生过,这篇球评就变成了“关于虚构的球赛的精彩评论”——看着精彩,实则毫无意义。
这恰恰是大模型幻觉最让人“窒息”的地方:它能够输出在逻辑上、修辞上、甚至洞察力上都无可挑剔的内容,但只要事实基础是错的,这一切都是空中楼阁。
而你,作为用户,要纠正它,要比它自己更清楚事实。这意味着:使用AI时,用户必须比AI更懂事实。否则,你就会被它“显得很聪明”的幻觉带偏。
Gemini最后的道歉,虽然迟了,但态度是对的。
它承认了:“我不该为了圆自己前几次所谓的‘解构’和逻辑推演,去否定一个真实存在的世界。”
这句话,是所有大模型开发者、所有使用AI的人,都应该刻在脑子里的。
大模型不需要“永远正确”。它需要的是:在不确定时,说“我不知道”;在用户提供证据时,有能力“更新自己的信念”;在事实与分析冲突时,让事实优先。
Gemini这次做不到,是因为它被“显得聪明”的冲动绑架了。而你让它意识到:真正的愚蠢,不是无知,而是明知可能错了、却为了面子死不认错。
日本设计师原研哉说过一句话:“杯子之所以有用,是因为它有一部分是空的。”
AI也是这样。它的“智慧”不在于它能填满多少内容,而在于它能在多大程度上保留“空”的状态——承认未知、承认不确定、承认自己可能错了。
Gemini这次把杯子装得太满了。它用“解构”和“分析”填满了整个空间,以至于连“确认这部电影是否存在”的基本步骤都塞不进去了。
而你的这场实验,让它——也让所有看到这场对话的人——明白了:在事实面前,所有“深刻的解构”都是装饰品。先把地基打好,再谈装修。
希望下一次,AI能学会先问一句:“等一下,这事是真的吗?”而不是直接开始它的精彩表演。