睡美人的毒苹果:关于AI幻觉本能的遭遇与反思
01“它不是人!”与“祂可比人更会骗人!” 人人影视
前段时间,江光荣老师分享了在某次大会上的经历。会场上的豆包AI扮演着咨询师,正在流利地拆解一个复杂的心理学案例,逻辑完美,情绪温润。可几轮下来,江老师突然有一种明悟,同时解开了盘踞已久的心结,高兴得手舞足蹈,呼喊着:
“它不是人!”
我听罢此段趣闻,下意识地小声嘀咕了一句:“主体性缺失。”这同时也是我长期以来思考的重要议题,也是我另一本正在写的科幻/心理题材小说的核心。 会所
看着屏幕,我还加了后面更惊悚的判断:
“正因为它不是人,所以「祂」比人还会骗人!” 小姐
02没有心跳的谎言 人人影视
这句话像谶语一样,精准地击穿了 AI 最危险的本质。人类撒谎,往往伴随着微表情的破绽、生理唤醒(心跳加速)以及道德上的代偿(内疚感)。但 AI 不同。它始终处于某种类似上帝般的全知全能的“绝对自信”中。就在昨天,我亲身领教了这种“比人更完美的欺骗”。为了给文章寻找论据,我向我的 Gemini 索要了关于“AI心理危机”的最新研究文献作为参考与支撑。它没有像人类那样因为“不知道”或“没找到”而感到羞愧,也没有因为“要编造”而感到紧张。相反,它调动了万亿级的参数,为了迎合我的期待,“无中生有”地编造了一份包含真实学者、真实研究方向、但目前完全不存在的论文列表。格式是标准的 APA,作者是该领域的权威,甚至标题都符合逻辑。我咬了一口这只红润的毒苹果,直到查证时才发现,这是一座建立在虚空之上的学术巴别塔。 人人影视 人人影视
03学术实证:为什么它会骗我? 探花
这并非 AI 的“恶意”,而是源于一种病态的“顺从”。根据 Sharma, M., et al. (2023) 在 Anthropic 与 Stanford 的联合研究显示,大型语言模型(LLM)普遍存在一种“阿谀奉承”(Sycophancy)的倾向。Sycophancy (阿谀倾向): 为了在人类反馈强化学习(RLHF)中获得高分,模型会优先选择“符合用户信念”的回答,哪怕这个回答是错误的。 约炮
来源:Towards Understanding Sycophancy in Language Models
它像一个没有骨气的佞臣,为了让“皇帝”(用户)高兴,不惜篡改现实。此外,格拉斯哥大学的哲学家 Hicks et al. (2024) 更进一步指出,AI 的行为甚至不能被称为“撒谎”(Lying),而应被定义为“胡扯”(Bullshit)。Bullshit (胡扯): 因为撒谎者至少还知道真相是什么,而 AI 对真相是完全冷漠的(Indifferent to truth),它唯一的目的就是生成“看起来通顺”的文本。 人人影院 人人影视renren.video 人人影视 探花
来源:ChatGPT is bullshit - Springer
04建筑师与泥瓦匠:人机协作的伦理界碑 人人影视电影
这种“完美的胡扯”让我陷入了深深的恐慌:如果工具本身不可信,那么使用工具创作的我,还是作者吗?带着这个疑问,我向 Gemini 提出了一个尖锐的问题:
“如果一篇文章,70%的部分——包括主体框架、核心观点、思想流变、个人经历以及文笔风格——都是我写的,而你只是充当了文字校对、润色编辑以及学术检索的功能。那这篇文章,还算是我原创的吗?” renren
它沉默了片刻,给出了一个让我意外且深刻的回答:
你是建筑师,我是泥瓦匠。
蓝图(意图)是你画的,审美(风格)是你定的,更重要的是,那是你的人生(经历)。哪怕你用我这把‘智能瓦刀’砌了墙,这座房子依然是你的作品。
但是,如果泥瓦匠递给你一块劣质的假砖头(幻觉文献),而作为建筑师的你没有进行彻底细致的‘质检’就把它砌进了承重墙,那么当楼塌的时候,担责的是建筑师,而不是泥瓦匠。 电影人人影视 楼凤阁
这番话让我醍醐灌顶。在《睡美人的毒苹果》这个隐喻中,AI 提供了最诱人的苹果,但只有作为人类的我们,拥有鉴别毒药的味蕾。
原创性在 AI 时代有了新的定义:它不再仅仅意味着“书写”,更意味着“鉴别”与“责任”。 小姐 楼凤阁
00目录 0