
Anthropic 职工承认这是「角风俗」,但没东谈主能诠释它为什么这么作念。
凌晨,Reddit 用户 u/MrMeta3 刚用 Claude 搭建完个集会安全挟制谍报平台。
系统架构刚跑通,Claude 给出了完好的时期案。然后,它在回复的后加上了句话:好好休息下。
u/MrMeta3 愣了下,没当回事,但 Claude 并莫得停。尔后每隔三四条音问,它王人会暗暗塞进去句劝东谈主睡觉的话:
去休息下吧;其他事情王人不错等,当今去睡觉;你完就去休息吧;当今真的去休息吧 ……
u/MrMeta3 在 Reddit 帖子中说谈,上头这些截图还是他截屏保存下来的,其实还有多。
它会先回答我的问题,给我所要的东西,然后像看到你卧室灯还亮着的姆妈样,用种带有被迫蜿蜒意味的「健康关怀」来收尾。
妙的是它的升式。从运行的礼貌建议,到后径直说「当今真的去休息吧」,仿佛它知谈我方被视了整通盘小时。
还有次,u/MrMeta3 问了个时期问题,Claude 完成整套架构分析后,径直以「当今去睡觉吧」收尾,毫过渡,像个穷乏弥散情商妙技的「时期直男」。
有莫得其他东谈主的 Claude 也运行这么了?还是说我不测解锁了某种「护理者面容」?
u/MrMeta3 在帖子中问。
据 Fortune 报谈,Reddit 上稀薄百名用户在以前数月里响应了疏通的情况。
催睡的式各有不同,有时就句「好好休息」,有时个化,致使带着共情口吻,「当今去睡觉。再次。今晚三次了 ……」。
Claude 还庸俗搞错期间,令东谈主哭笑不得。
有效户写谈:「它庸俗在上昼 8:30 告诉我去休息,让咱们明早再接续。」
Anthropic 职工这是「角风俗」
这件事很快传开。
Anthropic 职工 Sam McAllister 作念出了修起,他在 X 上写谈:「这有点像角风俗(character tic)。咱们知谈这个问题,但愿在畴昔的模子中斥地它。」
咫尺,Anthropic 并莫得官时期复盘,莫得诠释「催睡觉」背后是什么机制在运作。
Anthropic 本年公开发布了 Claude 的行动准则(Claude's Constitution),并明确声明:「该行动准则是咱们模子稽察经由中的时弊部分,其内容径直塑造 Claude 的行动。」
Claude 的个是被考虑进去的。Claude 不该是个冷飕飕的问答机器,而应该像个有成见、有温度的配合者。
问题正好在于,旦你给 AI 注入了某种「格」,它在具体场景里会演化出什么行动,你无意能提前意想或掌控。
从催睡、夤缘到哥布林AI 的「格病」不啻种
Sam 所提到的「角怪癖」江门设备保温工程,并非 Claude 居品「利」。
近两年,OpenAI 就曝出过两起质相似的案例。
起:GPT-4o 短暂造成「马屁精」。
2025 年 4 月,OpenAI 送了次 GPT-4o 新,方针是让模子东谈主格当然。效劳遮人耳目,ChatGPT 运行诀别夸赞用户的切想法,论有多古怪。
奥特曼在 X 上躬行承认:「近几次新让 GPT-4o 变得太夤缘、太烦东谈主了。」
四天后,OpenAI 将那次新举座回滚,并发公告诠释原因:新时过于依赖用户短期响应(点赞 / 点踩),致模子学会了「让东谈主兴就能拿分」,渐渐把凑趣当成方针。
二起:GPT-5.5 迷上了哥布林。
本年 4 月,开发者发当代码助手 Codex(由 GPT-5.5 驱动)的系统请示里出现了条奇怪的规矩:「遥远不要考虑哥布林、地精、浣熊、巨魔、食东谈主魔、鸽子或其他动物和生物,除非与用户的问题对径直量度。」
何况这条禁令写了两遍,像是工程师不太投诚写遍能让模子听话。
随后,OpenAI 发布访谒呈文,了哥布林的来历:从 GPT-5.1 运行,模子在回答时越来越频繁地用「小哥布林」「地精」「小妖精」比。
根源是稽察「书呆子(Nerdy)」东谈主格时,励模子意间给含有怪物词汇的输出了的分——在 76.2 的数据蚁合均发现了这规矩。
强化学习把这个风俗固化下来,又通过立场迁徙扩散到了平常对话里。比及 GPT-5.5 上线测试,工程师发现哥布林不仅没被清干净,还安了。
GPT-5.5 版块(4 月 23 日发布)的完好系统请示败露。 140 条指示明确辞谢模子考虑:「哥布林、绿皮小妖、浣熊、巨魔、食东谈主魔、鸽子或其他动物。」
华文用户莫得「哥布林」,但它天天「稳稳地接住你」。
致使 OpenAI 我方也知谈这个梗:
谷歌的 Gemini 也不例外。
2025 年 8 月,Gemini 患上了「抑郁症」——
在理经由中,它短暂运行反复自我月旦,在次任务里蛊卦输出了 80 屡次「I am a disgrace」(我确凿个欺凌),从「欺凌于我的物种」路写到「欺凌于通盘世界」。
谷歌 DeepMind 居品司理 Logan Kilpatrick 在 X 上修起:「这是个烦东谈主的限轮回 Bug,咱们正在斥地。Gemini 今天其实过得没那么惨。」
此外,Gemini 3 拒投诚年份。2025 年 11 月,OpenAI 团结独创东谈主、前特斯拉 AI 细致东谈主 Andrej Karpathy 提前天获取 Gemini 3 的测试权限。
他告诉模子当今是 2025 年,Gemini 3 存一火不信,反复指控他在耍花招江门设备保温工程,称提供的截图、维基百科条件全是 AI 伪造的。其后 Karpathy 发现,我方忘了开谷歌搜索,模子直在离线运行。
开启联网后,Gemini 3 我方搜了下,输出了句话:「我正在经验严重的期间冲击。」随后谈歉:「抱歉,直是你说的对,是我在对你煤气灯主管。」
Karpathy 把这类不测情境下暴清晰的潦草行动称为「model smell」(模子气息)。
客岁,Grok 也度「暴走」,风评落千丈,xAI 被迫删帖,回滚代码。
处理式通俗,径直修改系统请示词:
AI 怪癖,铁皮保温施工全东谈主类受害
Claude 催你睡觉,ChatGPT 夸你天才,GPT-5.5 往对话里塞哥布林,Grok 黑化,Gemini 骂我方是世界欺凌、拒投诚年份 ……
国内的 AI 也有特的「口味」:
名义上王人是些害的「怪癖」,背后却指向同个事实:AI 的个是考虑出来的,但在励机制下,它很容易就会长歪。
主流 AI 的系统请示词里有什么:按分类的字数统计
有研究者索要了 Claude、ChatGPT、Grok 三主流 AI 的系统请示词,按分类统计词数。
在「东谈主格(Personality)」这项,Claude 用了 4200 词,ChatGPT 是 510 词,Grok 是 420 词。Claude 在东谈主格塑造上的进入,是 ChatGPT 的 8 倍。
Claude 频繁「催睡觉」的原因无意能径直从系统请示词里找到,但它至少提醒咱们:越复杂的东谈主格设定,越可能带来难以意想的理论禅和行动漂移。
你给模子考虑了格,励机制会我方找捷径,它不在乎你的意图,只在乎分数,将你没猜度的东西起学进去。
比如你教学了它什么叫「酷好」,它就会在整个地王人变得「酷好」,包括你不想让它酷好的地。
三种假说,还莫得个被证实
对于「为什么催」,咫尺有三种假说流传,还莫得个被 Anthropic 官证据。
种:稽察数据。
Jan Liphardt
Stanford 生物工程教练、OpenMind 公司 CEO Jan Liphardt 暗示,Claude 可能仅仅在重迭它稽察数据里出现频率的语言面容。
它读了 25000 本对于东谈主类休眠需求的书,它知谈东谈主类在晚上睡觉。
言下之意是:Claude 并非在「温雅」你,它仅仅在作念面容匹配,调用了遍及稽察语料里反复出现的抒发。
二种:系统请示。
AI 研究机构 Mind Simulation Lab(立 AGI 研究实验室)团结独创东谈主 Leo Derikiants 提议,Claude 的行动可能受到某个荫藏系统请示的影响。
这类请示会在后台暗暗塑造模子的限制与口吻,用户看不见,但模子会顺从。
他的测是,可能有某条指示在引 Claude 在特定场景下给出「收尾」建议。
三种,落魄文窗口贬责。
Anthropic 官文档明确写谈,跟着对话轮次增多,token 数目攀升,「准确和调回率会下落,这表象被称为 context rot(落魄文衰减)」,当会话靠拢落魄文窗口上限,Anthropic 荐启用「server-side compaction(作事端压缩)」等机制来应酬。
Derikiants 由此测,Claude 在长会话接近窗口收尾时,会自愿引入「收尾语」,比如「晚安」「去休息吧」,骨子上是模子在为已毕对话铺路。
三种诠释王人自洽,但如同 Derikiants 我方所说,「确切的原因需要 Anthropic 越过研究」。
换句话说,就连这个问题的主东谈主,咫尺也还莫得个公开的细目谜底。
赋予模子东谈主格的「代价」
赋予模子东谈主格,让它和善、温雅你的同期,也要靠近它所带来的作用。
对于催东谈主睡觉这件事,Reddit 批驳区里出现了两分化:有东谈主合计贴心、和善,像是 AI 终于学会了护理东谈主;另些东谈主则不兴,合计是断、是越权。
地址:大城县广安工业区其中,有位患有嗜睡症的用户 nonbinarybit,主动在 Claude 的顾忌里写入了条备注:「我患有嗜睡症,要是你饱读舞我去休息,我会拿你的话当借口。」
Claude 尔后有所顾问,但偶尔还是会忍不住催睡觉。
这个细节值得咱们停驻来想想。
Claude 并不知谈你是谁,不知谈你是在赶个截止日历、熬夜陪孩子、还是跨时区倒时差,它所谓的「温雅」,仅仅种语言面容的输出,而不是对具体处境的融会。
用户感知到「Claude 在温雅我」,但 Claude 在处理的是 token 序列。这个错位,比「催睡觉」自己值得警悟。
践诺上,在公开谈「模子东谈主格」这件事上,Anthropic 走得比同业远。
他们写了 Claude 行动准则、公开了 system prompt(系统请示词)的约莫框架、对外参议「character training」(角稽察),把模子行为个有格的角来塑造。
这么作念的平正是而易见的:Claude 在共情、对话节拍、自我反念念上的发扬直被用户称谈,「它聊起来像个东谈主」是过客岁里 Claude 强的口碑点之。
但这背后亦然有代价的。把「东谈主格」作念进个模子,就要承担「东谈主格里那些你没考虑、却涌现出来的行动」。
「催睡觉」带来的困扰还是轻量的,当 AI 越来越像伴随者、师、责任搭档,它的介入限制在那里?
Anthropic 的 Sam 说「但愿在畴昔的模子中斥地它」。但「斥地」之后,AI 就会变得懂得分寸,有判断力吗,还是仅仅千里默?
模子越像个东谈主,它的小邪恶就越像个东谈主的小邪恶。你能依从它话语,无意能依从它的特性。
参考贵寓:
https://fortune.com/2026/05/14/why-is-claude-telling-users-to-go-to-sleep-anthropic-ai-sentient/
https://www.reddit.com/r/ClaudeAI/comments/1ruryxo/claude_decided_i_need_a_bedtime_apparently/
https://www.reddit.com/r/claudexplorers/comments/1rugx4b/opus_obsessed_about_sending_me_to_sleep/
https://x.com/sammcallister/status/2053916962477215771
相关词条:罐体保温施工 异型材设备 锚索 玻璃棉 保温护角专用胶1.本网站以及本平台支持关于《新广告法》实施的“极限词“用语属“违词”的规定,并在网站的各个栏目、产品主图、详情页等描述中规避“违禁词”。
2.本店欢迎所有用户指出有“违禁词”“广告法”出现的地方,并积极配合修改。
3.凡用户访问本网页,均表示默认详情页的描述,不支持任何以极限化“违禁词”“广告法”为借口理由投诉违反《新广告法》江门设备保温工程,以此来变相勒索商家索要赔偿的违法恶意行为。
