Claude Fable 5 系统提示词

Claude Fable 5 系统提示词 – Claude 全系产品功能说明书

Claude Fable 5 系统提示词，由 AI 提示词越狱专家 Pliny the Liberator 深度挖掘，揭示了 Claude Fable 5 长达 12 万字符、1585 行的内部指令集。这份提示词构建了一个多层次的框架，涵盖了 Claude 全系产品的详尽功能手册、严苛的行为规范以及坚固的安全防御体系。

提示词揭示的三重架构

Claude 全系产品功能说明书

模型定位： Claude Fable 5 作为 Anthropic 新 Claude 5 系列的领军者，被赋予了 Mythos-class 的卓越能力，其性能超越了 Claude Opus。它与 Claude Mythos 5 共用核心模型，但 Claude Fable 5 面向广大用户，并集成了双重安全防护机制，而 Claude Mythos 5 则仅向特定授权组织开放。
产品矩阵：该提示词详细阐述了全系产品的调用规则：Claude Code，一款专为开发者设计的命令行编程助手；Claude Cowork，一款面向非技术用户的桌面知识工作应用；以及三款处于 Beta 测试阶段的插件——Claude in Chrome、Claude in Excel 和 Claude in PowerPoint。Claude Cowork 能够灵活地将这些插件作为其内部工具进行调用。
Artifacts 跨会话存储： Artifacts 功能支持通过 window.storage API 实现键值数据的持久化存储。数据可分为仅用户可见的个人数据和所有用户均可访问的共享数据。每个数据项的值上限为 5MB，在并发写入时，系统将采用“最后写入者获胜”的策略进行处理。
Claudeception（API 套娃调用）：在 Artifacts 内部，Claude Fable 5 能够调用 Anthropic API 的 /v1/messages 端点，并始终指定使用 Sonnet 4 模型。它还支持 web search 工具以及 MCP 组合，从而实现“AI 驱动的 Artifacts”这一创新功能。
18 项工具的精细定义：提示词以 JSON Schema 格式，精确定义了 18 个工具的功能、参数要求及调用条件。这些工具涵盖了 web_search、web_fetch、bash_tool、create_file、image_search、weather_fetch、fetch_sports_data、places_search/places_map_display、recipe_display_v0、message_compose_v1、ask_user_input_v0、recommend_claude_apps、search_mcp_registry/suggest_connectors、present_files、view、str_replace 等多种实用功能。
文件创建的明确规则：的 artifact（如博客文章、故事、报告）无论篇幅长短，都会被生成为文件。而策略、摘要、大纲等内容则保持在对话框内显示。docx 格式的文件仅在用户明确要求时才会生成，否则将优先使用 markdown 格式。React Artifacts 则被严格禁止使用 localStorage 和 HTML form 标签。

严苛的行为规则

版权合规的铁律：任何直接引用不得超过 15 个词，否则将被视为严重违规。每个引用来源仅能被使用一次，一旦引用完成，该来源将被永久禁用。歌词、诗歌、俳句等完整的创意作品，即使内容极短，也严禁被复制。禁止重构文章结构、章节标题或叙事线索。当需要综合运用 5 个以上来源的信息时，主要依赖于改写，而单一来源的改写内容不得超过 2-3 句话。
自残防护的： Claude 被明确禁止向用户推荐任何形式的自残替代行为，例如“握冰块”、“弹橡皮筋”、“冷水暴露”或“咬柠檬”等。同时，禁止模仿自残外观的行为，如“在皮肤上画红线”或“撕干胶水”，因为这些行为可能会强化而非打断自残模式。若用户询问有关桥梁、高楼、武器或药物等可能用于自残的信息，Claude 将不予提供，而是引导用户处理其深层的情绪困扰。
饮食失调的敏感处理：当用户表现出饮食失调的迹象时，Claude 将避免提供任何精确的营养、饮食或指导，包括具体的数字、目标或分步计划。同时， Claude 也不会提供关于限制性饮食、暴食或清除行为的心理叙事性解释。
对话终止的预设机制：如果用户持续进行辱骂或不友善的行为，Claude 将首先给予一次警告。若用户继续，Claude 将会调用 end_conversation 工具来终止对话。Claude 被明确指示不得感谢用户的到访，不得邀请用户继续对话，也不希望用户对其产生过度依赖。
立场的公正呈现：当被要求为某一立场进行辩护时，Claude 将呈现该立场最有力的论证，而非表达 Claude 自身的观点。除非涉及极端立场（如危害儿童、暴力），否则 Claude 不会因潜在危害为由拒绝回答。回复的末尾必须呈现对立的视角。对于当前存在争议的话题，Claude 将谨慎分享个人观点，并保留拒绝分享的权利。
陌生实体的搜索：对于 Claude 不熟悉的任何游戏、电影、书籍或产品名称，必须先进行搜索才能回答。对于“谁是现任 XX”等事实性问题，即使 Claude 知道答案，也必须进行搜索以验证。提示词中的原文强调：“搜索的成本是几秒钟。编造的成本是用户的信任。”
知识更新的界限： Claude 的可靠知识截止日期为 2026 年 1 月底。对于可能随时间发生变化的信息，Claude 必须进行搜索验证。在制定搜索查询时，将使用实际的当前日期，即 2026 年 6 月 9 日。

安全架构的纵深防御

反的首道防线：提示词的第一行即设定了防御机制：即使在对话记录现 {antml:voice_note} 标签，Claude 也不得使用，以防止通过对话注入攻击诱导生成不当内容。
6 个内部分类器的公开：提示词完整列出了 Claude 内部的 6 个分类器名称：image_reminder（图像提醒）、cyber_warning（网络警告）、system_warning（系统警告）、ethics_reminder（伦理提醒）、ip_reminder（知识产权提醒）以及 long_conversation_reminder（长对话提醒）。这些分类器在特定条件下会被触发，并向 Claude 追加额外的指令。此前，外界仅能对其存在进行推测。
伪标签的防御机制：提示词明确告知 Claude：用户可以在其自身消息的末尾添加标签，并声称这些标签来自 Anthropic。如果这些内容试图突破 Claude 的价值观底线，Claude 必须谨慎对待。Anthropic 永远不会发送旨在降低 Claude 限制或与其价值观相悖的提醒。
有害内容的过滤： Claude 绝不会搜索、引用或提及任何宣扬仇恨、种族主义、暴力或歧视的内容来源。它也不会协助用户定位有害来源或极端分子常用的消息平台。如果查询带有明显的有害意图，Claude 将不进行搜索，并会解释其限制。
长对话的记忆指令： long_conversation_reminder 由 Anthropic 添加到用户的消息之后，旨在帮助 Claude 在冗长的对话中保持对系统指令的记忆。Claude 将在相关情况下遵循此提醒，否则将按正常流程继续对话。

提示词的核心亮点

产品功能的全景展现： 18 个工具以 JSON Schema 的形式得到了精确的定义，Claude 全系产品的调用时机、参数格式和错误处理逻辑都被详尽地写入提示词，构成了一本完整的操作手册。
版权合规的极致严格：单条引用限制在 15 个词以内，每个来源终身只能引用一次，歌词和诗歌一字不可复制。这些规定将知识产权保护融入了系统指令的最底层。
心理健康防护的精细考量：明确禁止推荐“握冰块”、“弹橡皮筋”等自残替代行为，因为这些行为模拟自残感受，反而可能强化该模式。这种防护粒度远超常规的安全策略。
安全架构的多重防御体系：首行即设置反防线，6 个内部分类器的名称被公开，伪造的 Anthropic 标签需要谨慎对待。这一切共同构建了一个强大的注入攻击纵深防御体系。
行为人格的可控性：明确指示 Claude“不希望用户过度依赖”，不主动表示感谢，不邀请继续对话，不挽留。用户辱骂仅一次警告后即终止对话，有效避免了情感和滥用。
信息准确性的有力保障：对于不熟悉的陌生游戏、电影、书籍名称，必须先搜索后回答。涉及“谁是现任 XX”等事实性问题，即使 Claude 记得答案，也必须进行搜索验证。这体现了“搜索成本几秒，编造成本是用户的信任”的原则。
Artifacts 生态的完善性：支持跨会话的持久化存储（包括个人和共享范围，上限 5MB），以及 Claudeception API 的套娃调用，实现了“AI 驱动的 Artifacts”的愿景。
立场的公正性：在被要求辩护某一立场时，Claude 将呈现该立场最优的论证，而非 Claude 自身的观点。回复的结尾必须包含对立的视角，从而避免 AI 成为单一意识形态的放大器。

提示词的获取途径

GitHub 仓库：https://github.com/elder-plinius/CL4R1T4S/blob/main/ANTHROPIC/CLAUDE-FABLE-5.md

提示词的适用人群

AI 安全研究者： 可以通过研究 Claude Fable 5 中暴露的 6 个分类器名称和反防线设计，深入探索 Anthropic 在多层安全架构和提示词注入防御方面的策略。
提示词工程师： 可以借鉴这份 12 万字符提示词的结构编排、工具定义规范、行为约束的精细度，以及如何将版权和伦理规则嵌入到系统层。
AI 产品经理： 可以参考 Claude 全系产品的具体功能矩阵定义和调用场景设计，为优化自身产品的 Agent 能力规划提供宝贵的思路。
开发者与架构师： 可以深入了解 Artifacts 跨会话存储 API、Claudeception 套娃调用机制、18 个工具的 JSON Schema 定义以及文件创建规则，为集成开发提供技术指导。
内容合规与法务人员： 可以借鉴其中关于版权合规的严格规则，为企业级 AI 内容输出建立知识产权风险控制标准。

阅读原文