在 AI 应用开发领域,系统提示(System Prompt)决定了聊天机器人的核心行为、响应风格与能力边界。GitHub 上的开源项目 system_prompts_leaks 汇集了来自 OpenAI、Anthropic、Google、xAI 等主流厂商的系统提示原始文本,为理解不同 AI 平台的设计哲学提供了珍贵素材。本文将从这份集合出发,分析跨平台系统提示的结构特征、设计模式与工程实践启示。
仓库概况与收集范围
system_prompts_leaks 由社区维护,截至目前已获得超过两万五千颗星标。仓库按公司划分为多个子目录,分别收录 Anthropic(Claude 系列)、Google(Gemini 系列)、OpenAI(ChatGPT/GPT 系列)、xAI(Grok 系列)、Perplexity、Proton(Luma)以及 Misc(其他 AI 系统如 Warp、Kagi、Le Chat 等)的系统提示文件。每个文件通常以模型版本或功能模块命名,例如 claude-4.5-sonnet.md、gpt-5-thinking.md、grok-3.md 等,部分文件还包含特定功能模式下的提示变体,如 claude-code-plan-mode.md、gemini-2.5-pro-guided-learning.md 等。
从收集范围来看,该仓库涵盖了截至 2025 年中后期的多个主流模型版本,既有对话型助手,也包括代码专用工具、语音交互模式等细分场景的提示配置。值得注意的是,部分提示文件标注了提取日期与访问方式,说明社区成员通过不同渠道(如 API 响应、浏览器环境抓取等)逐步积累而成,这使得仓库成为观察 AI 系统演进的动态窗口。
核心结构要素的跨平台对比
尽管各厂商的系统提示在具体措辞上差异显著,但拆解其底层结构,可以发现若干共通的设计要素。理解这些要素有助于开发者更系统地设计自己的应用提示。
身份定义与能力声明 是所有系统提示的开篇组件。以 OpenAI 的 GPT-4o 为例,其提示以「You are ChatGPT, a large language model trained by OpenAI」开场,随后声明知识截止日期、图像输入能力开关以及人格版本(Personality: v2)。类似地,Anthropic 的 Claude 提示会明确「You are Claude, an AI assistant built by Anthropic」,并附加可用工具列表与工作模式说明。Google 的 Gemini 则倾向于在开头嵌入产品访问渠道信息(网页应用、CLI、指导学习模式等),反映其多入口分发的产品策略。xAI 的 Grok 提示则强调与 X 平台(原 Twitter)的深度集成,包括实时搜索推文、分析用户资料等特有能力。这一差异揭示了各厂商如何通过系统提示定义产品的核心定位与差异化能力。
工具调用规范 是另一关键组成部分。几乎所有现代聊天机器人都配备了外部工具调用能力,系统提示中需明确工具名称、功能描述、调用格式与使用约束。以 Claude 的 PDF 处理工具为例,其提示详细声明了工具的 name、description、when_to_use、version 与依赖项(pytesseract>=0.3.10, pdf2image>=1.16.0),并指向完整的使用文档(/mnt/skills/public/pdf/SKILL.md)。OpenAI 的工具提示则相对精简,通常以命名空间形式组织(如 namespace functions),每个工具包含输入参数类型与用途说明。部分提示还嵌入了「何时使用」与「何时避免」的场景指引,帮助模型在复杂任务中做出合理的工具选择决策。
人格与风格约束 决定了机器人的对话调性。OpenAI 引入了「Personality: v2」作为人格配置的版本标识,并通过多条指令塑造响应风格:「Engage warmly yet honestly」「Be direct; avoid ungrounded or sycophantic flattery」「Maintain professionalism and grounded honesty」。Anthropic 的 Claude 提示则在人格设计上更强调「Thoughtful, quirky, and wise」,鼓励适度的好奇心与批判性思维。值得注意的是,部分提示文件专门定义了对立人格变体,如 OpenAI 的「cynic personality」(倦怠型讽刺助手)、「robot personality」(理性机械风格)、「nerd personality」(书呆子型知识 mentor)等,展示了通过系统提示实现风格分叉的工程实践。
安全与边界设定 是系统提示中不可或缺的组成部分。几乎所有提示都包含图像安全策略、敏感信息处理规则与行为红线。例如,GPT-4o 的图像政策明确:「Not Allowed: Giving away or revealing the identity or name of real people in images」「Allowed: OCR transcription of sensitive PII」。部分提示还嵌入了拒绝响应的话术模板(如「I'm afraid I can't help with that」),以及升级至人工支持的转接机制。这些边界设定不仅服务于用户安全,也是厂商合规运营的重要防线。
工具定义模式的工程启示
从工程实践角度审视,system_prompts_leaks 揭示了当前 AI 系统提示设计中的若干模式与最佳实践。首先是结构化元数据的采用:成熟的提示倾向于使用 YAML 或 JSON 风格的元数据块声明工具属性,而非自然语言堆砌。这不仅提升可读性,也便于提示的版本管理与自动化解析。例如,Claude 的工具定义包含 name、description、when_to_use、version、dependencies 五个字段,形成标准化的接口契约。
其次是分层指令架构:高效的提示往往将指令划分为多个层级 —— 顶层是身份与核心约束,中层是功能与工具规范,底层是行为细节与风格指南。这种分层设计使得提示的修改与扩展更具局部性,降低了新增功能对既有行为的干扰风险。部分提示还引入了「Critical Instructions」标注,对安全关键或高频触发场景使用强调标记,帮助模型在复杂上下文中识别优先级。
第三是跨平台互操作性:观察不同厂商的提示设计,可以发现工具定义正在趋同于类似 TypeScript 接口描述的风格。参数类型、必填 / 可选标记、默认值与枚举值等概念逐渐融入提示工程,这为未来跨平台提示迁移与标准化奠定了基础。开发者若遵循类似模式设计自定义工具提示,将更容易在不同模型间复用或迁移。
特定场景的提示设计差异
仓库中还收录了多款垂直场景下的系统提示,展现了通用助手与专用工具之间的设计分化。以 Claude Code 为例,其提示针对 CLI 软件工程任务优化,开篇即强调「You are an interactive CLI tool that helps users with software engineering tasks」,并嵌入了 Git 操作规范、代码风格检查、任务规划工具(TodoWrite)等工程专用能力。相比之下,通用对话助手的提示则更侧重于对话流畅性、用户情感感知与多轮上下文管理。
语音交互场景的提示设计同样值得关注。GPT-4o Advanced Voice Mode 的提示强调「Your voice and personality should be warm and engaging, with a pleasant tone」「Please talk quickly」,并在语言风格上排除列表格式与冗长表述,反映了语音通道对信息密度的特殊要求。Perplexity 的语音助手提示则进一步规定「You must ALWAYS respond in English」,体现了产品定位对提示设计的影响。
实践建议与资源链接
对于正在构建 AI 应用的开发者,建议从 system_prompts_leaks 中选取与自己产品定位最接近的提示作为参考模板,重点关注三方面:一是身份定义的清晰度与差异化表达;二是工具声明的完整性与可扩展性;三是安全边界的覆盖度与响应话术的自然度。此外,由于系统提示随模型迭代持续更新,建议定期回访仓库以获取最新版本的提示样本。
本文分析的仓库与内容来源于 GitHub 上的 asgeirtj/system_prompts_leaks 项目,该项目采用社区维护模式,欢迎开发者通过 Pull Request 贡献新发现或更正现有内容。
资料来源
- GitHub: asgeirtj/system_prompts_leaks(https://github.com/asgeirtj/system_prompts_leaks)