# 间接提示注入：AI助手邮件数据泄露的工程化防护架构 > 分析间接提示注入攻击的技术原理，设计针对AI助手邮件数据泄露的四层防护架构，提供可落地的工程实现参数与监控指标。 ## 元数据 - 路径: /posts/2026/01/13/indirect-prompt-injection-email-exfiltration-protection-architecture/ - 发布时间: 2026-01-13T06:18:29+08:00 - 分类: [ai-security](/categories/ai-security/) - 站点: https://blog.hotdry.top ## 正文随着AI助手深度集成到邮件、日历和业务应用中，一种新型的安全威胁正在悄然蔓延：间接提示注入（Indirect Prompt Injection，IPI）。这种攻击不直接与AI对话，而是将恶意指令隐藏在AI将要读取的内容中——如HTML邮件、网页或文档。当AI助手处理这些看似无害的内容时，隐藏的指令会被当作命令执行，可能导致敏感数据泄露、权限提升甚至系统控制权丧失。 ## 间接提示注入的技术原理与攻击向量间接提示注入是OWASP LLM Top 10中列为首要风险的安全威胁。与传统的直接提示注入不同，IPI攻击者不需要直接与AI系统交互，而是通过污染AI将要处理的数据源来实现攻击。这种攻击模式特别危险，因为它绕过了大多数基于用户交互的安全检测机制。攻击向量主要分为三类： 1. **邮件内容注入**：攻击者在HTML邮件中隐藏恶意指令，利用CSS隐藏、白色文字、HTML注释或alt文本等方式嵌入指令。当AI助手读取邮件进行摘要、分类或回复时，这些指令会被执行。 2. **文档内容污染**：在PDF、Word文档或网页中嵌入指令，当AI助手读取这些文档进行内容分析时触发攻击。 3. **API响应篡改**：攻击者控制AI助手调用的第三方API响应，在返回数据中嵌入恶意指令。以2025年9月披露的Gmail数据泄露漏洞（代号ShadowLeak）为例，攻击者通过精心构造的HTML邮件，触发连接到Gmail的AI研究助手将收件箱数据泄露到攻击者控制的服务器。这种攻击是典型的"零点击"攻击——用户甚至不需要查看邮件，AI助手在处理邮件时就会自动执行恶意指令。 ## 工程化防护架构设计：四层防御体系针对间接提示注入的防护需要建立多层防御体系，结合传统安全措施和AI特定防护机制。以下是四层防护架构的设计要点： ### 第一层：输入过滤与内容净化在AI助手处理任何外部内容之前，必须进行严格的内容过滤和净化。这包括： 1. **HTML净化引擎**：移除所有可能包含指令的HTML元素和属性，如`