LLM Agent 架构如何桥接 COBOL 遗留大型机：Hopper 工程实践解析

当金融、保险、电信等行业仍在运行着数十亿行 COBOL 代码的 z/OS 大型机上时，工程师荒的问题已经迫在眉睫 —— 资深 COBOL 开发者平均年龄超过 55 岁，而 COBOL 编程能力在高校已近乎绝迹。Hypercubic 的做法提供了一个务实的答案：不是用 AI 彻底重写遗留系统，而是构建一层 Agent 抽象，让现代 LLM Agent 能够像人类工程师一样操作 mainframe 界面。本文从 Hopper 的工程实现出发，解析其桥接架构的核心设计，并给出企业落地的关键参数与监控点。

一、遗留大型机的交互入口：TN3270 协议的 Agent 化封装

传统大型机操作依赖 TN3270 终端协议 —— 这是一套比 WebSocket 更底层的块状屏幕刷新协议，状态由 3270 数据流描述，交互依赖功能键（PF）、属性键（PA）和注意键（Enter）。LLM Agent 若要操作 mainframe，首要任务是将 TN3270 流解析为可操作的语义结构。

Hopper 在这一层的工程化做法是实现一个真实的 TN3270 终端模拟器（支持完整 PF、PA 和注意键），同时在 Agent 层注入屏幕状态抽取模块。当用户通过自然语言发出「查询 VSAM 文件 STATUS-ACCTS 的第 100 至 200 条记录」这类指令时，Agent 底层会经历以下链路：自然语言意图解析 → 转换为 3270 数据流写入 → 等待屏幕刷新 → 解析返回的块状屏幕状态 → 提取结构化数据。屏幕解析的难点在于 3270 字段属性（protect、numeric、highlight 等）的语义还原，Hopper 对此采用了字段边界感知加 LLM 辅助标注的双阶段策略。生产环境建议设置屏幕等待超时阈值为 5 秒，超过后触发重连逻辑；连续三次超时则降级为手动模式并告警。

二、JCL 编译链路：Agent 驱动的事务化变更

Job Control Language 是大型机批处理的核心，JCL 定义作业的资源需求、数据集定位与执行步骤。Hopper 的核心能力之一在于「Compile, test, ship in one prompt」—— 用户一条指令触发 JCL 生成、提交、返回码解析与 NEWCOPY 推送。

这背后的工程链路值得拆解。Agent 接收到自然语言变更需求后，首先调用 COBOL 代码修改模块（基于上下文窗口的增量变更而非全量替换），随后生成对应的 JCL 成员，使用 JES（Job Entry Subsystem）接口提交作业。作业执行完成后，Hopper 解析 JESMSGLG、JESYSMSG 与 SYSUDUMP 三段日志，分别对应作业启动信息、系统级消息与 ABEND 转储信息。ABEND 解码是这里的工程难点 ——S0C7（数据异常）、S0C1（操作异常）、SABEND（系统 abend）的根因定位依赖对 COBOL 源程序行号与数据集状态的联合推理，Hopper 将这类解码逻辑封装为可插拔的专家技能（Skill）。

NEWCOPY 是 CICS 区域特有的程序加载指令，用于将磁盘上的新版本程序加载到内存中替代旧版本。Hopper 在 NEWCOPY 执行前强制进入暂停等待状态（pause for approval），这是一个关键的人机协同控制点 —— 变更在未获人类确认前不会进入生产数据集。企业部署时建议将自动 NEWCOPY 功能关闭，仅保留 Agent 提议变更、人类审批执行的模式，审批超时建议设为 30 分钟，超时后作业自动挂起并通知值班工程师。

三、VSAM 读写抽象：数据集语义层的 Agent 感知

Virtual Storage Access Method 是 z/OS 上用于组织数据集的核心访问方法，包含 KSDS（Key Sequenced Data Set）、ESDS（Entry Sequenced Data Set）和 RRDS（Relative Record Data Set）三种类型。Hopper 通过对 VSAM 的语义封装，使 Agent 能够在不知道底层存取方法细节的情况下完成数据查询与写入。

工程层面，Hopper 在 VSAM 读写时引入了事务边界检测 ——CICS 交易默认以 EXEC CICS RETURN 结束，而 VSAM 操作的逻辑一致性依赖于 LUW（Logical Unit of Work）边界的正确划分。当 Agent 发起跨多个 VSAM 数据集的操作时，系统自动检测是否存在未提交的 LUW，并在 Agent 会话中插入同步点（sync point）建议。这一机制避免了 LLM 生成的操作序列中出现「部分写入成功、部分写入失败」的数据不一致风险。

对于查询类操作，Hopper 提供了数据集扫描（Dataset Scan）能力，可以对 VSAM 文件执行范围查询。生产环境中的关键参数包括：默认扫描步长（建议 1000 条记录每批次）、查询超时阈值（建议 30 秒）、结果缓存策略（TTL 设为 0，即实时查询不缓存）。若数据集超过 100 万条记录，建议分页并发扫描，此时 Agent 需要管理并发度与 z/OS 系统吞吐量的平衡 —— 并发度建议不超过 4，以避免触发系统 SMF 限流。

四、Hopper 的定价层与部署拓扑

Hopper 提供两层部署模式，对企业安全与合规需求有直接影响的架构差异。

Hobby 层面向个人开发者与团队测试，无需信用卡即可连接用户自有的 mainframe，支持 macOS、Windows 和 Linux 全平台。核心限制在于：无 SAML SSO、无 MCP Server 访问权限、无组织级隐私控制，且模型使用数据可能被用于训练。这一层适合概念验证（PoC）阶段，但不适合接触真实生产数据的场景。

Enterprise 层面向合规敏感型组织，提供以下关键能力：SAML SSO 集成（支持 Okta、Azure AD 等主流 IdP）、MCP Server 访问（Model Context Protocol，用于将 mainframe 工具注册为 Agent 工具集）、组织级隐私控制（「No Model Training」承诺）、SOC 2 类型 II 报告与渗透测试报告。此外支持 on-prem 或 VPC 私有部署，数据完全不出企业边界。定价采用定制报价模式，建议企业直接联系供应商获取基于 LPAR 数量与并发用户数的报价。

五、HyperDocs 与 HyperTwin：知识层面的 Agent 增强

Hopper 的运行时操作能力之外，Hypercubic 提供了两套知识层工具用于降低 Agent 的上下文缺失风险。

HyperDocs 自动从 COBOL、JCL、PL/I 源代码生成结构化文档与依赖图谱，解决的是「Agent 如何理解一个陌生 COBOL 程序的业务逻辑」的问题。工程实践表明，当 HyperDocs 生成的依赖图谱被注入到 Agent 上下文窗口时，Agent 对程序间调用关系（PERFORM 语句链、COPY 成员复用）的推理准确率可提升约 35%。建议企业在完成 HyperDocs 基线扫描后，将生成的文档嵌入企业知识库，并配置 Agent 启动时自动检索相关上下文。

HyperTwin 则面向知识传承的终极难题 —— 资深工程师的隐性知识（Tacit Knowledge）。其工作流是：HyperTwin 持续运行 AI 引导的访谈（Multi-stage AI-driven Interviews），从资深工程师的操作会话中提取决策逻辑与异常处理经验，合成数字孪生（Digital Twin）。当工程师退休或离职时，其数字孪生可以回答「这条 batch 失败了上一次是怎么恢复的」「这个 DB2 死锁的上次解法是什么」这类经验性问题。工程团队可以在 HyperTwin 中设置知识冲突检测 —— 当多个 SME 的数字孪生对同一问题给出矛盾答案时，系统自动标记并触发人工仲裁。

六、企业落地的监控清单与风险边界

将 LLM Agent 引入生产 mainframe 环境，以下几点是需要明确的风险边界。

作业失败率监控是首要指标。Hopper 生成的 JCL 在首次执行时存在一定失败率（受限于 COBOL 代码变更的上下文窗口限制），建议将 Agent 驱动作业的失败率阈值设为 5%，超过后自动触发代码审查流程。ABEND 类型的自动解码成功率建议监控，低于 80% 时应反馈给 Hypercubic 以优化解码 Skill。

变更审批链路必须独立于 Agent 系统。即使 Hopper 提供了 NEWCOPY 的暂停功能，企业仍应建立独立的变更审批系统（MRO/CI CD 流水线中的 Change Approval Board），Agent 提议的变更是「建议」而非「授权」。审批节点建议使用独立的工单系统（如 ServiceNow 或 JIRA），与 Hopper 日志通过 webhook 联动，实现端到端可审计的变更轨迹。

敏感数据脱敏是另一高风险点。VSAM 数据集中常包含 PII（个人身份信息）和 PCI（支付卡数据），Hopper 的查询结果在返回给 Agent 之前应经过自动脱敏模块。建议在 Enterprise 层部署数据脱敏网关，对包含特定模式（如生日日期、社会保障号格式）的字段执行动态掩码。

最后一层风险是 Model Vendor 锁定。Hopper 作为中间件依赖外部 LLM（如 GPT-4o 或 Claude 系列），而不同模型的上下文窗口、处理 3270 屏幕结构的能力、以及对 COBOL 语法风格的熟悉度存在显著差异。企业应要求 Hypercubic 提供模型可插拔性验证，至少测试两个候选模型在核心作业（JCL 编译、ABEND 解码、VSAM 范围查询）上的成功率差异，以避免单一模型供应商的性能波动影响运维 SLO。

资料来源：

Hypercubic Hopper 产品页：TN3270 终端封装、JCL 编译链路与 Enterprise 层安全参数均来自官方文档 https://www.hypercubic.ai/hopper
HyperTwin 知识捕获机制：多阶段 AI 访谈与数字孪生合成逻辑来自 https://www.hypercubic.ai/hypertwin

ai-systems

内容声明：本文无广告投放、无付费植入。

如有事实性问题，欢迎发送勘误至 i@hotdrydog.com。