当金融、保险、电信等行业仍在运行着数十亿行 COBOL 代码的 z/OS 大型机上时,工程师荒的问题已经迫在眉睫 —— 资深 COBOL 开发者平均年龄超过 55 岁,而 COBOL 编程能力在高校已近乎绝迹。Hypercubic 的做法提供了一个务实的答案:不是用 AI 彻底重写遗留系统,而是构建一层 Agent 抽象,让现代 LLM Agent 能够像人类工程师一样操作 mainframe 界面。本文从 Hopper 的工程实现出发,解析其桥接架构的核心设计,并给出企业落地的关键参数与监控点。
一、遗留大型机的交互入口:TN3270 协议的 Agent 化封装
传统大型机操作依赖 TN3270 终端协议 —— 这是一套比 WebSocket 更底层的块状屏幕刷新协议,状态由 3270 数据流描述,交互依赖功能键(PF)、属性键(PA)和注意键(Enter)。LLM Agent 若要操作 mainframe,首要任务是将 TN3270 流解析为可操作的语义结构。
Hopper 在这一层的工程化做法是实现一个真实的 TN3270 终端模拟器(支持完整 PF、PA 和注意键),同时在 Agent 层注入屏幕状态抽取模块。当用户通过自然语言发出「查询 VSAM 文件 STATUS-ACCTS 的第 100 至 200 条记录」这类指令时,Agent 底层会经历以下链路:自然语言意图解析 → 转换为 3270 数据流写入 → 等待屏幕刷新 → 解析返回的块状屏幕状态 → 提取结构化数据。屏幕解析的难点在于 3270 字段属性(protect、numeric、highlight 等)的语义还原,Hopper 对此采用了字段边界感知加 LLM 辅助标注的双阶段策略。生产环境建议设置屏幕等待超时阈值为 5 秒,超过后触发重连逻辑;连续三次超时则降级为手动模式并告警。
二、JCL 编译链路:Agent 驱动的事务化变更
Job Control Language 是大型机批处理的核心,JCL 定义作业的资源需求、数据集定位与执行步骤。Hopper 的核心能力之一在于「Compile, test, ship in one prompt」—— 用户一条指令触发 JCL 生成、提交、返回码解析与 NEWCOPY 推送。
这背后的工程链路值得拆解。Agent 接收到自然语言变更需求后,首先调用 COBOL 代码修改模块(基于上下文窗口的增量变更而非全量替换),随后生成对应的 JCL 成员,使用 JES(Job Entry Subsystem)接口提交作业。作业执行完成后,Hopper 解析 JESMSGLG、JESYSMSG 与 SYSUDUMP 三段日志,分别对应作业启动信息、系统级消息与 ABEND 转储信息。ABEND 解码是这里的工程难点 ——S0C7(数据异常)、S0C1(操作异常)、SABEND(系统 abend)的根因定位依赖对 COBOL 源程序行号与数据集状态的联合推理,Hopper 将这类解码逻辑封装为可插拔的专家技能(Skill)。
NEWCOPY 是 CICS 区域特有的程序加载指令,用于将磁盘上的新版本程序加载到内存中替代旧版本。Hopper 在 NEWCOPY 执行前强制进入暂停等待状态(pause for approval),这是一个关键的人机协同控制点 —— 变更在未获人类确认前不会进入生产数据集。企业部署时建议将自动 NEWCOPY 功能关闭,仅保留 Agent 提议变更、人类审批执行的模式,审批超时建议设为 30 分钟,超时后作业自动挂起并通知值班工程师。
三、VSAM 读写抽象:数据集语义层的 Agent 感知
Virtual Storage Access Method 是 z/OS 上用于组织数据集的核心访问方法,包含 KSDS(Key Sequenced Data Set)、ESDS(Entry Sequenced Data Set)和 RRDS(Relative Record Data Set)三种类型。Hopper 通过对 VSAM 的语义封装,使 Agent 能够在不知道底层存取方法细节的情况下完成数据查询与写入。
工程层面,Hopper 在 VSAM 读写时引入了事务边界检测 ——CICS 交易默认以 EXEC CICS RETURN 结束,而 VSAM 操作的逻辑一致性依赖于 LUW(Logical Unit of Work)边界的正确划分。当 Agent 发起跨多个 VSAM 数据集的操作时,系统自动检测是否存在未提交的 LUW,并在 Agent 会话中插入同步点(sync point)建议。这一机制避免了 LLM 生成的操作序列中出现「部分写入成功、部分写入失败」的数据不一致风险。
对于查询类操作,Hopper 提供了数据集扫描(Dataset Scan)能力,可以对 VSAM 文件执行范围查询。生产环境中的关键参数包括:默认扫描步长(建议 1000 条记录每批次)、查询超时阈值(建议 30 秒)、结果缓存策略(TTL 设为 0,即实时查询不缓存)。若数据集超过 100 万条记录,建议分页并发扫描,此时 Agent 需要管理并发度与 z/OS 系统吞吐量的平衡 —— 并发度建议不超过 4,以避免触发系统 SMF 限流。
四、Hopper 的定价层与部署拓扑
Hopper 提供两层部署模式,对企业安全与合规需求有直接影响的架构差异。
Hobby 层面向个人开发者与团队测试,无需信用卡即可连接用户自有的 mainframe,支持 macOS、Windows 和 Linux 全平台。核心限制在于:无 SAML SSO、无 MCP Server 访问权限、无组织级隐私控制,且模型使用数据可能被用于训练。这一层适合概念验证(PoC)阶段,但不适合接触真实生产数据的场景。
Enterprise 层面向合规敏感型组织,提供以下关键能力:SAML SSO 集成(支持 Okta、Azure AD 等主流 IdP)、MCP Server 访问(Model Context Protocol,用于将 mainframe 工具注册为 Agent 工具集)、组织级隐私控制(「No Model Training」承诺)、SOC 2 类型 II 报告与渗透测试报告。此外支持 on-prem 或 VPC 私有部署,数据完全不出企业边界。定价采用定制报价模式,建议企业直接联系供应商获取基于 LPAR 数量与并发用户数的报价。
五、HyperDocs 与 HyperTwin:知识层面的 Agent 增强
Hopper 的运行时操作能力之外,Hypercubic 提供了两套知识层工具用于降低 Agent 的上下文缺失风险。
HyperDocs 自动从 COBOL、JCL、PL/I 源代码生成结构化文档与依赖图谱,解决的是「Agent 如何理解一个陌生 COBOL 程序的业务逻辑」的问题。工程实践表明,当 HyperDocs 生成的依赖图谱被注入到 Agent 上下文窗口时,Agent 对程序间调用关系(PERFORM 语句链、COPY 成员复用)的推理准确率可提升约 35%。建议企业在完成 HyperDocs 基线扫描后,将生成的文档嵌入企业知识库,并配置 Agent 启动时自动检索相关上下文。
HyperTwin 则面向知识传承的终极难题 —— 资深工程师的隐性知识(Tacit Knowledge)。其工作流是:HyperTwin 持续运行 AI 引导的访谈(Multi-stage AI-driven Interviews),从资深工程师的操作会话中提取决策逻辑与异常处理经验,合成数字孪生(Digital Twin)。当工程师退休或离职时,其数字孪生可以回答「这条 batch 失败了上一次是怎么恢复的」「这个 DB2 死锁的上次解法是什么」这类经验性问题。工程团队可以在 HyperTwin 中设置知识冲突检测 —— 当多个 SME 的数字孪生对同一问题给出矛盾答案时,系统自动标记并触发人工仲裁。
六、企业落地的监控清单与风险边界
将 LLM Agent 引入生产 mainframe 环境,以下几点是需要明确的风险边界。
作业失败率监控是首要指标。Hopper 生成的 JCL 在首次执行时存在一定失败率(受限于 COBOL 代码变更的上下文窗口限制),建议将 Agent 驱动作业的失败率阈值设为 5%,超过后自动触发代码审查流程。ABEND 类型的自动解码成功率建议监控,低于 80% 时应反馈给 Hypercubic 以优化解码 Skill。
变更审批链路必须独立于 Agent 系统。即使 Hopper 提供了 NEWCOPY 的暂停功能,企业仍应建立独立的变更审批系统(MRO/CI CD 流水线中的 Change Approval Board),Agent 提议的变更是「建议」而非「授权」。审批节点建议使用独立的工单系统(如 ServiceNow 或 JIRA),与 Hopper 日志通过 webhook 联动,实现端到端可审计的变更轨迹。
敏感数据脱敏是另一高风险点。VSAM 数据集中常包含 PII(个人身份信息)和 PCI(支付卡数据),Hopper 的查询结果在返回给 Agent 之前应经过自动脱敏模块。建议在 Enterprise 层部署数据脱敏网关,对包含特定模式(如生日日期、社会保障号格式)的字段执行动态掩码。
最后一层风险是 Model Vendor 锁定。Hopper 作为中间件依赖外部 LLM(如 GPT-4o 或 Claude 系列),而不同模型的上下文窗口、处理 3270 屏幕结构的能力、以及对 COBOL 语法风格的熟悉度存在显著差异。企业应要求 Hypercubic 提供模型可插拔性验证,至少测试两个候选模型在核心作业(JCL 编译、ABEND 解码、VSAM 范围查询)上的成功率差异,以避免单一模型供应商的性能波动影响运维 SLO。
资料来源:
- Hypercubic Hopper 产品页:TN3270 终端封装、JCL 编译链路与 Enterprise 层安全参数均来自官方文档 https://www.hypercubic.ai/hopper
- HyperTwin 知识捕获机制:多阶段 AI 访谈与数字孪生合成逻辑来自 https://www.hypercubic.ai/hypertwin
内容声明:本文无广告投放、无付费植入。
如有事实性问题,欢迎发送勘误至 i@hotdrydog.com。