CHERI 架构下 Linux 用户空间应用的移植：能力感知系统调用与混合 ABI 翻译

在现代计算环境中，内存安全漏洞已成为软件系统面临的主要威胁之一。CHERI（Capability Hardware Enhanced RISC Instructions）架构作为一种创新的硬件扩展，旨在通过能力（capabilities）机制提供细粒度的内存保护。这种机制将传统的指针替换为带有权限和范围信息的结构化引用，从而有效防范缓冲区溢出、use-after-free 等常见攻击。针对 Linux 用户空间应用，移植到 CHERI 架构的挑战在于维持现有二进制的兼容性，同时引入这些安全增强。不同于内核级修改，本文聚焦于用户空间的实用移植路径：通过能力感知系统调用（capability-aware syscalls）和混合 ABI 翻译（hybrid ABI translation），实现无需完整重新编译的部署。这种方法强调工程化参数的配置和可落地清单，确保开发者能在实际项目中快速集成。

能力感知系统调用的设计与实现

能力感知系统调用是 CHERI 下用户空间兼容的核心组件。传统 Linux 系统调用（如 mmap、read）假设指针是简单的地址值，而 CHERI 要求所有内存引用携带 provenance（出处）信息，包括基地址、长度、权限位（如读 / 写 / 执行）。如果系统调用忽略这些，会导致能力失效，触发硬件陷阱，从而崩溃进程。

观点上，这种设计观点在于将系统调用的接口从 “地址 - centric” 转向 “能力 - centric”，确保内核与用户空间间的内存传递始终保持安全边界。证据来源于 CHERI Linux 移植项目：在 RISC-V 平台上，调度器和异常处理器被修改为 CHERI-aware，能够在上下文切换时保存 / 恢复能力寄存器。例如，syscall 返回时，内核必须返回 intptr_t 类型的能力值，以匹配 ABI 变化。否则，legacy 代码的指针操作将失效。

落地参数方面，开发者需配置以下关键阈值和清单：

权限掩码配置：在 syscall 入口，使用 bitmask 定义允许操作。默认读 / 执行权限（0b101），写权限需显式授予。参数示例：在内核模块中设置 cap_perms = 0x5，确保只在验证后开启写位（0x2）。这可通过 /proc/sys/cheri/syscall_perms 接口动态调整，阈值上限为 0x7（全权限），但生产环境推荐 ≤0x5 以最小化暴露。
范围检查阈值：能力范围使用压缩浮点表示，基地址 + 长度需覆盖 syscall 涉及的缓冲区。设置 min_range = 4096 字节（页大小），防止微小能力滥用。监控工具如 perf 可追踪范围溢出事件，阈值警报设为 1% 的 syscall 流量。
翻译层参数：对于 hybrid 模式，引入 syscall 钩子（hook）在用户 - 内核边界转换传统指针为能力。延迟阈值控制在 5% 以内，通过 eBPF 脚本实现：bpf_prog_load ("cheri_translate", BPF_PROG_TYPE_KPROBE)。清单步骤：(a) 编译内核时启用 CONFIG_CHERI_SYSCALLS=y；(b) 测试 mmap (syscall) 时验证能力有效性，使用 gdb-cheri 调试寄存器。

这些参数确保系统调用在 CHERI 下高效运行，同时兼容现有 glibc 函数如 memcpy，后者需特殊处理以保留能力完整性。“根据 CHERI 项目，程序加载需 awareness 到 CHERI 支持，以管理环境变量的能力格式。”

混合 ABI 翻译的机制与优化

混合 ABI 翻译是实现无需全 recompilation 的关键技术。CHERI 支持两种模式：pure-cap（所有指针均为能力）和 hybrid（部分代码使用传统 ABI）。Hybrid 模式特别适合 Linux 用户空间，因为它允许 legacy binaries 通过动态翻译运行在 CHERI 环境中，避免大规模源代码重构。

核心观点是利用 ELF 加载器修改和运行时翻译器，桥接传统 ABI 与 CHERI 能力模型。证据显示，在 Morello 项目（ARMv8-A + CHERI）中，程序加载器调整 ELF 格式以处理能力环境变量；调度器区分 CHERI / 非 CHERI 进程，寄存器保存时仅对能力寄存器操作。这使得如 busybox 或 openssh 等应用能在 QEMU CHERI 仿真器上无缝运行。

技术机制包括：

ELF 头扩展：添加 CHERI 标志位（e_flags |= EF_CHERI），加载时解析为能力表。翻译器（基于 LLVM）将整数指针转换为能力：cap = derive_ptr (int_ptr, base=0x0, len=0xFFFFFFFF, perms=0x5)。
运行时沙箱：使用 LD_PRELOAD 注入翻译库，拦截 malloc/free 等调用，确保分配的内存绑定能力。参数：sandbox_depth = 3 层（进程内隔离），防止能力泄露。

落地清单：

工具链准备：安装 CHERI LLVM（clang-cheri），配置 --target=riscv64-unknown-linux-cheri。构建用户空间：make CC=clang-cheri LDFLAGS="-fhybrid-abi"。
二进制移植步骤：(a) 运行 legacy app 如 ./app --cheri-hybrid；(b) 验证通过 strace-cheri 追踪 syscall，检查能力完整；(c) 性能基准：使用 sysbench 测试 I/O，目标延迟 <10% 增加。
兼容性测试：针对 glibc 依赖，patch memcpy 以能力安全版本。阈值：兼容率 ≥90%，使用 fuzz 测试覆盖边缘 case 如 null 能力。

“Hybrid 模式允许 CHERI 和非 CHERI 代码混合运行”，这在 Linux 内核移植中已验证，支持渐进式部署。

部署实践、监控与风险管理

在实际部署中，CHERI 用户空间移植需考虑性能与安全平衡。使用 Buildroot 生成 CHERI-enabled 镜像：git clone https://github.com/cheri-linux/buildroot，配置 qemu_riscv64cheri_glibc_defconfig，然后 make。QEMU 启动后，登录 root@，运行 SSH 到端口 7778 测试 CHERI 连接。

监控要点包括：

性能指标：追踪能力检查开销，使用 prometheus + grafana，警报阈值：CPU 利用 >20% 归因于 CHERI。参数：采样率 1s，焦点 syscall 延迟。
安全审计：集成 eBPF 探针监控能力派生，阈值：无效能力率 <0.1%。工具：bpftrace 'tracepoint:syscalls:sys_enter_* { @[probe] = count (); }'。

风险与缓解：

性能开销：翻译层引入 5-15% 延迟。缓解：优化 hot path，如预加载常见能力；回滚策略：boot 参数 cherihybrid=0 禁用。
兼容边界：低级库如 pthread 可能失效。清单：隔离测试环境，渐进迁移；阈值：应用崩溃率 <5%，使用 valgrind-cheri 诊断。

通过这些实践，CHERI 移植不仅提升内存安全，还为 Linux 生态注入硬件级保护。未来，随着 Morello 硬件成熟，这种 hybrid 接近将进一步简化部署，推动安全软件演进。

（字数：约 1250 字）