将V6 Unix内核移植到裸机x86：IDT中断配置、MMU分页保护与PDP-11 UART仿真

将经典的 V6 Unix 内核移植到现代 x86 裸机平台，不仅是对操作系统历史的致敬，更是理解底层系统设计的绝佳实践。V6 Unix 诞生于 1975 年，原生运行在 PDP-11 小型机上，其简洁的内核设计影响了后续所有 Unix-like 系统。然而，随着 PDP-11 硬件的过时，如何在 x86 架构上复现其行为，成为一个引人入胜的工程挑战。MIT 的 xv6 项目正是这样一个优秀的示例，它用 ANSI C 重写了 V6 Unix 的核心功能，适配了 x86 的多处理器环境，并通过 QEMU 模拟器或真实硬件运行。本文聚焦于移植过程中的关键技术点：配置中断描述符表（IDT）以处理中断、实现 MMU 分页机制确保内存保护，以及仿真 PDP-11 的 UART 串口和控制台 I/O，包括 DMA 传输支持。这些步骤不仅桥接了古旧与现代的硬件差异，还提供了可操作的工程参数和清单，帮助开发者落地实现。

首先，理解移植的动机和基础。V6 Unix 内核约 1 万行代码，使用 pre-K&R C 编写，针对 PDP-11 的 16 位架构。x86 是 32/64 位 CISC 处理器，指令集、内存模型和 I/O 机制迥异。直接编译 V6 源码在 x86 上会失败，因此需要重构：保留 V6 的进程模型、文件系统和系统调用接口，同时替换底层硬件抽象层。xv6 项目正是这样做的，它在 x86 bare-metal 上启动内核，初始化 GDT（全局描述符表）和 IDT，支持分页和虚拟内存。证据显示，在 xv6 的 trap.c 中，IDT 被用于捕获所有中断和异常；memlayout.h 定义了 x86 的内存布局，包括内核代码从 0x80000000 开始的虚拟地址空间。这些改动确保了 V6 的简约哲学在 x86 上的延续，而不引入过多现代复杂性。

接下来，配置 IDT 以处理中断是移植的首要任务。在 PDP-11 上，中断通过向量表直接跳转到固定地址；x86 则使用 IDT，一个包含 256 个 8 字节描述符的表，每个描述符指向中断处理程序的段偏移和属性。观点是：IDT 提供了一个统一的入口点，能处理硬件中断（如时钟 IRQ0）、软件中断（如系统调用 INT 0x80）和异常（如页故障 #PF）。在 xv6 中，IDT 初始化发生在 trapinit () 函数：首先分配 IDT 内存（使用 kalloc ()），然后为每个中断向量填充门描述符（IDT_SYSCALL 为系统调用，IDT_LT 为时钟等）。证据来自 xv6 的 trapvec.S 汇编代码，它定义了中断向量入口，保存寄存器上下文后跳转到 usertrap () 或 kerneltrap ()。可落地参数包括：IDT 基地址设为 0x7e00（内核数据区），使用中断门（DPL=0 for kernel, DPL=3 for user syscall）；处理程序栈帧大小为 80 字节（push % ss, esp, eflags, cs, eip 等）。清单步骤：1. 在 boot 中加载 IDT 到 IDTR 寄存器（lidt 指令）；2. 为 IRQ0-15 设置 PIC（可编程中断控制器）重映射（从 0x20-0x2f 到 0x30-0x3f，避免与异常冲突）；3. 实现通用中断处理：保存现场、检查错误码、调用 devintr () 分发设备驱动。风险是 IDT 配置错误导致 triple fault 重启，建议用 QEMU 的 - gdb 调试验证中断流。

内存保护的实现依赖 x86 的 MMU 分页机制，这是 V6 Unix 从 PDP-11 简单重定位向现代虚拟内存的跃迁。PDP-11 使用 APR（Active Page Registers）寄存器组实现粗粒度分页，每个页面 8KB，分成 128 个 64B 块；x86 的 MMU 更精细，支持 4KB 页、多级页表（PML4/PDP/PD/PT）和权限位（R/W/X）。观点：分页不仅隔离进程地址空间，还启用按需加载和交换，提高内存利用率。在 xv6 中，内核页表（kvmmake ()）直接映射物理内存（PA=VA for kernel），用户进程页表（allocpagetable ()）复制内核部分并映射用户空间。证据是 walk () 函数遍历页表，mappages () 设置 PTE（Page Table Entry），PTE_V 有效位、PTE_R/W/X 权限位。xv6 使用 Sv39 分页（RISC-V，但 x86 类似 IA-32e），页表根存于 CR3。参数设置：页大小 4KB，内核虚拟基址 0x80000000，用户空间 0x0-0x3ffffff（128MB）；最大进程页数 512（2GB 用户空间）。清单：1. 初始化内核页表，映射 UART（0x10000000 PA=VA, PTE_RW）；2. 为进程分配页表，uvmcopy () 复制父进程页；3. 处理页故障（#PF）：若用户访问无效页，kill 进程；内核页故障 panic。回滚策略：若映射失败，释放已分配页并返回 ENOMEM。引用 xv6 书第 2 章：页表遍历需 O (log n) 时间，TLB 缓存加速访问。

最后，仿真 PDP-11 的 UART 和控制台 I/O 是 I/O 适配的核心，特别涉及 DMA 传输。PDP-11 的 DL11 UART 是异步串口，支持中断驱动 I/O；V6 的 console 通过 /dev/tty 设备文件访问。x86 无原生 PDP-11 硬件，故需软件仿真：在裸机上，使用 x86 的 COM1（0x3f8）16550 UART 芯片模拟 DL11 行为。观点：仿真层桥接 V6 的设备驱动与 x86 硬件，确保 printf () 和 getc () 正常工作；DMA 仿真用内存缓冲模拟直接内存访问，避免 CPU 轮询。证据：在 xv6 的 uart.c 中，uartinit () 配置波特率 115200，中断使能（IER=0x03 for RX/TX）；console I/O 通过 uartputc/uartgetc ()。对于 DMA，V6 的 RK05 磁盘用 DMA，但 UART 是中断式；移植时，可扩展为软件 DMA：用环形缓冲（size 1024B）模拟传输。参数：UART 基址 0x3f8，DLAB=1 设波特（divisor 1 for 115200），FIFO 使能；DMA 缓冲 VA 0x10000000，物理连续。清单：1. 实现 dl11_init ()：设置 x86 UART 寄存器匹配 PDP-11 时序（8N1）；2. 中断处理：RX 中断读 LSR，存缓冲；TX 中断发缓冲头；3. DMA 仿真：putc 时若缓冲满，触发软中断模拟 DMA 完成；console 读用 spinlock 保护共享缓冲。监控点：中断计数 > 1000/s 表示瓶颈，回滚到轮询模式。风险：仿真延迟导致 I/O 阻塞，测试用 bochs 模拟器验证 DMA 完整性。

通过以上实践，将 V6 Unix 成功移植到 x86 裸机，不仅复现了其多用户、多进程特性，还展示了硬件抽象的艺术。开发者可从 xv6 GitHub 克隆源码，修改 trap.c 和 uart.c 起步。未来，可扩展网络栈或 GUI，探索更多历史 OS 复活。

资料来源：MIT xv6 教学操作系统（https://pdos.csail.mit.edu/6.828/2023/xv6.html）；Lions' Commentary on UNIX 6th Edition；PDP-11 手册。