Amiga DMA音频流架构：零CPU占用的跨平台音乐播放技术

在 16 位家用计算机的黄金年代，Amiga 与 Atari ST 代表了两种截然不同的音频设计哲学。Amiga 搭载 Commodore 定制的 Paula 芯片，支持四通道独立 DMA 音频流；Atari ST 则采用 Yamaha YM2149 可编程声音发生器，走合成器路线。当开发者试图在 Amiga 上播放 Atari ST 的 SNDH 音乐格式时，面临的核心挑战不仅是格式转换，更是两种音频架构的根本差异。

Paula DMA 架构的核心机制

Paula 芯片的音频子系统采用直接内存访问（DMA）设计，配备四个独立的 8 位 PCM 通道。每个通道拥有独立的 DMA 控制器，可直接从芯片内存（Chip RAM）读取采样数据并输出至数模转换器（DAC），整个过程无需 CPU 介入。这种设计的精妙之处在于：CPU 仅需在播放前配置 DMA 寄存器（设置采样起始地址、长度和采样率），后续的数据流完全由硬件接管。

Paula 的 DMA 通道支持双缓冲机制。开发者可以配置两个缓冲区交替工作：当 DMA 控制器读取缓冲区 A 时，CPU 可在后台填充缓冲区 B；当 A 播放完毕，硬件自动切换到 B，同时触发中断通知 CPU 重新填充 A。这种 "乒乓缓冲" 策略配合垂直空白中断（VBL）或音频中断，可实现理论上零 CPU 占用的连续音频流。

标准配置下，Paula 支持约 28-29kHz 的采样率（PAL 制式），四个通道可分别输出至左右声道（两左两右），形成立体声混音。对于需要更多音轨的场景，可通过软件混音扩展至更多通道，但这会引入 CPU 开销。

YM2149 与 SNDH 格式的本质差异

Atari ST 的 YM2149 芯片属于可编程声音发生器（PSG）家族，与 General Instrument AY-3-8910 兼容。它通过三个方波通道、噪声发生器和包络发生器合成音频，而非播放预录采样。SNDH 格式本质上是捕获了驱动 YM2149 的 68000 机器代码和寄存器序列，而非音频采样数据。

这种架构差异意味着：要在 Amiga 上播放 SNDH 音乐，必须实时模拟 YM2149 的行为，生成采样数据供 Paula 播放。这与 Paula 原生支持的 "加载即播放"DMA 模式形成矛盾 —— 真正的零 CPU 播放要求硬件直接处理数据流，而 YM2149 模拟需要持续的 CPU 计算。

逼近零 CPU 占用的技术路径

尽管完全零 CPU 的 YM2149 模拟在理论上不可行（因为 Paula 不支持原生合成），但可通过以下策略最小化 CPU 开销：

预渲染与流式缓冲：将 SNDH 音乐离线渲染为 PCM 采样流，存储于磁盘或内存。播放时利用 Paula 的 DMA 能力直接流式传输预渲染数据。这种方法将 CPU 负载从 "实时合成" 转移至 "磁盘 I/O"，在缓冲充足的情况下可实现接近零 CPU 占用的播放。

双缓冲链式管理：配置 Paula 使用循环缓冲模式，设置两个较大的音频缓冲区（如每个 44KB，约 1 秒音频）。DMA 控制器在缓冲区间自动切换，CPU 仅在缓冲区耗尽前收到中断通知进行数据补充。合理设置缓冲区大小可将中断频率降至每秒 1-2 次，显著降低 CPU 介入频率。

Copper 协同：Amiga 的 Copper 协处理器可在特定屏幕位置触发中断，与 Paula 音频中断形成互补。通过 Copper 精确控制缓冲切换时机，可实现更平滑的音频流，减少 CPU 中断处理开销。

可落地的工程参数

对于希望在 Amiga 上实现低 CPU 占用音频流的项目，以下参数具有参考价值：

缓冲区大小：建议每通道 44KB（约 1 秒 @44kHz 单声道），双缓冲共 88KB。较大的缓冲区减少中断频率，但增加延迟；较小缓冲区降低延迟，但提高 CPU 中断负载。
采样率配置：Paula 的 DMA 速率由时钟分频器控制。PAL 制式下，分频值 = 时钟频率 /(采样率 ×2)。例如，目标 22050Hz 时，分频值≈3546895/(22050×2)≈80。
中断优先级：Paula 音频中断应设置为较高优先级，避免被其他中断延迟导致缓冲区欠载（underrun）。在 Amiga 的多任务环境下，音频中断优先级通常设为 5 或 6。
内存对齐：DMA 缓冲区必须位于芯片内存（Chip RAM），且起始地址需对齐至偶数地址。建议使用 AllocMem () 函数并指定 MEMF_CHIP|MEMF_CLEAR 标志。

架构局限与权衡

这种跨平台音频方案存在固有局限。预渲染方法牺牲了实时性 —— 音乐无法动态响应用户输入或游戏事件。对于需要交互式音频的应用（如游戏），仍需保留部分 CPU 用于实时合成。

此外，YM2149 的独特音色（方波、噪声、包络）在转换为 PCM 后可能丢失部分 "芯片音乐" 的原始质感。高精度模拟 YM2149 需要更复杂的算法，增加 CPU 负担。

从系统架构角度看，Paula 的 DMA 设计代表了 80 年代 "硬件卸载" 思维的典范 —— 将数据搬运工作从 CPU 转移至专用硬件，释放处理器用于计算。这种设计理念在现代 SoC 中依然可见，如 DMA 控制器、GPU 和专用 AI 加速器。

对于复古计算机爱好者和嵌入式开发者，理解 Paula 的 DMA 音频机制不仅具有历史价值，更为现代低功耗音频设计提供了参考：通过合理的缓冲策略和中断管理，即使在中低端硬件上也能实现高质量音频流。

参考来源

GitHub: arnaud-carre/sndh-player - ATARI-ST SNDH Archive 音乐播放器与 AtariAudio 库
Wikipedia: Amiga Original Chip Set - Paula 芯片 DMA 音频子系统技术细节

systems

内容声明：本文无广告投放、无付费植入。

如有事实性问题，欢迎发送勘误至 i@hotdrydog.com。