学术论文传统以 PDF 为主导,但 PDF 静态布局对屏幕阅读器支持差,仅 30% 视障用户能独立访问(arXiv 2022 调查)。转向语义 HTML,能利用浏览器内置功能,实现流式布局、公式导航与语音合成,提升普适性。arXiv 已实验上线 HTML 版本,使用 LaTeXML 转换 TeX 源,证明工程可行。
核心观点:语义 HTML + MathML + ARIA 是学术论文无障碍基石。MathML 提供语义标记,如 包裹 ,屏幕阅读器可逐层朗读 “积分从 0 到无穷大 f (x) dx 等于 1”。证据见 arXiv HTML 示例,公式支持键盘焦点与 aria-label。落地参数:优先 ,嵌套 与 双轨备份;阈值:公式复杂度 >3 层运算时,必加 alttext 属性,如 alttext="X 等于 zeta 减 lambda 乘 n 加 eta"。
ARIA 增强互动:role="math" 于 ,aria-label 描述公式意图;landmark roles 如 role="navigation" 于 TOC,支持屏幕阅读器跳跃。参数清单:1. 引言;role="main" 包裹正文;测试:NVDA/JAWS 朗读顺序正确率 100%。
目录 TOC 可导航:使用 与有序列表,锚点 id="#section-1",生成动态折叠。清单:目录...;参数:深度 ≤4 级,避免嵌套 >3;浏览器兼容:Chrome polyfill MathJax 3.0+。
图 alt-text 描述性:非装饰图用 图 1:环面。参数:alt ≤125 字符,量化数据如 “柱状图:A 组 50%、B 组 30%”;复杂图链接长描述 详见描述。
引用锚点: [1] ,反向 返回引用。清单:参考文献...;参数:id 唯一,ARIA aria-describedby="cite1-desc" 补充上下文。
工程化参数与监控:
- 结构模板:
<article> <header><h1>标题</h1></header> <nav role="navigation" aria-label="目录">...</nav> <main> <math role="math" aria-label="公式描述">...</math> <figure>...</figure> </main> <aside id="refs">...</aside> </article> - 阈值:颜色对比 ≥4.5:1 (WCAG AA),字体 ≥16px 可缩放 200%。
- 清单:
- 语义标签:article/section/nav/main/aside。
- MathML:alttext/aria-label,必备 semantics。
- ARIA:role/aria-label/landmark。
- 测试:Lighthouse score >90,WAVE 无错误;屏幕阅读器:VoiceOver/NVDA 流畅。
- 回滚:若 MathML 失效,fallback MathJax;监控:Google Analytics 无障碍用户跳出率 <5%。
- 部署:Pandoc/LaTeXML 转换,GitHub Pages 托管。
实施后,论文加载 <2s,移动端自适应,视障用户满意度升 70%。来源:arXiv blog (2023/12),arXiv abs/2212.07286;LaTeXML NIST 工具。