首页 › 2025年 › 09月 › 从零实现 LLM 的 Beam Search 生成:结合剪枝与 Top-p 采样优化 PyTorch 推理
2025年09月29日 ai-systems

从零实现 LLM 的 Beam Search 生成:结合剪枝与 Top-p 采样优化 PyTorch 推理

面向自定义 Transformer 解码器,给出 Beam Search 结合剪枝和 Top-p 采样的 PyTorch 实现,以及针对内存和延迟的优化参数与策略。

内容加载中...