首页 › 2025年 › 11月 › 用推测解码实现 Supermaven 式低延迟 AI 代码补全:百万 token 上下文与 sub-200ms 推理
2025年11月24日 ai-systems

用推测解码实现 Supermaven 式低延迟 AI 代码补全:百万 token 上下文与 sub-200ms 推理

面向大型代码库的 AI 自动补全,给出推测解码参数、多模型路由与 1M token 上下文管理的工程化实践。

内容加载中...