Page 532

最新见解 · 第 532 页

共 16860 篇文章,分类 267 个。

最新见解

近期的思考与工程笔记。

查看归档
2025-11-16 ai-systems

在 Verl 中使用 Bandit 反馈实现在线 RL 微调 LLM

探讨在 Verl 框架中实现在线强化学习循环,利用 bandit 反馈进行实时 LLM 适应,包括低延迟奖励模型和安全探索策略,实现连续偏好更新而无需完整重训练。

阅读全文 →
2025-11-16 systems-engineering

使用 Windhawk DLL 注入恢复 Windows 11 经典主题

借助 Windhawk 框架,通过 DLL 注入技术针对 Explorer 进程进行 API 钩子,恢复经典主题颜色、边框和 UI 元素,实现局部 UI 定制而非全局变更。

阅读全文 →
2025-11-16 compiler-design

用 Rust 为 Boa JS 引擎工程 JIT 后端

面向 Boa JS 引擎的 JIT 后端工程实践,聚焦动态代码生成、寄存器分配与嵌入式系统优化,实现亚 100ms 启动时间。

阅读全文 →