Verl 中 KL 正则化 PPO 的多 GPU 分片训练管道
面向 LLM 离线 RLHF,给出 Verl 中 KL 正则化 PPO 的多 GPU sharding 配置、阈值调优与监控要点。
Latest Essays
继续沿着时间线阅读近期的工程实践与技术观察。
近期的思考与工程笔记。
面向 LLM 离线 RLHF,给出 Verl 中 KL 正则化 PPO 的多 GPU sharding 配置、阈值调优与监控要点。
介绍 Google 使用 OSS-Fuzz 模糊测试、sanitizers 和 hardened libc++ 运行时检查大规模加固 C++ 标准库的工程实践、参数配置与监控要点。
通过 webR 将 R 编译为 WebAssembly,实现浏览器内无服务器交互式统计分析与绘图,提供集成步骤、参数配置与监控要点。
针对会议peer review AI生成洪水,设计LLM指纹提取、统计异常阈值及人工复核队列,提供工程化参数与落地清单。
基于 Microsoft call-center-ai,通过 API 一键发起 AI 电话代理,支持实时流式对话、断线重连、多轮 claim 收集与 Azure 号码直拨部署参数。
CRDT变体详解:从G-Counter到OR-Set的代数结构、合并策略及冲突自由复制的选择标准与工程参数。
基于 RFC 1876,实现 DNS LOC RR 的十进制度 lat/long/alt 编码、size/HP/radius 参数配置,支持区文件精确 geo-resolution,无需 geo-IP。
Milvus 通过 HNSW/IVF/DiskANN 索引、动态分片和混合搜索,支持亿级向量的高吞吐低延迟 ANN 检索,给出参数调优与监控要点。
基于环签名分析、金额时间模式,逆向 Chainalysis Monero 交易聚类技术,提供 mix-in 随机化等工程防御清单。
针对多人实时协作应用,工程化 CRDT 选择 LWW 寄存器处理文本、PN 计数器统计投票、OR 集合支持墓碑删除与 GC;对比 grow-only 与 pruning 权衡,提供参数阈值与监控清单。
基于浏览器 URLPattern API,实现零依赖路由匹配、动态参数捕获与查询解析,支持复杂路径模式的高效客户端路由方案。
详解 Hachi 自托管图像搜索引擎的 CLIP 嵌入分片存储、余弦相似阈值与元数据融合参数,提供一键部署清单与性能调优策略。
剖析 Hachi 自托管图像搜索的核心:CLIP 嵌入向量分片索引、RetinaFace 面部聚类、Nim 元索引,附 Docker 部署、阈值调优与性能监控清单。
浏览器端集成多AI模型管道,实现视频剪辑生成、语音叠加与模型链式调用,提供流式UI参数优化与工程落地清单。
LLM流式输出中实现上下文相关广告插入,支持A/B测试与断线续传,确保用户感知延迟低于50ms的关键参数与监控要点。
面向个人媒体库,给出Hachi图像搜索引擎的嵌入检索、索引分片与人脸聚类工程化参数与监控要点。
WebR 将 R 解释器移植到浏览器,利用 WASM 实现客户端 REPL、包执行与图形渲染,提供集成参数、监控要点与落地清单。
Traefik 动态配置热重载机制详解,聚焦中间件交换与零停机更新的工程参数、监控与回滚策略。
剖析 NVM 如何利用 POSIX shell shim 实现 Node.js 多版本并发安全切换,包含 PATH 隔离、原子 symlink 参数与工程化实践。
利用 webR 项目,在浏览器中运行完整 R 环境,支持统计分析、计算和 ggplot2 可视化,无需服务器依赖。