Stargate UK:构建支持万亿参数LLM的分布式训练基础设施
通过RDMA网络和液冷系统,实现高带宽低延迟的万亿参数LLM分布式训练,提供可落地参数与清单。
Latest Essays
继续沿着时间线阅读近期的工程实践与技术观察。
近期的思考与工程笔记。
通过RDMA网络和液冷系统,实现高带宽低延迟的万亿参数LLM分布式训练,提供可落地参数与清单。
基于DeepResearchAgent框架工程化顶级规划代理,实现复杂研究任务的自动化分解、子代理协调与执行,提供关键参数、配置与落地清单。
面向Tau²基准,介绍提示重写工程化方法,包括链式思考与少样本适配,实现GPT-5-Mini 22%性能提升的关键参数与验证清单。
Asciinema CLI 用 Rust 重写,提升了 WebSocket 实时流式传输性能,引入 delta 压缩的二进制格式,实现跨平台终端会话录制与回放的工程优化。
在 CI/CD 管道中自动化 Linux 发行版升级,集成容器化回滚测试、漏洞扫描和安全审计,实现零停机依赖管理。
针对刚性和非刚性系统,基准测试隐式与显式 ODE 求解器的稳定性、收敛率和 CPU 效率,提供嵌入式应用参数。
在基因组数据管道中,移除FASTA文件的换行符可将ZSTD压缩比提升至10倍,实现紧凑存储和快速传输,同时保持序列完整性。
从零开始用x86-64汇编实现X11窗口创建、事件循环、绘制原语和输入处理,提供完整代码框架和优化参数。
基于 Seed-VC,利用扩散模型实现零样本实时语音转换,提供 GPU 加速的低延迟推理参数与流式应用工程指南。
利用 MarkItDown 工具,构建无专有依赖的 Python 管道,将 Office 文档转换为 Markdown,支持 RAG 系统和 LLM 的结构化处理,包括安装、转换示例和集成要点。
基于 Open Battery Information 项目,探讨 C++ API 如何实现跨平台电池实时状态监控、容量估计算法及低功耗事件处理,提供工程化参数与集成清单。
基于 Omi 项目,介绍低功耗可穿戴设备的实时语音转录实现,包括设备端 ML 模型和音频处理管道的优化参数。
面向消费级硬件,提供 Rust 中 Gaussian Splatting 摄影测量 3D 重建的管道构建与优化参数。
基于 pgstream 实现 PostgreSQL 的流式逻辑复制,聚焦 WAL 解码捕获 DDL 变更、冲突解决策略及分布式实时同步参数。
基于开源 Perplexica,利用 TypeScript 和本地 Ollama LLM 集成 RAG,实现无云依赖的隐私搜索引擎部署。
针对 IoT 边缘 AI,介绍 no_std Rust 下 Transformer LLM 的自定义分词、固定内存注意力机制,以及无动态分配的推理优化要点。
通过模板元编程实现编译时格式字符串验证和高效运行时插值的类型安全格式化库,无需外部依赖。
在Linux手机OS中集成沙箱隔离、硬件杀开关和审计内核,实现de-Googled隐私保护的工程指南。
针对 Debian 3.1 Sarge 系统迁移到现代发行版,提供依赖管理、包重建和兼容支持的工程实践,确保数据完整无损。
通过 DeepCode 的多代理 LLM 协调框架,实现论文到代码的自动化转换,以及 Text2Web 前端和 Text2Backend 后端的工程化参数与落地实践。