Page 731

最新见解 · 第 731 页

共 16860 篇文章,分类 267 个。

最新见解

近期的思考与工程笔记。

查看归档
2025-10-03 ai-engineering

利用 OCI 注册表管理私有 Python 包

面向私有 Python 包的分发,给出基于 OCI 镜像的发布、安装工程化参数与空气隔离环境支持要点。

阅读全文 →
2025-10-03 ai-engineering

Distributed LLM Distillation in Tunix Using JAX vmap and pmap

探讨在 Tunix 框架下,利用 JAX 的 vmap 进行批处理矢量化与 pmap 实现多 TPU 并行,从而优化 LLM 知识蒸馏过程的对齐和微调效率,提供工程化参数与最佳实践。

阅读全文 →
2025-10-03 ai-systems

从零实现最小 Transformer LLM

使用 PyTorch 从头构建小型 Transformer 语言模型,包括自定义 BPE 分词器、GPT-2 式架构,并在莎士比亚数据集上训练的核心组件。

阅读全文 →