Hotdry.
所有分类

ai-systems

机器智能

使用 SST Opencode 工程化终端 AI 编码代理

在终端中构建原生 AI 编码代理,使用 TypeScript 和 SST,支持模块化 LLM 集成,实现自治代码生成、重构及本地测试。提供配置参数、监控要点和落地指南。

阅读全文 →

使用 AutoGen 框架构建协作式 AI 代理

通过 AutoGen 框架定义代理角色、实现对话模式,并协调任务分解,在 Python 环境中解决复杂问题。适合初学者,包含实用代码示例和最佳实践参数。

阅读全文 →

FlashAttention-4 中的 IO 感知块分块策略

探讨 FlashAttention-4 中 IO-aware 块分块策略的工程实现,通过重叠计算与 HBM 访问,在 A100 GPU 上实现长序列 MQA 推理的 2 倍吞吐量提升。提供参数调优与监控要点。

阅读全文 →

Dynamo 中异构 GPU 集群的零停机自动缩放

探讨 NVIDIA Dynamo 如何使用 Rust 实现零停机滚动更新和自动缩放策略,支持数据中心规模 AI 推理的无缝扩展,提供工程参数和监控要点。

阅读全文 →

使用 Memvid 在 MP4 中嵌入语义搜索:边缘设备优化

Memvid 通过将文本块编码为 MP4 中的 QR 帧,并将向量索引置于元数据,实现无数据库的亚 100ms 语义搜索。针对边缘设备,提供压缩参数、检索阈值和监控要点,确保高效离线运行。

阅读全文 →

Building Modular Terminal AI Agents with Gemini CLI

探讨 Gemini CLI 的核心架构,支持流式响应、动态工具调用和 MCP 插件扩展,实现无缝 CLI 集成。提供工程化参数和配置指南,帮助开发者构建高效的终端 AI 工作流。

阅读全文 →
58 / 67 页 · 共 5282