Hotdry.
所有分类

ai-systems

机器智能

构建Gemini提示的模块化评估管道

利用Gemini Cookbook指标如忠实度和相关性,构建模块化评估管道,实现自动化基准测试与迭代优化,提升生产AI应用提示工程质量。

阅读全文 →

Moondream 3:实现前沿推理的高速紧凑视觉语言模型

Moondream 3 通过 9B MoE 架构,仅 2B 活跃参数,实现前沿视觉推理能力,支持长上下文和 grounding。优化推理引擎确保边缘部署的高速运行,提供对象检测、OCR 等功能的参数配置与集成指南。

阅读全文 →

Onyx 中自定义工具插件与流式响应工程化集成

在 Onyx 平台中,通过 OpenAPI 和 MCP 配置自定义工具插件,实现动态函数调用;结合流式响应处理,支持本地硬件上的实时 AI 交互,提供工程参数与监控要点。

阅读全文 →

构建基于Gemini的健康对话路径导航AI代理

探讨使用Gemini构建健康对话中的路径导航AI代理,聚焦上下文导航和用户意图解析在复杂信息空间中的应用,提供工程化参数和监控要点。

阅读全文 →

使用 Exo 实现家庭设备间的 P2P AI 推理集群

Exo 项目允许用户在手机、笔记本等消费级设备上构建分布式 AI 集群,实现无云依赖的 LLM 服务。通过 P2P 网络和动态模型分区,支持大规模模型推理,提供 ChatGPT 兼容 API,便于集成。

阅读全文 →

使用 Onyx 构建支持 RAG 的团队 GenAI 聊天系统

Onyx 是一个开源平台,用于构建集成团队文档的 RAG 增强 GenAI 聊天系统,支持上下文查询、协作编辑和安全知识共享,无需外部 API。探讨其部署和配置要点。

阅读全文 →
59 / 67 页 · 共 5282