ai-systems

基于Microsoft call-center-ai repo，通过REST API触发AI bot主动拨出电话，支持自定义任务描述、claim schema收集与Azure Communication Services集成。详解payload参数、实时流式对话阈值调优、生产部署清单与成本监控要点。

阅读全文 →

2025年11月23日

VERL 中 Offline RLHF 工程化：奖励模型蒸馏、Actor-Critic 架构与稳定 PPO 更新

VERL 框架下 Offline RLHF 的奖励模型蒸馏、Actor-Critic 架构与 PPO 稳定更新的工程实践与参数配置。

阅读全文 →

2025年11月23日

在多智能体系统中实现 MCP 协议：OpenAI 与 Anthropic LLM 的无缝上下文共享

面向 OpenAI/Anthropic 多代理系统，给出 MCP 协议的 Client/Server 实现参数、状态转移清单与监控要点。

阅读全文 →

2025年11月23日

破解LLM Agent生产难题：工具不可靠、状态易碎与推理不稳的工程对策

基于HN热门帖，剖析pocoo博主分享的三大Agent设计顽疾，提供工具验证、状态压缩、推理投票的可操作参数与监控清单。

阅读全文 →

2025年11月23日

LightRAG中双图索引边蒸馏融合的低延迟参数调优与工程实现

LightRAG双图机制下边蒸馏融合的核心参数调优策略与低延迟工程清单，实现毫秒级响应。

阅读全文 →

2025年11月23日

Milvus动态分片与Growing Segment自动Merge策略：亿级向量无中断扩展参数

面向亿级向量，给出动态分片阈值、growing segment seal/compaction参数与proxy路由优化要点。

阅读全文 →

2025年11月23日

Call Center AI：AI 代理一键触发外呼电话的 REST API 实现

无需电话领域专业知识，通过 Microsoft Call Center AI 的简单 REST API，让 AI 代理发起外呼电话，支持自定义目标号码、机器人身份、任务和数据 schema，直接集成 Azure 服务。

阅读全文 →

2025年11月23日

ADK-Go 多代理编排灵活性：工具链、状态共享与动态路由工程实践

Code-first Go工具包中多代理orchestration灵活机制，包括tool chaining、session state共享与LLM动态路由的工程参数与实践清单。

阅读全文 →

2025年11月23日

构建 LLM 驱动的代理市场：代币拍卖、任务竞标与激励对齐

面向 LLM 代理的去中心化市场，给出代币拍卖、任务竞标、结算账本及涌现协作的工程参数与监控要点。

阅读全文 →

2025年11月23日

LightRAG 双图检索边知识蒸馏工程实践

LightRAG核心双图检索边知识蒸馏机制详解，包括索引构建、检索融合参数与低延迟RAG落地要点。

阅读全文 →

2025年11月23日

TrendRadar：多平台热点聚合 + MCP AI 的13种舆情分析工具工程化落地

TrendRadar 多平台热点聚合与 MCP AI 13 分析工具的工程参数、部署阈值、监控策略与落地清单。

阅读全文 →

2025年11月23日

用 ADK-Go 实现代码优先的 AI 代理构建：编排与基准测试灵活控制

基于 Google ADK-Go 的 Go 工具包，提供代码定义代理逻辑、工具集成、多代理编排与基准评估的工程参数与落地清单。

阅读全文 →

2025年11月23日

LightRAG 双图 edge-distillation 融合参数调优：阈值、排序与低延迟高召回实现

LightRAG 双图检索中 edge-distillation 融合的核心参数调优指南，包括 cosine_threshold、top_k 排序聚合策略，实现低延迟高召回 RAG 检索。

阅读全文 →

2025年11月23日

分层扩散模型生成一致性多视图3D世界

基于分层扩散与高斯溅射，从文本生成支持动态编辑的沉浸式3D世界，提供工程参数、阈值与落地清单。

阅读全文 →

2025年11月23日

Memori：多代理分层记忆同步的SQL原语与工程参数

Memori通过SQL-native分层记忆与低开销同步原语，支持多代理跨会话协作，提供关键配置与监控实践。

阅读全文 →

2025年11月22日

LightRAG 双图检索融合参数调优：实现亚毫秒级 RAG 延迟

详解 LightRAG dual-graph edge fusion hyperparams 调优策略，包括 batch-threshold、token limits 与 sharding deployment，实现 sub-ms 检索延迟的工程参数与监控要点。

阅读全文 →

2025年11月22日

Vibe Scaffold：AI编码代理规格向导

通过Prompt-chaining UI向导，将模糊想法解析为AI代理的结构化规格：需求分解、架构图、测试用例、部署配置，实现LLM编排下的高效idea-to-spec转换。

阅读全文 →

2025年11月22日

Meta WorldGen：文本生成沉浸式3D世界的分层扩散管道

解析Meta WorldGen的分层生成流程，给出工程化参数与一致性监控要点，支持50×50米可交互场景构建。

阅读全文 →

2025年11月22日

ADK-Go 代理评估基准与部署实践：成功率延迟监控与持久状态管理

基于ADK-Go的Go语言AI代理框架，给出工具调用成功率/延迟评估基准、Cloud Run部署钩子及持久状态/容错参数，实现生产级脱离Python LLM绑定的控制。

阅读全文 →

2025年11月22日

LightRAG 双图边蒸馏索引：实体关系提取与生产融合参数

LightRAG 通过 LLM 驱动的双图边蒸馏，实现低延迟 RAG 的实体-关系索引、1-hop 扩展与融合优化，给出生产级参数配置与监控清单。

阅读全文 →

2025年11月22日

LightRAG 通过边提炼实现双图索引的低延迟检索融合：参数调优、阈值选择与展开重构

LightRAG利用关系边提炼构建实体-关系双图索引，在RAG管道中实现低延迟检索融合，提供参数调优、相似度阈值选择与1-hop展开重构的工程化指南。

阅读全文 →

2025年11月22日

iPhone音频谱图与运动传感器融合LLM提示：零样本活动识别

基于苹果后期多模态融合研究，给出iPhone上音频谱图与IMU数据转文本prompt的工程实现、参数调优与部署清单。

阅读全文 →

2025年11月22日

通过API驱动的AI电话代理：号码配置与实时转录集成

基于 Microsoft Call-Center-AI，解析简单 API 发起 outbound calls 的参数配置，支持 inbound bot 直拨与实时对话转录工具集成要点。

阅读全文 →

2025年11月22日

AI 代理 API 外呼电话：呼叫中心 LLM 与电话集成参数与架构

基于 Call Center AI，详解 API 驱动外呼实现：POST 参数配置、实时流式架构、Azure 部署清单与优化阈值。

阅读全文 →

2025年11月22日

MRI物理前向模型实现：支持展开优化的高锐度重建

详解MRI信号物理模拟前向模型的PyTorch实现，用于unrolled优化循环，提供阈值参数与落地清单。

阅读全文 →

2025年11月22日

ADK-Go：代码优先的代理评估框架与部署实践

基于 Google 开源 ADK-Go 工具包，代码优先构建复杂 AI 代理，集成评估框架实现性能量化，并配置灵活部署管道的关键参数与监控清单。

阅读全文 →

2025年11月22日

TiDAR：扩散思考、自回归表达的混合生成架构

TiDAR在单一前向传播中融合扩散并行草稿生成与自回归拒绝采样，实现LLM生成吞吐量4.71~5.91倍提升，同时保持AR级质量，详解训练参数、推理优化与部署清单。

阅读全文 →

2025年11月22日

Pocoo 作者揭秘：代理设计三大陷阱与生产化解决方案

基于Pocoo作者经验，针对AI代理不可靠工具、状态持久化脆弱、推理不稳定痛点，给出生产部署参数、监控清单与回滚策略。

阅读全文 →

2025年11月22日

无服务器 AI 代理出站电话编排：API 集成 STT/TTS 与实时状态管理

通过 Microsoft Call Center AI 项目，工程化实现 serverless 出站电话呼叫，重点优化语音管道容错、实时对话状态管理和监控参数，提升 AI 代理可靠性。

阅读全文 →

2025年11月22日

LLM Agent 架构核心工程难题：工具调用不可靠、状态脆弱与多步推理瓶颈

剖析 LLM Agent 三大痛点，提供工具调用验证清单、状态持久化参数与多步规划监控策略，实现可靠生产部署。

阅读全文 →

2025年11月22日

RT-DETR：端到端 Transformer 实现低延迟无锚点实时检测，边缘设备胜过 YOLO

RT-DETR 通过高效混合编码器和不确定性最小化查询选择，实现低延迟无锚点实时目标检测，在边缘设备上超越 YOLO，提供部署参数与监控要点。

阅读全文 →

2025年11月22日

RT-DETR：端到端Transformer实现实时目标检测，边缘硬件胜过YOLO

RT-DETR通过Transformer解码器绕过锚点和NMS，在边缘硬件上实现更快实时检测，匹配YOLO精度，提供部署参数与优化清单。

阅读全文 →

2025年11月22日

AI 代理运行时陷阱与防护栏设计

针对 AI 代理运行时痛点如工具调用不稳、状态漂移与循环规划，提供结构化错误恢复和工程化防护栏参数。

阅读全文 →

2025年11月22日

权重稀疏 Transformer 实现可解释神经电路：剪枝与桥接工程参数

通过权重稀疏训练揭示 Transformer 内部电路，提供 L0 正则、mean ablation 验证及桥接对齐的具体参数与监控清单。

阅读全文 →

2025年11月22日

Serverless 出站电话 AI 代理：Azure OpenAI 与电话集成编排

基于 Azure 的 serverless 出站呼叫中心 AI 代理，支持 API 触发拨号与实时语音交互，提供参数配置与监控要点。

阅读全文 →

2025年11月22日

用 ADK-Go 实现代码优先的代理编排：多代理工作流与工具集成

基于 Google ADK-Go 开源工具包，聚焦 code-first 方式构建复杂 AI 代理：详解顺序/并行/循环代理、多步推理工具集成及运行时控制参数。

阅读全文 →

2025年11月22日

LightRAG 边缘蒸馏双图融合：低延迟 RAG 检索实践

LightRAG 通过实体-关系双图索引与轻量学生模型蒸馏，实现边缘设备高效融合检索，提供 hybrid 模式参数与部署清单。

阅读全文 →

2025年11月22日

LightRAG嵌入蒸馏：双图融合下的边缘RAG低延迟参数与阈值

通过教师-学生嵌入蒸馏与双图融合，在LightRAG框架下实现边缘设备低延迟RAG，详述训练阈值、融合参数与部署清单。

阅读全文 →

第 34 / 66 页 · 共 5280 篇