ai-systems

机器智能

2025年11月22日

矩阵乘法结构丑陋的索引顺序：对称张量重构与AI加速器优化

剖析标准矩阵乘法索引嵌套的认知与性能双重丑陋，通过对称张量重构实现直观计算图与缓存最优的AI加速器实现。

阅读全文 →

2025年11月22日

LightRAG 双图索引与嵌入蒸馏：边缘设备 1GB RAM 内低延迟多跳检索

LightRAG 通过双图索引结合嵌入蒸馏，实现 1GB RAM 内边缘设备低延迟多跳检索，提供优化参数、部署清单与监控要点。

阅读全文 →

2025年11月22日

构建物理信息前向模型：MRI信号模拟与高锐度重建

基于可微分Bloch模拟器，实现MRI前向信号生成与逆向优化，提供硬件先验参数，提升图像锐度与重建质量。

阅读全文 →

2025年11月22日

Milvus 云原生向量数据库：HNSW+IVF-PQ 亿级 ANN 搜索与动态分片容错

Milvus 通过云原生设计与 HNSW+IVF-PQ 索引，实现亿级规模下低延迟 ANN 搜索，结合动态分片和高可用复制，确保生产级可靠性。

阅读全文 →

2025年11月22日

LightRAG 简约无图检索融合：亚秒级 RAG 延迟与低参数边缘部署实践

剖析 LightRAG EMNLP 论文核心 baseline：naive 模式纯向量检索+简单融合，无需复杂图索引，实现 sub-second 延迟，附低参数配置、监控阈值与边缘部署清单。

阅读全文 →

2025年11月22日

Waymo 无人物流围栏扩展工程：安全验证管道与舰队扩展

DMV 批准后 Waymo 扩展 geofence，详析安全验证管道、动态 HD 地图更新及舰队部署参数。

阅读全文 →

2025年11月21日

用 Flask 和浏览器前端构建实时德州扑克 AI 对战游戏

基于 Flask-SocketIO 实现实时多人德州扑克，支持多难度 AI 对手、豪华赌场 UI，提供完整游戏逻辑、部署参数与监控清单。

阅读全文 →

2025年11月21日

用 ADK-Go 代码优先构建灵活 AI 代理：工具与行为精确控制

基于 Google ADK-Go 工具包，探讨 code-first 方式下代理工具集成与行为管理的工程参数与最佳实践。

阅读全文 →

2025年11月21日

Memori 多代理记忆协调：分层嵌入与同步检索实现

面向多 LLM 代理系统，给出 Memori 开源引擎的分层记忆同步、冲突解析与协调工程实践与参数清单。

阅读全文 →

2025年11月21日

集成MCP的TrendRadar：AI驱动的多平台新闻热点聚合与分析

TrendRadar借助MCP协议实现AI新闻分析，支持35平台热点监控、情感趋势分析、相似检索，Docker部署，企业微信/Telegram推送，高效解决信息过载。

阅读全文 →

2025年11月21日

用 VERL 实现 LLM 离线 RLHF 流水线：奖励建模与 PPO Actor-Critic 优化

详解 VERL 在离线 RLHF 中的完整 pipeline：数据准备、reward modeling、actor-critic 训练循环、PPO 参数优化与评估，确保高效偏好对齐。

阅读全文 →

2025年11月21日

构建 StreetView 全景语义索引系统：文本到全景的 embedding 匹配与渲染

基于多模态 embedding 实现 StreetView 全景语义搜索，包括索引构建、查询匹配与曲面投影渲染的工程参数与落地清单。

阅读全文 →

2025年11月21日

工程化 AI 编码 CLI：本地终端、远程服务器与代理控制的标准化实践

针对 AI 编码场景，工程化 CLI 接口设计要点，包括本地终端集成、远程服务器代理控制及 MCP 等协议标准化参数与落地清单。

阅读全文 →

2025年11月21日

LightRAG 双图索引与检索融合及低延迟参数实现高效简单 RAG

LightRAG 通过实体-关系双图索引与 hybrid/mix 检索融合，提供低延迟参数配置，实现无重依赖的简单高效 RAG 管道。

阅读全文 →

2025年11月21日

OLMo 3 端到端模型开发流程优化：加速开源 AI 领导力的数据、训练与评估管道

剖析 OLMo 3 的完整模型流，从数据清洗到 RL 后训练，给出高效管道参数与落地清单。

阅读全文 →

2025年11月21日

Memori：SQL原生分层嵌入记忆引擎核心实现

剖析Memori的分层存储、嵌入检索、多代理协作与低开销同步原语，给出LLM代理记忆引擎的工程参数与部署清单。

阅读全文 →

2025年11月21日

Deno沙箱实现本地MCP模式代码执行：安全隔离与权限控制

基于mcp-deno-sandbox项目，在Deno沙箱中运行本地MCP模式，支持JS/TS/Python代码执行，提供运行时权限与模块隔离参数配置。

阅读全文 →

2025年11月21日

用 ADK-Go code-first 实现代理评估框架与部署管道：指标追踪、A/B 测试与可扩展编排

基于 ADK-Go 的代码优先方法，构建代理评估框架与部署管道，集成指标追踪、A/B 测试及可扩展编排参数与监控清单。

阅读全文 →

2025年11月21日

LightRAG 双图嵌入蒸馏至边缘检索：知识融合与量化训练参数

LightRAG双图嵌入通过知识融合蒸馏至轻量student模型，实现sub-100ms边缘RAG延迟。详解QAT参数、KD损失设计与监控阈值。

阅读全文 →

2025年11月21日

LightRAG 双图索引与检索融合：资源受限设备低延迟 RAG 参数配置

LightRAG 通过实体本地图与关系全局图的双层索引，实现高效检索融合，支持 hybrid/mix 模式。针对资源设备，给出 chunk 分割、top_k、reranker 参数及监控阈值，确保低延迟 LLM 增强。

阅读全文 →

2025年11月21日

工程化开源LLM全生命周期管线：OLMo数据飞轮、分布式训练与分阶段发布

剖析AllenAI OLMo框架端到端开源LLM管线：Dolma数据飞轮curation、FSDP分布式训练10B参数模型、Catwalk评估基准及渐进发布策略，提供工程参数与监控要点。

阅读全文 →

2025年11月21日

TrendRadar 集成 MCP：13 个 AI 工具实现新闻趋势追踪与情感分析

TrendRadar 通过 MCP 协议集成 13 个 AI 工具，支持自然语言查询 35 平台新闻数据，进行趋势追踪、情感分析与相似检索；提供 Docker 部署与微信推送参数，实现舆情监控工程化。

阅读全文 →

2025年11月21日

OLMo 开源模型全生命周期工程管道：从数据准备到部署的透明实践

AllenAI OLMo 框架下，从 Dolma 数据清洗到 FSDP 训练、Open Instruct 微调与 HF 部署的工程参数、监控要点与可复现清单。

阅读全文 →

2025年11月21日

构建 AI 驱动文件光标：语义搜索与多文件导航工程实践

基于 Cursor AI，给出语义搜索、多文件导航、智能重构的工程参数、清单与监控要点。

阅读全文 →

2025年11月21日

使用 Azure/OpenAI 构建 API 驱动的外呼 AI 代理：语音合成、ASR 与无服务器电话路由

基于 Microsoft Call-Center-AI 开源项目，实现 API 触发的外呼 AI，支持实时 STT/TTS、RAG 增强与 serverless 部署的关键参数与监控要点。

阅读全文 →

2025年11月21日

LightRAG 双图检索融合：低资源环境下高效 RAG 实现

LightRAG 通过双图（实体-关系）结构实现简单高效的检索融合，支持低资源快速部署，提升多源 chunk 召回与生成质量。

阅读全文 →

2025年11月21日

希尔伯特空间将函数视为向量：内积相似度与核技巧工程实践

函数嵌入希尔伯特空间计算相似性，核技巧参数用于代码搜索优化与ML特征提取。

阅读全文 →

2025年11月21日

Call Center AI 出站电话 API：AI 代理直拨与实时对话工程实践

基于 Microsoft Call Center AI 项目，详解出站电话 API 的工程实现，包括拨号参数、实时 STT/TTS 流式集成与对话编排阈值配置。

阅读全文 →

2025年11月21日

使用 Azure 和 OpenAI 构建无服务器 AI 外呼语音编排

基于 Azure Communication Services 和 OpenAI Realtime API 构建无服务器 API，实现 AI 发起的电话呼叫，支持动态对话流、低延迟语音合成和自然语言路由。

阅读全文 →

2025年11月21日

使用 Memori 实现多代理记忆协调：同步检索与冲突解决

面向多代理 LLM 系统，给出 Memori 记忆同步机制、向量嵌入集成方案与冲突处理参数的工程实践。

阅读全文 →

2025年11月21日

LLM指导的迭代CUDA内核精炼：通过自动融合与平铺实现GEMM操作17倍加速

面向GEMM操作的CUDA内核优化，给出LLM引导的迭代精炼流程、融合平铺参数与验证要点，实现17x加速。

阅读全文 →

2025年11月20日

使用 LLM 迭代生成 CUDA 内核：实现 17 倍性能优化

利用 LLM 和进化算法自动优化 CUDA 内核，针对 ML ops 实现硬件特定性能提升，提供迭代参数和监控要点。

阅读全文 →

2025年11月20日

使用 AI 代理构建可扩展的出站电话集成管道

利用 AI 代理和 Azure Communication Services 构建 API 驱动的出站电话管道，支持语音合成、动态路由和 Twilio 等集成，提供工程化参数与落地清单。

阅读全文 →

2025年11月20日

Milvus 中 HNSW 和 IVF-PQ 索引优化：亿级向量低延迟 ANN 搜索与动态构建过滤

探讨 Milvus 中 HNSW 和 IVF-PQ 索引的优化策略，包括动态索引构建、查询时过滤和参数调优，实现亿级向量的高效低延迟 ANN 搜索。

阅读全文 →

2025年11月20日

将 Kagi AI 助手与搜索索引集成，实现个性化查询解析

本文探讨如何将领域特定 AI 助手与搜索索引结合，通过 API 钩子实现个性化查询解析和自动化任务执行。提供工程参数、监控要点和落地清单。

阅读全文 →

2025年11月20日

使用 VERL 的 HybridFlow 构建混合 RL 工作流：LLM 微调的模块化策略优化

VERL 的 HybridFlow 框架通过混合控制器模型，支持 RL 阶段的灵活组合，从离线数据生成到在线更新，实现 LLM 高效对齐。提供模块化 API 和设备映射参数，提升生产级 RLHF 吞吐量达 20 倍以上。

阅读全文 →

2025年11月20日

LightRAG 中的嵌入蒸馏：轻量级学生模型实现边缘设备低延迟检索

通过嵌入蒸馏技术，将大型教师嵌入模型的知识转移到小型学生模型中，集成到 LightRAG 系统，实现边缘设备上的低延迟 RAG 检索，同时保持检索准确性。

阅读全文 →

2025年11月20日

VERL 中异步 Actor-Critic 更新用于多轮对话实时在线对齐

探讨 VERL 框架中异步 Actor-Critic 更新机制，实现多轮 LLM 对话的实时偏好优化，支持低延迟对齐而无需完整离线重训，提供工程化参数与监控要点。

阅读全文 →

2025年11月20日

AI驱动的文件导航光标界面开发

探讨Poly AI文件导航工具的开发，聚焦上下文感知建议和多文件操作的参数配置与工程实践。

阅读全文 →

2025年11月20日

利用 ADK-Go 的代码优先方法定义 AI 代理工具与编排管道

探讨 ADK-Go 中 Go 语言的类型安全代码优先方法，用于定义 AI 代理工具、行为和多步推理编排管道，提供直接灵活控制的工程实践。

阅读全文 →

2025年11月20日

LightRAG中双编码器融合的多跳查询集成

在LightRAG框架下，通过双编码器融合实现多跳查询的低延迟图遍历与动态路径选择，提升复杂文档知识图的检索精度。

阅读全文 →

2025年11月20日

边缘设备部署 SAM3：移动 AR 实时交互分割优化

探讨在边缘设备上部署 SAM3，实现移动 AR 应用中的实时交互分割，通过模型轻量化、提示优化和触摸细化提升效率与用户体验。

阅读全文 →

2025年11月20日

ADK-Go 中并行工具执行状态管理

利用 Go 并发原语，在 ADK-Go 框架中实现原子状态更新与死锁避免，支持多代理 AI 协调的健壮工具调用。

阅读全文 →

2025年11月20日

LightRAG 双图结构中的层次图融合实现：高效多跳查询检索与融合

在 LightRAG 的双图框架下，实现层次图融合以支持高效多跳查询检索与信息融合，适用于亿级文档处理。给出关键参数配置与落地指南。

阅读全文 →

2025年11月20日

多提供商 AI API 的标准化抽象层工程：一致接口、错误恢复与动态路由

工程化多提供商 AI API 的标准化抽象层，聚焦一致接口、错误恢复力和动态路由，实现生产级集成。

阅读全文 →

2025年11月20日

使用 Go 泛型在 adk-go 中构建类型安全的编排管道

基于 adk-go，利用 Go 的泛型实现动态代理工具链、状态管理和容错执行的多代理 AI 系统编排管道。

阅读全文 →

2025年11月20日

Federated SPARQL Queries for CUDA Ontology in Cross-Vendor GPU Interoperability

探讨基于 CUDA OWL 本体的联邦 SPARQL 查询，用于发现优化模式并通过语义映射实现跨厂商 GPU 代码翻译，提供工程参数和实现清单。

阅读全文 →

2025年11月20日

LightRAG 双图中基于熵的自适应阈值动态剪枝工程实践

面向 LightRAG 双图检索，引入熵度量实现实时阈值调整与动态剪枝，平衡召回与延迟，提供可落地参数配置与风险监控策略。

阅读全文 →

2025年11月20日

SAM 3 高清模式分布式训练工程化：混合精度优化与大规模掩码数据集增强

针对 SAM 3 高清模式，探讨分布式训练框架设计，融入混合精度优化以提升效率，并通过大规模掩码数据集增强实现零样本分割精度提升，提供工程参数与落地清单。

阅读全文 →

2025年11月20日

LightRAG 双图中基于熵的动态多跳剪枝工程实践

在 LightRAG 的双图结构中引入基于熵的动态剪枝，实现亿级规模 RAG 管道的无嵌入多跳检索，提升可扩展性和效率。

阅读全文 →

2025年11月20日

在 ADK-Go 中使用 Go 类型安全的代码优先范式定义 AI 代理工具、行为与编排

探讨 ADK-Go 如何通过 Go 的接口和类型安全实现代码优先的 AI 代理开发，提供工具定义、行为控制和多步推理编排的低级灵活性。

阅读全文 →

2025年11月20日

A2A 协议中的端到端加密与互信认证工程实践：防范分布式 AI 网络中的窃听与欺骗

在 OpenAgents 框架下，利用 A2A 协议工程化端到端加密与互信认证，实现安全多代理通信，防范窃听与欺骗，提供落地参数与监控要点。

阅读全文 →

2025年11月20日

使用 SAM 3 实现零样本图像/视频分割：点/边界框提示与 HQ 模式细化及实时流式推理优化

探讨 SAM 3 在零样本图像和视频分割中的实现，使用点和边界框提示，结合 HQ 模式进行掩码细化，并优化流式推理以支持实时应用。提供工程参数和监控要点。

阅读全文 →

2025年11月20日

Milvus 中向量分片与分区设计：万亿级存储的动态负载均衡与容错复制

探讨 Milvus 在万亿级向量存储中的分片与分区策略，包括动态负载均衡机制和容错复制实现，提供工程化参数与监控要点。

阅读全文 →

2025年11月20日

OpenAgents 中实现 A2A 协议的多代理网络互操作性

探讨在 OpenAgents 框架中集成 A2A 协议，实现多代理网络的无缝互操作性、消息路由和任务编排，提供工程化参数和最佳实践。

阅读全文 →

2025年11月20日

TrendRadar：AI聚合35平台热点的情感分析与趋势挖掘工程

基于TrendRadar项目，探讨AI驱动的多平台热点聚合管道，聚焦13个NLP工具在情感分析、趋势跟踪和相似检索中的工程实践，实现高效谣言检测与深度内容挖掘。

阅读全文 →

2025年11月20日

Memori 中集成同态加密：实现隐私保护的代理内存检索

探讨在 Memori 内存引擎中集成同态加密技术，实现分布式 LLM 系统代理内存的安全存储与选择性检索，确保隐私不被泄露。

阅读全文 →

2025年11月20日

使用 AI 代理构建可扩展出站呼叫管道：语音合成、动态路由与电话集成

本文探讨如何利用 Microsoft Call Center AI 项目构建自动化出站呼叫系统，支持高容量活动。通过语音合成、动态路由和 Azure 电话集成，实现高效的客户接触和数据收集。提供工程化参数和监控要点，确保可扩展性和可靠性。

阅读全文 →

2025年11月20日

SAM3 交互式提示优化与边缘设备低延迟对象分割

探讨 SAM3 在资源受限边缘设备上实现亚10ms 延迟的对象分割，通过交互式提示和掩码细化优化，提供工程参数和部署清单。

阅读全文 →

2025年11月20日

Memori 中 episodic 记忆模块的设计：高效检索交互历史支持 LLM 代理多轮决策

探讨 Memori 框架下 episodic 记忆模块的设计，聚焦交互历史的检索优化，以提升 LLM 代理在多轮对话中的决策能力。提供具体参数配置和实现清单。

阅读全文 →

2025年11月20日

VERL 中使用 Bradley-Terry 奖励的分布式 PPO 实现离线 RLHF

探讨 VERL 框架下分布式 PPO 与 Bradley-Terry 奖励模型的集成，聚焦奖励分解、传播机制及生产规模多代理协调的工程参数与优化策略。

阅读全文 →

2025年11月20日

构建Claude政治偏见基准数据集与统计管道：量化输出中立性的工程实践

面向Claude输出，设计基准数据集和统计分析管道，实现对政治偏见的多意识形态细粒度量化。

阅读全文 →

2025年11月20日

SAM3 零样本分割与 ARKit 集成：混合现实实时对象遮罩及姿势跟踪优化

探讨将 Meta SAM3 模型集成到 Apple ARKit 中的方法，实现混合现实中的实时对象遮罩。通过优化姿势跟踪和环境光照适应，提升 AR 应用的交互性和真实感。

阅读全文 →

2025年11月20日

LightRAG：双编码器实现轻量级快速 RAG

基于双编码器和图索引的低延迟 RAG 实现，聚焦最小依赖设置与高效查询管道，适用于大型文档处理。

阅读全文 →

2025年11月20日

优化 SAM-3 提示以最小化内存足迹：边缘设备实时视频分割指南

在资源受限边缘设备上优化SAM-3的提示机制，实现<1GB RAM下的实时视频分割，提供工程参数与监控要点。

阅读全文 →

2025年11月20日

构建 LLM 量化交易实时市场模拟器：整合实时数据与随机模型

面向 LLM 生成的交易策略，构建实时市场模拟器，融合实时数据馈送与随机模型，聚焦延迟敏感执行及风险调整性能指标，提供工程化参数与监控要点。

阅读全文 →

2025年11月19日

CUDA 到 HIP 翻译瓶颈剖析：工程混合调度器实现 AMD Instinct ML 模型无缝移植

分析 HIP 翻译瓶颈如分支发散和异步拷贝开销，设计混合调度器，提供 ML 模型向 AMD Instinct 移植的工程参数与监控策略。

阅读全文 →

2025年11月19日

Memori中基于向量的语义合并：分布式LLM代理内存冲突解决

在Memori框架中，利用余弦相似度阈值实现分布式LLM代理内存的向量语义合并，高效解决冲突并优化查询时融合，提升系统一致性和性能。

阅读全文 →

2025年11月19日

GPT-5.1-Codex-Max 与 WebSockets 集成：实时多用户代码协作生成

面向多开发者场景，介绍 GPT-5.1-Codex-Max 在 WebSockets 下的实时协作代码生成框架，包括冲突语义 diff 和建议参数配置。

阅读全文 →

2025年11月19日

在 Mosaic 的代理管道中集成 Server-Sent Events：实现实时协作视频编辑的多模型流式与容错重连

探讨如何在 Mosaic AI 视频编辑平台的代理管道中集成 SSE，支持多模型流式输出和实时协作编辑，提供断线续传机制和工程参数，提升并发处理能力。

阅读全文 →

2025年11月19日

实时解码Power Tracks预测信号：模式匹配与异常检测在股权市场中的应用

在股权市场实时数据中，使用模式匹配、异常检测和低延迟解析技术解码Power Tracks预测信号，提供交易决策支持。

阅读全文 →

2025年11月19日

LightRAG 检索融合机制设计

在 LightRAG 中设计融合层，合并实体-关系路径的双图检索，优化分数聚合与重排序，实现无嵌入设置下的准确多跳查询响应。

阅读全文 →

2025年11月19日

SAM 3 中掩码预测与精炼管道优化：实现亚毫秒延迟的实时交互分割

针对 SAM 3 的掩码预测管道，给出实现亚毫秒延迟的优化方案，包括 Presence Head 解耦与数据引擎支持，避免 HQ 模式开销的实时交互要点。

阅读全文 →

2025年11月19日

工程化 SAM 3 的 HQ 模式：交互式零样本视频分割与精确掩码精炼

探讨 SAM 3 HQ 模式的工程实现，支持点/边界框提示的交互零样本视频分割，以及流式推理的参数优化与监控要点。

阅读全文 →

2025年11月19日

Memori 中的分层内存分片设计

探讨在 Memori 中引入分层分片机制，以分区 LLM 代理内存跨节点，优化查询路由和复制策略，实现低延迟多代理协调。

阅读全文 →

2025年11月19日

使用 Any-LLM-Gateway 实现多租户 LLM 访问联合：角色控制与实时分析

面向多租户场景，给出 Any-LLM-Gateway 的访问联邦配置、角色-based 控制参数及 OpenTelemetry 集成要点，实现实时 spend analytics。

阅读全文 →

2025年11月19日

在 Mosaic 代理管道中集成 SSE 实现流式视频编辑

探讨如何在 Mosaic 的代理式 AI 管道中集成 Server-Sent Events (SSE)，支持多模型实时视频编辑、断线续传和协作反馈，确保无数据丢失。

阅读全文 →

2025年11月19日

使用 GPT-5.1-Codex-Max 构建可扩展代码生成管道：集成版本控制与多语言支持

面向企业应用，利用 GPT-5.1-Codex-Max 工程化代码生成管道，集成 Git 版本控制与多语言支持，提供参数配置与监控要点。

阅读全文 →

2025年11月19日

构建统一 LLM 网关：速率限制与预算控制

面向多模型提供商，介绍 any-llm-gateway 的速率限制、认证机制和使用计量，实现预算执行与安全访问。

阅读全文 →

2025年11月19日

在 Mosaic 中实现 Agentic AI 管道：自动化视频编辑的模型链式与实时反馈

探讨如何在 Mosaic 平台上构建 agentic AI 管道，实现场景检测、剪切建议和效果应用的自动化视频编辑，提供实时反馈和工程化参数。

阅读全文 →

第 35 / 66 页 · 共 5280 篇