ai-systems

机器智能

2025年11月17日

Continuous Claude 中的持久化会话管理：维护对话状态与中断恢复

针对 Continuous Claude 的循环 AI 代码执行，提供持久化会话处理工程实践，确保对话状态维护与中断恢复。

阅读全文 →

2025年11月17日

Grok 4.1 多模态推理管道的缩放：高效 KV 缓存与动态批处理

针对 Grok 4.1 的多模态处理，探讨 1M+ token 上下文下的推理管道缩放策略，重点优化 KV 缓存与动态批处理以支持实时应用。

阅读全文 →

2025年11月17日

基于语义嵌入的新闻聚类与去重：TrendRadar 的趋势检测优化

探讨 TrendRadar 中使用语义嵌入实现新闻聚类和去重的工程实践，通过阈值调优减少噪音，提升多平台趋势监测效率。

阅读全文 →

2025年11月17日

VERL中多代理RL工作流的编排：基于LLM的任务分解、奖励共享与复杂环境中的 emergent 协作

利用VERL框架编排多代理强化学习工作流，支持LLM驱动的任务分解、奖励共享机制，实现复杂环境下的 emergent 协作行为，提供工程参数与监控要点。

阅读全文 →

2025年11月17日

Engineering Persistent Memory Storage and Query Optimization in Memori for Multi-Agent LLM Interactions

本文聚焦 Memori 框架的 episodic memory 持久存储工程与查询优化策略，支持可扩展多代理系统实现低延迟检索，提升 LLM 协作效率。

阅读全文 →

2025年11月17日

Engineering Zero-Downtime Canary and Blue-Green Deployments for Replicate on Cloudflare

利用 Cloudflare 边缘基础设施，实现 Replicate 模型更新的金丝雀路由和蓝绿部署策略，提供工程参数、监控要点和回滚机制，确保无缝更新。

阅读全文 →

2025年11月17日

Continuous Claude 连续循环代码执行工具：迭代开发与状态任务自动化

介绍 Continuous Claude 工具，用于在 Claude AI 代码解释器中实现连续循环执行，支持迭代开发、错误处理和无手动重启的状态任务。详述安装、配置参数及 GitHub 集成要点。

阅读全文 →

2025年11月17日

使用扩散模型工程化 WeatherNext 的概率预报

WeatherNext 作为 GraphCast 继任者，利用扩散模型实现 0.25° 分辨率集合预报，并集成自回归预测支持 15 天严重天气警报的工程实践。

阅读全文 →

2025年11月17日

使用 ADK-Go 在 Go 中编排多代理 AI 系统：代码优先协调、评估管道与可扩展部署模式

利用 ADK-Go 在 Go 语言中实现多代理 AI 系统的协调，聚焦代码驱动的交互协议、评估流程以及 scalable 部署策略，提供工程化参数和监控要点。

阅读全文 →

2025年11月17日

LightRAG：使用双图实现无嵌入 RAG 效率优化

面向资源受限 LLM 管道，工程化无嵌入 RAG 系统，利用双图进行实体提取和递归检索，提升速度与简单性。

阅读全文 →

2025年11月17日

使用 ADK-Go 开发 AI 代理评估管道：多步推理、工具集成与错误恢复基准测试

利用 ADK-Go 构建代码优先的评估框架，针对 AI 代理的多步推理、工具集成和错误恢复进行基准测试，提供实用参数和监控策略。

阅读全文 →

2025年11月17日

基于 MCP 的 AI 多平台新闻监控：趋势分析与 Docker 实时通知集成

TrendRadar 项目利用 MCP 协议实现 AI 驱动的多平台新闻聚合与分析，支持趋势追踪、情感检测，并通过 Docker 部署实现企业级实时推送通知，助力高效舆情监控。

阅读全文 →

2025年11月17日

Replicate 与 Cloudflare 集成：边缘计算驱动的无服务器 AI 全球推理

探索 Cloudflare 收购 Replicate 后，如何利用边缘计算实现低延迟 AI 模型部署，提供无基础设施管理的全球推理解决方案。

阅读全文 →

2025年11月17日

通过 Twilio API 实现 LLM 代理的外呼电话集成：实时语音处理与呼叫状态管理

面向 LLM 代理的外呼电话集成，提供 Twilio API 触发、实时语音合成与 STT/LLM 处理，以及呼叫状态管理的工程化参数与监控要点。

阅读全文 →

2025年11月17日

Milvus GPU 加速 ANN 搜索：CUDA 内核集成与 HNSW-IVF 混合索引优化

面向亿级向量规模，集成 Milvus GPU 加速与 CUDA 内核，实现亚毫秒 ANN 查询，使用 HNSW-IVF 混合索引平衡召回与速度。

阅读全文 →

2025年11月17日

TrendRadar 的 Docker 通知管道工程化：多渠道即时推送与 AI 分析

通过 Docker 部署 TrendRadar，实现 35 平台热点聚合、AI 趋势与情感分析，以及 WeCom、Flybook 等多渠道通知的工程化设置，1 分钟内完成快速上线。

阅读全文 →

2025年11月17日

LightRAG 无嵌入双图零-shot 实体提取与递归检索集成

LightRAG 通过双图结构实现零-shot 实体提取与递归检索，支持 LLM 管道中高效 RAG，无需传统向量搜索。

阅读全文 →

2025年11月17日

LightRAG 中分层实体关系图的实现：多跳查询解析与递归检索

在 LightRAG 框架中引入分层实体关系图，支持多跳查询的递归检索，实现比平面图低 30% 的延迟。详述工程参数、阈值设置与监控策略。

阅读全文 →

2025年11月17日

使用 LightRAG 构建无嵌入式图 RAG 管道：双实体关系图的递归检索

利用 LightRAG 的双实体-关系图实现无嵌入 RAG 管道，支持递归检索和 LLM 增强，在低资源环境中比传统向量搜索快 2 倍。

阅读全文 →

2025年11月17日

Heretic 表示工程的多模型 SSE 去审查集成：断线续传与动态模型切换

利用 Heretic 的自动去审查技术，在多模型 LLM 管道中通过 SSE 实现容错流式输出，支持断线续传和动态模型切换的生产级部署。

阅读全文 →

2025年11月17日

工程化低延迟 STT 和 TTS 管道：为 LLM 电话代理集成 Twilio 处理实时对话中的口音和噪声

本文探讨为 LLM 电话代理构建低延迟 STT 和 TTS 管道的工程实践，包括 Twilio 双向音频流集成、错误校正机制，以及实时处理口音和噪声的优化策略。

阅读全文 →

2025年11月17日

使用 Z3 Python API 建模硬件电路为 SAT 问题：RTL 验证

面向 RTL 设计，使用 Z3 Python API 将电路建模为 SAT 问题，实现属性检查和 bug 狩猎，代码简洁在 50 行内。

阅读全文 →

2025年11月17日

LightRAG 中的双层图构建：实体提取与关系图工程化

从非结构化文本中工程化双层实体提取与关系图构建，实现 LightRAG 的高效可扩展检索增强生成，避免繁重索引开销。

阅读全文 →

2025年11月17日

Heretic 运行时消融与 SSE 集成：多模型 LLM 流式管道低延迟去审查

面向多模型流式输出，给出 Heretic 消融与 SSE 连接管理的工程化参数与监控要点。

阅读全文 →

2025年11月17日

Memori 剧集内存存储中的语义相似性聚类与去重实现

在 Memori 的 episodic memory store 中，使用向量嵌入实现语义相似性聚类与去重，优化多代理 LLM 交互的存储与检索效率，提供阈值参数和落地清单。

阅读全文 →

2025年11月17日

Z3 Python API 增量 SMT 求解在动态约束环境中的应用：实时传播与回溯策略

利用 Z3 的增量求解功能，在动态环境中实现实时约束传播与高效回溯，适用于 AI 规划等场景，提供工程化参数与最佳实践。

阅读全文 →

2025年11月17日

Heretic 中低延迟运行时电路消融：用于流式 LLM 响应的逐 token 去审查

探讨在 Heretic 中实现低延迟运行时 abliteration，用于 token-by-token 去审查流式 LLM 响应，优化补丁应用以避免完整重计算。

阅读全文 →

2025年11月17日

使用 Go 的 ADK 工具包构建复杂 AI 代理：工具集成、状态管理和评估框架

探索使用 ADK-Go 代码优先构建灵活 AI 代理，集成工具、管理会话状态，并通过评估框架确保可靠开发。提供工程参数和监控要点。

阅读全文 →

2025年11月17日

使用 ADK-Go 部署代码优先 AI 代理：容器编排、状态持久化和自定义评估框架

本文探讨如何使用 ADK-Go 工具包部署 code-first AI 代理，重点介绍容器化编排、会话状态持久化以及自定义评估框架，实现可扩展且可重现的代理基准测试。

阅读全文 →

2025年11月17日

VERL 中 PPO 的 KL 散度正则化：稳定 LLM 对齐训练

在 VERL 的 PPO 框架下集成 KL 散度正则化，防止 offline RLHF 中的模式崩溃，优化奖励-策略散度，实现稳定 LLM 对齐。

阅读全文 →

2025年11月17日

Heretic 中电路发现与针对性消融：实现多轮 LLM 对话的无审查响应

利用 Heretic 工具，通过电路发现和针对性 abliteration，在多轮 LLM 对话中维持无审查响应，避免重复干预，提供工程参数和监控要点。

阅读全文 →

2025年11月17日

LightRAG 中实体-关系图的剪枝算法：优化检索延迟与准确性平衡

针对 LightRAG 的实体-关系图，设计剪枝算法消除低相关性边，减少 RAG 检索延迟，同时维持准确性，提供工程参数和监控要点。

阅读全文 →

2025年11月17日

使用 ADK-Go 工具包通过容器编排部署代码优先 AI 代理

利用 ADK-Go 在容器环境中部署 AI 代理，实现可扩展的生产级推理、监控与自动缩放的工程实践。

阅读全文 →

2025年11月17日

集成 Heretic 实现 LLM 管道中的运行时选择性去审查

利用 Heretic 在 LLM 管道中进行选择性运行时去审查，结合表示工程技术，并设置后备防护栏以确保生产环境的安全部署。

阅读全文 →

2025年11月17日

Designing Episodic Memory Retrieval in Memori for Multi-Agent LLMs

在 Memori 框架下设计 episodic memory 模块，用于存储和检索多代理系统中的对话事件，实现高效的上下文感知响应，减少历史加载开销。

阅读全文 →

2025年11月17日

使用OCR和RAG curation 中国K-12教育语料库支持LLM微调

基于开源中国教科书资源，通过OCR提取、元数据标注构建结构化语料库，并集成RAG系统，用于教育AI中的多语言LLM微调与知识检索。

阅读全文 →

2025年11月17日

在 Memori 中构建分层知识图谱：多代理 LLM 系统的可扩展事实检索与上下文融合

探讨如何利用 Memori 的关系映射功能构建分层知识图谱，实现多代理系统中高效的事实检索和语义深度优化，提供工程参数与实践指南。

阅读全文 →

2025年11月17日

Custom Reward Shaping in VERL for RLHF Alignment

探讨 VERL 中自定义奖励塑造的设计与集成，针对人类偏好对齐的安全约束和多目标优化，提供工程参数和落地清单。

阅读全文 →

2025年11月17日

Heretic：通过表示工程实现 Abliteration 的审查解除

利用 Heretic 工具，在 LLM 推理时通过表示工程的 abliteration 技术选择性解除被审查 token 的绑定，实现自动审查移除。

阅读全文 →

2025年11月17日

Heretic 中的选择性去审查：针对特定表示向量的主题敏感安全机制

在 Heretic 中实现选择性去审查，通过针对特定表示向量编辑主题敏感的 LLM 安全对齐，实现细粒度控制而不破坏全局性能。

阅读全文 →

2025年11月17日

VERL 中集成自定义 PPO 采样器优化离线 RLHF 工作流

探讨在 VERL 框架中集成自定义 PPO 采样器，实现高效离线 RLHF 训练，优化 LLM 偏好对齐，包括数据批处理和奖励建模策略。

阅读全文 →

2025年11月16日

用 Go 实现朴素贝叶斯垃圾邮件分类器：分词、词汇表构建与拉普拉斯平滑

基于 Go 语言构建朴素贝叶斯垃圾邮件分类器，详解分词处理、词汇表构建及拉普拉斯平滑技术，适用于实时邮件过滤场景。

阅读全文 →

2025年11月16日

将 Heretic 表示工程集成到 LLM 服务管道中，实现运行时动态去审查优化

面向 LLM 服务管道，集成 Heretic 的表示工程技术，实现推理时动态审查移除，并优化低延迟参数与监控机制。

阅读全文 →

2025年11月16日

使用 Twilio 集成 LLM 代理的 API 触发出站呼叫工程实践：实时 ASR/TTS 流式处理与状态持久化

探讨如何通过 Twilio 和 OpenAI Realtime API 实现 LLM 驱动的出站呼叫，支持实时语音流、会话持久化和 fallback 路由，确保鲁棒的语音交互。提供可落地参数和监控要点。

阅读全文 →

2025年11月16日

LightRAG 双图结构：实体关系提取与递归检索的轻量实现

LightRAG 通过简单双图结构实现实体关系提取与递归检索，支持本地 LLM 快速 RAG 部署，避免重型索引开销。

阅读全文 →

2025年11月16日

重新实现早期Transformer模型并基准测试：剖析pre-GPT时代的缩放行为

通过在现代GPU上重新实现和基准2017-2019年的早期Transformer-based LLMs，揭示缩放规律和架构演进，提供工程参数和监控要点。

阅读全文 →

2025年11月16日

LightRAG 可扩展图索引设计：分区、分片与负载均衡

探讨LightRAG中分区图索引的设计，实现百万级语料库的亚秒级查询，通过分片、联邦检索和负载均衡优化生产RAG系统。

阅读全文 →

2025年11月16日

通过表示工程实现 LLM 自动去审查：Heretic 工具的检测与消融安全方向

利用 Heretic 工具，通过表示工程检测并消融激活中的安全方向，实现 LLM 自动去审查，绕过拒绝响应而无需重训练或微调。

阅读全文 →

2025年11月16日

使用 Heretic Abliteration 在 LLM 中实现自动审查移除

介绍 Heretic 项目，通过方向性消融技术自动移除大型语言模型的审查机制，实现无训练的解锁响应，提供优化参数与部署要点。

阅读全文 →

2025年11月16日

使用 ADK-Go 实现 AI 代理的评估框架：模块化编排与工具集成

基于 ADK-Go 的 Go 语言评估框架，用于基准测试 AI 代理，涵盖模块化编排、工具集成及持久状态管理的最佳实践与参数配置。

阅读全文 →

2025年11月16日

比特币矿机重用于AI：FPGA叠加层与H100 GPU集成

面向比特币矿业硬件转向AI计算，给出FPGA重用策略、H100集群集成以及共享基础设施的参数与监控要点。

阅读全文 →

2025年11月16日

LightRAG 图边剪枝优化：降低 40% 检索延迟不失召回

通过阈值语义相似度剪枝低相关图边，实现 LightRAG 检索延迟降低 40%，保持召回率，提供工程参数和监控要点。

阅读全文 →

2025年11月16日

在LLM RAG管道中集成Milvus实现亚秒级实时向量索引

面向高吞吐LLM RAG管道，探讨Milvus的动态分片、副本管理和HNSW-IVF混合索引，以实现低延迟检索。

阅读全文 →

2025年11月16日

LightRAG 在边缘设备上的量化检索优化：移动端隐私保护 RAG

通过量化索引和分层图检索优化 LightRAG，实现移动设备上的高效、隐私保护 RAG 系统，提供具体工程参数和部署清单。

阅读全文 →

2025年11月16日

在 ADK-Go 中实现基于 Go 的 AI 代理评估框架：工具使用、状态持久化和多步推理基准测试

利用 ADK-Go 构建评估框架，针对 AI 代理的工具调用、状态保持和多步推理进行基准测试，提供可控场景下的工程化参数和监控要点。

阅读全文 →

2025年11月16日

基于CRDT的版本控制：分布式LLM系统中多代理持久内存共享工程实践

在分布式LLM系统中，工程化CRDT版本控制实现多代理内存共享，焦点于冲突解决机制、长期持久化策略及低开销参数配置。

阅读全文 →

2025年11月16日

在 Verl 中为 PPO 集成自定义采样器

探讨 Verl 框架中 PPO 策略更新的自定义采样器集成，优化 LLM 对齐轨迹并降低奖励信号方差，提供工程参数与监控要点。

阅读全文 →

2025年11月16日

工程化中国教育教材 PDF 摄入管道：OCR 元数据提取与向量嵌入实现可搜索索引

探讨自动化处理中国 K-12 和大学教材 PDF 的管道设计，包括 OCR 文本提取、元数据解析及 BERT 向量嵌入构建搜索索引。提供工程参数、监控要点及落地清单。

阅读全文 →

2025年11月16日

Implement LightRAG Core Pipeline: Dual-Level Extraction and Graph Retrieval

在资源受限环境中实现高效低延迟 RAG 的 LightRAG 核心管道，包括双层 KG 构建和混合检索模式，提供关键参数和工程化配置。

阅读全文 →

2025年11月16日

蒸馏 Google 基于 Transformer 的手写识别模型以实现亚 10ms 边缘推理

针对 Google Transformer 手写模型的知识蒸馏，采用教师-学生训练压缩模型，同时保持 99% 准确率，实现实时移动 OCR 的低延迟边缘推理。

阅读全文 →

2025年11月16日

构建轻量级 CNN 模型实现实时眼屏接触检测

基于自定义数据集和注视模型迁移学习，构建轻量级 CNN 用于实时眼屏接触检测，并边缘部署以实现低延迟隐私关注跟踪。

阅读全文 →

2025年11月16日

使用 CRDT 实现多代理共享内存的版本化更新：分布式 LLM 代理的因果一致性

在 Memori 等共享内存引擎中应用 CRDTs 处理并发更新，确保分布式 LLM 代理的无仲裁因果一致性，提供工程参数与监控要点。

阅读全文 →

2025年11月15日

使用 ADK 在 Go 中工程化模块化 AI 代理编排：工具集成、状态持久化和评估钩子

探索 ADK-Go 工具包如何通过代码优先方法实现模块化 AI 代理编排，焦点在工具集成、会话状态持久化和可扩展部署的评估钩子，提供实用参数和清单。

阅读全文 →

2025年11月15日

在 Verl 中使用 Bandit 反馈实现在线 RL 微调 LLM

探讨在 Verl 框架中实现在线强化学习循环，利用 bandit 反馈进行实时 LLM 适应，包括低延迟奖励模型和安全探索策略，实现连续偏好更新而无需完整重训练。

阅读全文 →

2025年11月15日

利用微调的Llama模型生成多特异性抗蛇毒素蛋白

探讨如何利用微调的Llama大模型设计针对多种蛇毒的抗体蛋白，包括序列生成、结构预测和验证策略，提供工程化参数和潜在风险。

阅读全文 →

2025年11月15日

工程化 API 端点触发 AI 代理电话呼叫：集成语音合成、STT 与电话服务

探讨如何通过 API 端点工程化触发 AI 代理的 outbound 电话呼叫，集成 Azure Communication Services、Cognitive Services 和 OpenAI，实现自动化客户交互。提供端点设计、参数配置与集成清单。

阅读全文 →

2025年11月15日

使用 Go 开发 AI 代理评估基准框架：灵活性与多步任务基准测试

基于 ADK-Go，探讨代码优先的评估框架开发，用于基准测试 AI 代理的灵活性、控制力和复杂多步任务编排，提供工程化参数和监控要点。

阅读全文 →

2025年11月15日

在 Helix 中实现 WebRTC P2P 用于容错 AI 代理流媒体

面向 AI 代理桌面流媒体，给出 WebRTC P2P 集成、会话迁移与动态比特率适应的工程参数与监控要点。

阅读全文 →

2025年11月15日

VERL 中离线 RL 偏好对齐工程实践：奖励建模、策略优化与 DPO

在 VERL 框架下，构建离线强化学习管道用于 LLM 偏好对齐，通过奖励建模、PPO/GRPO 策略优化以及 DPO 方法，实现高效对齐并最小化在线交互。提供参数配置和实施清单。

阅读全文 →

2025年11月15日

VERL 中构建可扩展 RL 基础设施：用于 LLM 对齐的多阶段训练管道、奖励塑造与分布式 Actor-Critic 优化

探讨 VERL 框架在 Volcano Engine 生态中构建可扩展 RL 基础设施，聚焦多阶段训练管道设计、奖励塑造技术及分布式 actor-critic 优化的工程实践，提供落地参数与监控要点。

阅读全文 →

2025年11月15日

构建多平台热点聚合管道：AI 情感分析与趋势追踪工程实践

基于 TrendRadar 项目，探讨从 35 个平台聚合热点的可扩展管道设计，集成 AI 进行情感分析、趋势追踪及相似检索，支持自然语言查询接口，提供工程参数与监控要点。

阅读全文 →

2025年11月15日

TrendRadar 中集成 MCP 实现多平台 AI 驱动分析：趋势追踪与情感分析

TrendRadar 通过 MCP 协议集成 AI 分析，覆盖 35 个平台，实现热点趋势追踪、情感分析和相似检索。支持 Docker 部署和多渠道推送通知，帮助用户高效监控舆情，无需编程。

阅读全文 →

2025年11月15日

多代理 LLM 系统无冲突内存同步工程：基于 Memori 的实时协作实践

基于 Memori 内存引擎，工程化多代理 LLM 系统的冲突-free 同步协议，支持实时协作与动态交互，避免中央协调瓶颈。

阅读全文 →

2025年11月15日

谷歌近完美手写识别模型在嵌入式系统中的部署：量化、设备端推理与内存高效分词

探讨谷歌手写识别模型在嵌入式设备上的优化部署策略，包括量化压缩、TensorFlow Lite集成及低功耗实时OCR应用要点。

阅读全文 →

2025年11月15日

RP2040 上 TFEL 的 CPU 卸载策略：低功耗嵌入式 ML 推理

针对 RP2040 平台的低功耗嵌入式 ML 推理，提供 TFEL 中的 CPU 卸载逐步策略，平衡计算分布与内存约束的关键参数和监控要点。

阅读全文 →

2025年11月15日

Standardized Benchmarks and Deployment Strategies for AI Agents with ADK-Go

利用 ADK-Go 的代码优先工具包，探讨 AI 代理的标准评估基准设计、轨迹与响应评估方法，以及容器化部署到 Vertex AI 和 Cloud Run 的策略，确保灵活扩展。

阅读全文 →

2025年11月15日

使用 Milvus 构建可扩展的 ANN 搜索管道

利用 Milvus 的分布式存储、混合索引和实时摄取机制，构建针对亿级向量数据集的 AI 检索管道，提供工程化参数和最佳实践。

阅读全文 →

2025年11月15日

使用混合 HNSW-IVF 索引构建分布式向量搜索：容错分片与亿级数据集亚秒查询

基于Milvus的混合HNSW-IVF索引与容错分片策略，实现亿级向量数据的分布式搜索，提供亚秒级查询响应。

阅读全文 →

2025年11月15日

Helix中WebRTC与AV1编码的动态比特率自适应工程化

针对AI代理桌面流式传输，在Helix平台上工程化AV1编码与WebRTC，实现网络波动下动态比特率调整，维持亚100ms延迟，提供QoS参数与监控要点。

阅读全文 →

2025年11月15日

将 Google 近完美手写模型集成到移动 OCR：TensorFlow Lite 实现实时多语言扫描

探讨如何使用 TensorFlow Lite 将 Google 的高精度手写识别模型部署到移动设备，实现亚 50ms 延迟的实时、多语言、离线 OCR 扫描。包括优化参数、监控要点和潜在风险。

阅读全文 →

第 37 / 66 页 · 共 5280 篇