ai-systems

机器智能

2025年10月18日

Patterns from Leaked GPTs Prompts for Multi-Turn Agents

提取泄露 GPTs 提示中的核心模式，聚焦多轮代理的角色、工具与安全设计，提供可复用模板。

阅读全文 →

2025年10月17日

Claude Skills 与 MCP 协议比较：构建高效 AI 代理的原生集成 vs 多模型标准化

比较 Claude Skills 的原生工具集成和推理链与 MCP 的多模型协议，在无需外部编排下构建高效 AI 代理，突出集成简易性和工程参数。

阅读全文 →

2025年10月17日

使用 nanoGPT 构建中型 GPT 微调管道：自定义 PyTorch 循环、LoRA 集成与多 GPU 分布式训练

本文探讨如何利用 nanoGPT 框架高效微调中型 GPT 模型，包括自定义 PyTorch 训练循环的转移学习设置、LoRA 适配器的集成，以及多 GPU 分布式训练的工程实践。提供可落地参数配置和监控要点，帮助开发者在领域特定数据集上快速适配模型。

阅读全文 →

2025年10月17日

使用 Claude Code 构建 Reddit 情感分析仪表板：与 Codex 的速度与准确性比较

利用 Claude Code 快速生成代码，实现 Reddit 评论的实时情感分析仪表板，包括 API 集成和 Streamlit 可视化，并对比其在开发速度和分析准确性上与 Codex 的表现。

阅读全文 →

2025年10月17日

Kronos 金融分词融合：整合 Tick 数据与新闻嵌入

为领域特定金融 LLM 设计融合高频 Tick 数据与新闻嵌入的分词器，处理序列长度与语义对齐，提供工程参数、实现清单与监控要点。

阅读全文 →

2025年10月17日

缓解AI工程中的货物崇拜：通过可重复基准和模块化管道实现实证验证

AI工程中常见的货物崇拜实践往往导致表面优化而无实质性能提升。本文通过可重复基准测试、模块化管道和实证架构测试，提供实用策略，确保真实性能获益。

阅读全文 →

2025年10月17日

使用 MiniMind 快速原型化 GPT 模型：单 GPU 2 小时训练 26M 参数

面向单 GPU 环境，给出 MiniMind 框架下自定义 tokenizer、梯度累积与动态批处理的 PyTorch 训练管道参数与优化要点。

阅读全文 →

2025年10月17日

Skyvern：利用视觉模型与 LLM 规划构建 AI 爬虫

探讨 Skyvern 如何通过自然语言工程化 AI 代理生成 web 爬虫，聚焦视觉 UI 交互与动态数据提取的参数与实践。

阅读全文 →

2025年10月17日

在 Chromium 中嵌入 MCP 服务器：浏览器端多模型 AI 协议执行

探讨 BrowserOS 如何在浏览器环境中嵌入 MCP 服务器，实现客户端侧的多模型 AI 执行、工具调用与上下文管理，提供工程化参数与最佳实践。

阅读全文 →

2025年10月17日

Claude 工具使用技能与 MCP 多模型方法的对比：生产工作流集成优势

评估Claude的工具使用技能在可靠AI代理编排中的作用，与MCP的多模型方法对比，突出生产工作流中的集成优势。提供工程参数和监控要点。

阅读全文 →

2025年10月17日

构建简易 PyTorch 从零 GPT 训练代码库：核心架构、数据加载与评估循环

基于nanoGPT，介绍简化的GPT训练实现，强调核心组件的可移植性和易调试性。

阅读全文 →

2025年10月17日

逆向工程泄露的 GPTs 系统提示：实现自定义多轮代理

基于泄露提示逆向工程，指导实现多轮对话代理，包括角色扮演、工具调用与安全机制。

阅读全文 →

2025年10月17日

Kronos 金融市场基础模型预训练管道工程：领域特定分词化

针对金融时序数据，工程化 Transformer LLM 的预训练管道，使用领域特定分词建模市场动态并预测波动模式，提供可落地参数与实现清单。

阅读全文 →

2025年10月17日

构建最小 PyTorch 管道：2 小时训练 26M GPT 从零开始

使用 MiniMind 框架，从零构建高效训练管道，实现 26M 参数 GPT 模型在 2 小时内的训练，强调可操作参数和监控要点。

阅读全文 →

2025年10月17日

Building Multi-Model AI Pipelines with MCP Java SDK

在Spring Boot应用中使用MCP Java SDK实现多模型AI管道，焦点在上下文传播、请求响应处理及安全模型间通信，提供工程化参数和最佳实践。

阅读全文 →

2025年10月17日

AI 生成代码占比 250% 的工程影响：生产力度量、质量风险与人机协作策略

探讨 AI 生成代码达 250% 的工程含义，包括生产力提升测量、代码质量退化风险，以及大规模开发中人机协作策略。

阅读全文 →

2025年10月17日

金融市场数据预训练管道工程：K线分词、领域嵌入与可扩展Transformer架构

探讨Kronos模型在金融市场数据预训练中的工程实践，包括K线数据的分词策略、领域特定嵌入设计以及Transformer架构的扩展性，实现市场语言理解。

阅读全文 →

2025年10月17日

Kronos: Pretraining a Foundation Model for Financial Market Language

探讨 Kronos 项目在金融 K-line 数据上的预训练方法，包括 tokenizer 设计、数据处理和预测应用，提供工程化参数与落地指南。

阅读全文 →

2025年10月17日

构建开源 Notebook LM 克隆：灵活音频合成与多格式播客生成管道

探索 Open Notebook 项目，聚焦于实现灵活的音频合成、多格式播客生成以及可扩展的多模态处理管道的工程实践与参数配置。

阅读全文 →

2025年10月17日

使用 PaddleOCR 构建多语言 OCR 管道

面向 100+ 语言的 PDF/图像 OCR 引擎构建，集成 LLM 的优化 tokenization 与后处理参数指南。

阅读全文 →

2025年10月17日

Claude Agent Skills API 多轮编排防护栏工程化

工程化 Claude Agent Skills API 中的多轮防护栏，实现动态工具编排的状态一致性、滥用预防与错误恢复，适用于扩展代理工作流。

阅读全文 →

2025年10月17日

工程化实时宠物视觉管道：使用边缘AI和云流式传输进行宠物活动检测

针对宠物活动检测，设计边缘AI实时视觉管道与云流式传输，实现低延迟交互监控，提供工程参数和优化策略。

阅读全文 →

2025年10月17日

客户端逆向工程检测 Gemini 3.0 A/B 测试变体：JS 钩子和网络负载分析

通过浏览器开发者工具逆向客户端 JS 钩子和网络负载，检测生产环境中未公开的 Gemini 3.0 A/B 变体，提供无 API 访问的外部监控参数与监控要点。

阅读全文 →

2025年10月17日

客户端 JavaScript 钩子检测 Gemini 3.0 A/B 测试变体

探讨使用 JS 钩子在客户端检测 Gemini 3.0 特征，支持本地日志、变体识别和性能分析，无需服务器依赖。

阅读全文 →

2025年10月17日

使用自愈 DOM 构建有状态浏览器代理：处理动态 UI 的持久状态与重放机制

构建使用自愈 DOM 映射的有状态浏览器代理，实现弹性 web 自动化，通过持久状态和重放机制应对动态 UI 变化。提供工程化参数和监控要点。

阅读全文 →

2025年10月17日

Gemini 3.0 rollout 的客户端侧 A/B 测试变体检测

实现客户端启发式检测 Gemini 3.0 rollout 的 A/B 测试变体，分析响应模式和特征标志，无需后端访问。

阅读全文 →

2025年10月17日

浏览器代理中自愈 DOM 模糊匹配工程：Levenshtein 距离与重放缓冲区

面向浏览器代理的自愈机制，给出基于 Levenshtein 距离的 DOM 模糊匹配与重放缓冲区状态维护的工程参数与实现要点。

阅读全文 →

2025年10月17日

Claude Skills API 中安全多工具协调：运行时守卫与错误恢复

面向企业 AI 代理工作流，给出 Claude Skills API 中安全多工具协调的运行时守卫、错误恢复和权限范围参数与监控要点。

阅读全文 →

2025年10月17日

Gemini 3.0 A/B测试实验设计：用户分段、指标选择与统计验证

针对Gemini 3.0模型上线，详解A/B测试中的用户分段策略、客观指标选取与统计功效验证方法，避免常见实验陷阱。

阅读全文 →

2025年10月17日

Qwen3-VL 中动态视觉标记优化的实践：自适应裁剪、分辨率缩放与量化

在 Qwen3-VL 中，通过自适应裁剪、分辨率缩放和量化优化动态视觉标记，实现高效的边缘部署和实时多模态推理。详细参数设置和监控策略，确保性能与准确性的平衡。

阅读全文 →

2025年10月17日

Qwen3-VL 中动态视觉分词的工程化实践：自适应处理变分辨率图像

探讨 Qwen3-VL 的动态视觉分词机制，通过像素预算控制实现高效的多模态推理预处理，避免固定裁剪带来的信息丢失与计算浪费，提供参数配置与优化建议。

阅读全文 →

2025年10月17日

集成 Claude Tool Use API 实现多轮代理工作流：工具链、状态持久与错误恢复

在对话 AI 系统中集成 Claude Tool Use API，聚焦多轮工具链、状态管理和错误恢复，提供工程化参数与最佳实践。

阅读全文 →

2025年10月17日

在 SWE-Grep 的 RL 驱动多轮检索中实现缓存层和实时去重

面向 SWE-Grep 的多模型流式输出，给出 RL 驱动检索的缓存管理和去重工程化参数与监控要点。

阅读全文 →

2025年10月17日

Qwen3-VL中视觉-语言grounding的工程实现

探讨Qwen3-VL中使用交错分词、位置嵌入和跨模态注意力机制实现视觉-语言grounding的工程方法，提供图像-文本对齐的关键参数与实践清单。

阅读全文 →

2025年10月17日

Claude Skills API 运行时护栏实现：输入验证、错误恢复与安全工具链

针对 Claude Tool Use API 在生产 AI agents 中的应用，提供运行时输入验证、错误恢复机制及安全工具链的参数配置与监控要点，提升系统可靠性和安全性。

阅读全文 →

2025年10月17日

Gemini 3.0 rollout 的 A/B 测试管道实现：流量分割、实时监控与回退机制

针对 Gemini 3.0 的生产 rollout，探讨 A/B 测试管道的构建，重点包括流量分割策略、实时推理监控要点，以及 fallback 机制，确保模型稳定暴露。

阅读全文 →

2025年10月17日

Waymo 与 DoorDash 自动驾驶配送 API 集成工程实践

探讨 Waymo 自动驾驶车队与 DoorDash 物流系统的 API 集成，实现实时订单分配、动态路由、安全交接和错误恢复的工程参数与协议。

阅读全文 →

2025年10月17日

Anthropic 交互式 CoT 与 Few-Shot 提示工程教程

通过 Anthropic 的 Jupyter 教程框架，构建掌握 Claude 模型 CoT 推理、few-shot 任务适应和 XML 结构化输出的互动练习，提供工程化参数与最佳实践。

阅读全文 →

2025年10月17日

使用 EXO 1.0 优化 LLM 推理管道：DGX Spark 与 Mac Studio 的异构加速

探讨 EXO 1.0 在 Nvidia DGX Spark 和 Apple Mac Studio 上优化 LLM 推理的策略，实现 2.8 倍速度提升和低延迟服务。

阅读全文 →

2025年10月16日

Inkeep 视觉代理构建器：RAG 检索、工具集成与多模态输入的工程实践

Inkeep YC 支持的平台中，工程化视觉拖拽和代码接口构建 AI 代理的实践，包括 RAG 检索、工具集成及多模态处理参数。

阅读全文 →

2025年10月16日

开发 Jupyter 笔记本进行动手提示工程：CoT 逐步推理、Few-Shot 任务适应与 XML 结构化输出

基于交互式教程，指导构建 Jupyter notebooks 来实践提示工程核心技术，实现 AI 开发中 LLM 的可重现交互与高效工作流。

阅读全文 →

2025年10月16日

工程化 SWE-Grep 的 RLHF 数据集管道

针对 SWE-Grep 的 RLHF 数据集工程实践，包括平衡代码检索样本的 curation、人类反馈循环的整合，以及去重技术以实现稳定多轮训练。

阅读全文 →

2025年10月16日

MiniMind 高效数据分词与预处理管道：单 GPU 快速训练 26M GPT

探讨 MiniMind 项目中可扩展的分词和数据预处理工程实践，优化词汇表大小，支持流式数据集加载，实现单 GPU 上 2 小时内训练 26M 参数 GPT 模型的关键参数与策略。

阅读全文 →

2025年10月16日

工程化 SWE-Grep-Mini 的 RL 策略：高效多轮代码上下文检索

在 SWE-Grep-Mini 中工程化 RL 策略，实现快速多轮代码检索。焦点包括轻量级模型效率、基于相似性的去重，以及在受限环境中 sub-100ms 延迟。提供参数配置、监控要点和最佳实践。

阅读全文 →

2025年10月16日

人形机器人奥运挑战：平衡木与跳马的强化学习策略与仿真到现实转移技术

为人形机器人设计RL策略和sim-to-real转移技术，处理奥运平衡木和跳马，焦点实时感知与执行器控制。

阅读全文 →

2025年10月16日

通过 Claude Tool Use API 实现自定义技能

面向生产 AI 系统，利用 Claude API 的工具使用功能集成外部工具、函数调用，实现代理行为。提供工程化参数、示例代码与监控策略。

阅读全文 →

2025年10月16日

为SWE-Grep设计RL奖励函数：使用相似度阈值和去重指标优化多轮代码检索

探讨RL奖励函数在SWE-Grep多轮代码检索中的设计，强调相似度阈值和去重指标的应用，以实现低延迟的高效检索。

阅读全文 →

2025年10月16日

Qwen3-VL 中跨模态 Token 融合与注意力掩码工程化：实时图像-文本对齐优化

探讨 Qwen3-VL 的跨模态 token 融合机制与注意力掩码策略，实现高效图像-文本对齐，支持实时多模态推理管道的工程实践参数与监控要点。

阅读全文 →

2025年10月16日

Modded NanoGPT 单 GPU 快速训练优化：数据管道增强与 Torch.compile 加速

在单 GPU 环境下优化 nanoGPT 代码库，实现 124M 参数 GPT 模型 3 分钟训练，聚焦数据管道改进、Torch.compile 加速及开销降低策略，提供工程参数和监控要点。

阅读全文 →

2025年10月16日

LLM Cookbook 中的提示工程、RAG 集成与微调工程实践本地复现

基于吴恩达 LLM 课程的中文 cookbook，本文提供提示工程的最佳提示模板、RAG 系统的本地部署参数以及微调管道的完整实现指南，支持开发者快速上手工程实践。

阅读全文 →

2025年10月16日

Zed 编辑器集成 OpenAI Codex：实时 AI 代码补全与生成工作流

通过 ACP 协议在 Zed 中集成 Codex，提供高效的 AI 代码辅助，包含终端处理优化与配置参数。

阅读全文 →

2025年10月16日

强化学习驱动的 SWE-Grep：多轮快速上下文检索优化

通过 RL 训练 SWE-Grep 模型，实现软件工程代理的多轮并行工具调用，显著提升编码任务的长上下文检索效率，提供工程参数与监控要点。

阅读全文 →

2025年10月16日

Gemini 3.0 rollout 的 A/B 测试管道实现：流量路由、金丝雀发布与性能监控

面向 Gemini 3.0 模型 rollout，给出 A/B 测试管道的工程化参数、流量路由策略与性能监控清单。

阅读全文 →

2025年10月16日

RTFM：结合世界模型与3D高斯溅射实现亚100ms实时视频帧预测

面向实时视频应用，给出世界模型驱动的3D高斯场景合成参数与优化策略。

阅读全文 →

2025年10月16日

工程化图链接元胞自动机：超越网格模拟的复杂网络建模

基于 LACE 框架，探讨如何通过动态链接工程化元胞自动机，以模拟复杂网络和涌现模式，提供参数配置与实现指南。

阅读全文 →

2025年10月16日

Ollama 多模型编排在编码工作流中的工程实践

利用 Ollama 实现 CodeGemma 和 DeepSeek-Coder 的低延迟模型切换与编排，提供自定义 API 链式用于 IDE 集成，提升编码效率。

阅读全文 →

2025年10月16日

Qwen3-VL 中跨模态注意力层的优化：面向边缘部署的高效视觉语言融合

探讨 Qwen3-VL 模型中跨模态注意力机制的优化策略，包括 DeepStack 融合和知识蒸馏，实现低延迟多模态推理，支持边缘设备部署。

阅读全文 →

2025年10月16日

从泄露的自定义 GPT 提示中逆向工程：提取链式思考、工具调用与多模态代理编排的高级模式

通过分析泄露的 GPT 提示，提取链式思考推理、工具调用机制以及多模态代理编排的工程化模式，提供生产级 AI 工作流的实用参数与实现清单。

阅读全文 →

2025年10月16日

Qwen3-VL 跨模态注意力融合：实现可扩展零样本多模态推理

Qwen3-VL 通过动态路由对齐视觉和文本嵌入的跨模态注意力融合机制，提供工程化参数和监控要点，支持高效的多模态任务处理。

阅读全文 →

2025年10月16日

Inkeep 代理构建器：多模态 RAG 管道与工具调用的实现

基于 Inkeep 开源框架，探讨多模态 RAG 在代理构建中的集成策略、参数优化与动态检索机制。

阅读全文 →

2025年10月16日

基于开源框架实现 Inkeep 风格的 AI 代理构建器：RAG 管道、工具调用与多模态支持

探索使用 LangChain 和 LlamaIndex 等开源工具构建可扩展的企业搜索与自动化 AI 代理，支持 RAG 管道、工具调用和多模态输入，媲美商业解决方案如 Inkeep。

阅读全文 →

2025年10月16日

使用自愈 DOM 映射构建有状态浏览器代理

通过自愈 DOM 映射技术，构建能够处理动态 UI 变化并维护跨会话交互状态的浏览器代理，提供工程化参数与监控要点。

阅读全文 →

2025年10月16日

Ollama API 集成 CodeGemma 与 DeepSeek-Coder：本地代码自动补全、重构及多语言支持

利用 Ollama API 集成 CodeGemma 和 DeepSeek-Coder 模型，实现本地代码自动补全、重构及多语言编程支持，提供自定义提示工程与优化参数。

阅读全文 →

2025年10月16日

部署 Qwen3-VL：优化分词、缓存与并行处理实现实时视觉语言任务

针对视觉语言任务，阐述 Qwen3-VL 的部署优化策略，包括分词控制、缓存配置和并行计算参数，以实现高效实时多模态应用。

阅读全文 →

2025年10月16日

使用 Claude Haiku 4.5 的工具使用和函数调用工程化代理工作流

面向 Claude Haiku 4.5 的高级工具使用功能，提供精确的 API 编排和错误恢复的任务分解参数与实践指南。

阅读全文 →

2025年10月16日

Ollama 中编码 LLM 部署优化：自定义量化、GPU 加速与 VS Code 扩展集成

通过自定义量化减少内存占用、启用 GPU 加速提升推理速度，并在 VS Code 中无缝集成，实现亚秒级代码补全。适用于新兴编码模型的本地部署优化。

阅读全文 →

2025年10月16日

将 Claude 4.5 Haiku 的多模态能力集成到 AI 代理中：视觉-语言任务的 token 流式处理与上下文管理

探讨 Claude 4.5 Haiku 新多模态功能的 AI 代理集成，聚焦高效 token 流式输出、上下文管理和工程化参数。

阅读全文 →

2025年10月16日

实现 Transformer LLM 的自定义 PyTorch 训练循环

面向从头构建 LLM，介绍自定义训练循环的关键组件与工程化参数，确保高效训练小规模模型。

阅读全文 →

2025年10月16日

使用 Spring Boot 和 Spring AI Alibaba 构建模块化代理式 AI 管道

基于 Spring AI Alibaba，在 Java 中实现 LLM 编排、工具集成与企业级部署的模块化代理管道，提供工程化参数与实践清单。

阅读全文 →

2025年10月16日

基于 Jupyter 的 Claude 提示工程交互式教程构建：链式思考、少样本与 XML 标记技术

本文探讨如何利用 Anthropic 的交互式教程框架，在 Jupyter 中构建 Claude 提示工程学习模块，重点介绍链式思考、少样本提示和 XML 标记技巧，实现可重复的 LLM 交互实验。

阅读全文 →

2025年10月16日

使用多代理工作流开发 AI 驱动的 Web 自动化 Chrome 扩展

基于多代理系统和本地 LLM API，开发隐私保护的 Chrome 扩展，实现无云依赖的 web 自动化任务执行。

阅读全文 →

2025年10月16日

Ollama 中集成 CodeGemma 和 DeepSeek Coder：本地高效代码生成与自动补全

探索如何在 Ollama 中部署轻量级代码模型 CodeGemma 和 DeepSeek Coder，实现本地代码生成和自动补全管道，提升开发效率并确保数据隐私。

阅读全文 →

2025年10月16日

前沿 LLM 在税务计算任务上的评估管道设计：少样本提示、错误分类与财政准确性指标

面向税务计算任务，探讨前沿 LLM 的评估管道设计，包括少样本提示策略、错误分类方法以及针对财政准确性的指标设计。

阅读全文 →

2025年10月16日

用 Minimind 构建 26M 参数 GPT 的最小 PyTorch 训练管道：2 小时从零训练

基于 Minimind 项目，介绍从数据分词到 LoRA 微调的 PyTorch 管道，实现快速训练小规模 GPT 模型的工程实践。

阅读全文 →

2025年10月16日

构建 IRS 税务事实的联邦 RDF 图：SPARQL 端点与合规工具集成

面向 IRS 税务事实，介绍联邦 RDF 图构建与 SPARQL 端点的工程化实现，支持合规工具的高效查询与集成。

阅读全文 →

2025年10月16日

基于 TxGemma 微调预测癌症治疗路径：蛋白交互图与湿实验验证

利用 TxGemma 模型微调蛋白交互图数据，预测新型癌症治疗路径，并整合湿实验验证管道，实现药物发现加速。

阅读全文 →

2025年10月16日

使用优化分词和缓存构建 Claude 3.5 Haiku 的低延迟推理管道

在资源受限环境中实现实时 AI 响应：Claude 3.5 Haiku 的 tokenization 优化与缓存工程实践。

阅读全文 →

2025年10月16日

LangChain.js 中模块化 LLM 链：结合 RAG 和工具调用构建可扩展 AI 代理

Node.js 环境下，LangChain.js 的 RAG 与工具调用实现，助力可扩展 AI 代理开发，包括链式组合、检索策略与 agent 工作流。

阅读全文 →

2025年10月16日

nanoGPT 从零训练管道：PyTorch 单GPU 高效设置指南

基于 nanoGPT，构建 PyTorch 环境，实现高效数据加载、因果自注意力及梯度检查点，用于单 GPU GPT 训练。

阅读全文 →

2025年10月16日

在语言模型中实现递归架构：提升组合性和长程依赖处理

递归语言模型通过树状结构处理输入，提升AI推理中的组合性和长程依赖。讨论实现参数、监控要点与潜在风险。

阅读全文 →

第 49 / 66 页 · 共 5280 篇