开源模型注册表:用结构化数据解决 AI 选型信息碎片化
models.dev 通过 TOML 格式的开放数据库,将分散在各家厂商的模型规格、定价与能力指标统一为可查询的结构化数据,降低自动化选型的工程成本。
Latest Essays
继续沿着时间线阅读近期的工程实践与技术观察。
近期的思考与工程笔记。
models.dev 通过 TOML 格式的开放数据库,将分散在各家厂商的模型规格、定价与能力指标统一为可查询的结构化数据,降低自动化选型的工程成本。
解析 Wi-Wi(Wireless 2Way Interferometry)技术如何通过 900MHz 双向信号交换实现 5ns 级时间同步与毫米级测距,以及其在分布式系统中的工程应用价值。
解析 DeepSeek V4 Pro 的定价策略调整,从 MoE 稀疏激活的技术原理到分层定价模型,提供企业级推理成本优化的可落地参数与决策框架。
分析多智能体LLM系统中域名伪装注入攻击的逃逸机制,探索跨工具调用的攻击面与可落地的防御参数。
解析 Bun 实验性 Rust 移植中 13,365 个 unsafe 块的来源分布,梳理 FFI 边界安全策略,给出 69% 代码安全化的工程路径与可落地参数。
从 Anthropic Glasswing 项目出发,解析 AI Agent 自主漏洞发现过程中的可观测性架构设计,提供多智能体安全审计的工程化实施方案与关键参数。
深入解析 TorQ 框架的连接池管理、属性路由、心跳监控、多协议 IPC 及企业级监控告警能力,提供生产环境落地的配置参数与检查清单。
解析 KanBots 如何在看板卡片级别实现多 Agent 并行执行,涵盖 Git Worktree 隔离策略、SQLite 状态同步、Persona 轮转编排及成本管控的工程实践。
分析 yt-dlp 从内置解释器转向外部 JS 运行时的技术决策,探讨 Bun 在兼容性矩阵中的定位及 Node.js API 差异对视频下载工具的影响。
以Microsoft停用Claude Code事件为引,构建AI编码工具的实时成本监控体系,涵盖token消耗追踪、多层级告警阈值与预算熔断的落地参数。
解析 Fincept Terminal 的混合架构设计,探讨 C++20/Qt6 原生性能与 Python 嵌入式分析引擎的协同,以及 100+ 数据连接器的实时流处理模式。
探索基于 Forth 反向波兰表达式的极简模板引擎设计,提供可组合组件的栈操作参数与实现清单。
解析微软官方 dotnet/skills 仓库的 SKILL.md 规范、与 MCP 工具的分层协作关系,以及在实际 .NET 项目中的接入配置与最佳实践。
Google 官方发布的 Chrome DevTools MCP server,让 AI Agent 获得完整的浏览器性能分析、DOM 检查与网络调试能力。
GitHub因员工安装恶意VSCode扩展导致3800个内部仓库被入侵。本文分析扩展权限模型的设计缺陷,并提供可落地的企业级防护参数与监控策略。
基于ShadowCat项目分析浏览器QR文件传输的编码效率、分片策略与重传机制,提供可落地的参数配置与容错设计要点。
剖析AI定价模式的结构性矛盾,揭示推理成本下降与总支出上升的悖论,为企业提供可落地的采购策略与定价模型选择框架。
以Superset为例,解析Agents时代IDE的多代理并行架构、Git worktree状态隔离、实时同步机制与工具调用沙箱的工程实现要点。
从能力差距视角切入,提出LLM工程任务自动化可行性评估的三维模型,帮助技术团队识别AI乘数效应的适用边界与技能升级路径。
解析 Deno 2.4/2.5 中 Workspace 依赖预加载与权限配置化的新特性,探讨边缘运行时架构的安全策略演进与 Node 兼容层性能优化路径。