使用 perf 缓存未命中率启发式分类 CPU/IO 负载:快速诊断与优化参数
借鉴 Lemire 性能诊断启发式,利用 perf cache miss 比率快速分类工作负载为 CPU 或 I/O 绑定,提供阈值、命令清单与针对性优化路径。
Latest Essays
继续沿着时间线阅读近期的工程实践与技术观察。
近期的思考与工程笔记。
借鉴 Lemire 性能诊断启发式,利用 perf cache miss 比率快速分类工作负载为 CPU 或 I/O 绑定,提供阈值、命令清单与针对性优化路径。
基于ai-engineering-hub仓库Jupyter示例,实现生产级RAG:混合搜索提升召回、Agent编排路由查询、Opik评估框架监控准确性,提供工程参数与清单。
使用 Claude 3.5 Sonnet 的 one-shot prompting 实现精确二进制反汇编,提供 scorer、工具链和 prompt 参数,适用于 N64 等 MIPS binary。
针对高性能系统工程,区分 CPU/I/O 绑定类型,量化缓存 miss 代价,并给出 perf 基准工具与优化参数,实现 2-5 倍加速。
基于 Polkadot SDK,利用 Substrate FRAME pallets 模块化组装 parachain runtime,支持自定义逻辑、XCM 跨链消息,并共享中继链安全的关键配置与落地步骤。
基于AI Engineering Hub项目,详解RAG检索优化、多代理协作架构及生产部署pipeline的工程参数、监控要点与落地清单。
剖析 Divine-D Rev.1.1 针对原生 Linux 移动 OS 的硬件设计要点,包括 ARM SoC 集成、电源管理电路、外设驱动支持及启动优化,提供可落地工程参数和优化清单。
从AI Engineering Hub真实教程中提炼可扩展RAG管道、混合检索和代理编排模式,提供工程参数、阈值和生产部署清单。
基于 Nuclei-templates 仓库,详解 YAML 模板结构、CVE 扫描参数与生产优化策略,确保 web/API/云漏洞高效低误报检测。
Lynx C++ 引擎通过原生渲染与双线程架构,实现桌面/移动 Web UI 高性能输出,提供构建参数、性能阈值与监控清单。
Trivy 是 Go 实现的开源安全扫描工具,支持多目标统一检测漏洞、误配置、敏感密钥及 SBOM 生成/分析,提供 CLI 参数、忽略规则与 CI/CD 集成要点。
利用 Anthropic 官方 Claude Quickstarts 的 Python/Node 模板,快速构建集成工具调用、结构化输出、RAG 和 Agent 的生产级 AI 应用,提供详细部署参数、优化清单与监控要点。
Uncloud 通过 WireGuard Mesh 网络和 Corrosion CRDT 数据库实现 Docker 主机的无中心联邦:自动 peer 发现、滚动部署的关键参数与实践要点。
工程化HRM分层架构,实现单pass复杂推理:高层规划、低层执行的参数配置与监控要点。
Uncloud 通过 WireGuard mesh 和去中心化状态同步,实现跨多 Docker 主机的容器部署管理,支持 Compose YAML、自动 HTTPS,桥接 K8s 原语而无集群开销。
Foundry 提供共享训练器和管道组件,支持蛋白质设计、折叠与逆折叠模型,实现生物分子 AI 的高效工程化部署。
RustFS 通过动态阈值调优和低校验分片配置优化 4KB 对象纠删码,实现 2.3x MinIO 加速,支持 S3 无缝迁移的工程参数与实践。
针对 4KB 小负载优化 RustFS 纠删码阈值,实现 2.3 倍 MinIO 加速;详解零拷贝 I/O 配置、S3 兼容迁移协议及生产参数清单。
针对 4KB 对象负载,通过 parity shard 调优、block_size 设置为 4KB、零拷贝路径和 SIMD 加速,RustFS 实现 2.3x MinIO 性能提升,支持 S3 平滑迁移与共存。
通过字幕同步和高效图像索引,实现对300万《辛普森一家》截图的帧级精确搜索,提供数据管道、索引参数与 scaling 工程实践。