工程化 Perplexica 的多模态 RAG 扩展:支持图像/文本混合查询
基于 Perplexica 开源框架,扩展多模态 RAG 管道,实现图像与文本混合查询的本地 LLM 推理与向量嵌入,保障隐私搜索。
Latest Essays
继续沿着时间线阅读近期的工程实践与技术观察。
近期的思考与工程笔记。
基于 Perplexica 开源框架,扩展多模态 RAG 管道,实现图像与文本混合查询的本地 LLM 推理与向量嵌入,保障隐私搜索。
探讨如何工程化12k维嵌入模型,实现概念密集打包,支持可扩展语义搜索,重点包括余弦阈值去重和向量量化加速子线性查询。
面向LLM中的概念打包,给出12k维嵌入的工程优化参数、检索阈值与密度指标监控要点。
面向多交易所交易,给出 CCXT 统一 API 的工程化实现,包括订单管理、实时数据和速率控制要点。
探讨如何在12k维度嵌入中实现概念打包,压缩亿级知识令牌,支持无损高效的语义检索与RAG系统。
探讨 Gentoo ebuilds 在构建可验证机器学习模型、沙箱化 AI 训练环境及隔离依赖方面的工程实践,以降低发行版 AI 包的供应链风险。
探讨 GrapheneOS hardened_malloc 的工程实现,包括利用缓解机制如保护页和随机化,以及与验证引导的集成,提供可落地参数和监控要点。
针对 Let's Encrypt OCSP 服务结束,提供分布式 TLS 基础设施中 CRL 缓存、stapling 替代方案和预取策略的工程实现指南,确保证书验证无缝无延迟峰值。
面向可扩展的检索增强生成,探讨使用稀疏表示和语义聚类压缩海量概念知识到紧凑嵌入的技术。
探讨分层多代理系统中并行子代理执行的工程实践,包括任务分解、异步协调与资源优化参数。
探讨顶级规划代理的设计与实现,用于任务分解和协调专化子代理,实现深度研究与通用任务的并行执行,提供工程参数与落地策略。
在分层多代理系统中,设计顶层规划代理以协调专业下层代理,实现复杂任务的自动化分解与跨领域执行。提供工程参数、协调机制与落地指南,确保高效性和可扩展性。
基于 dagger.js 探讨无构建 JS 运行时框架的设计,通过细粒度响应信号和轻量 DOM reconciliation,实现即时加载微应用的工程参数与落地指南。
面向轻量级微框架,探讨dagger.js的buildless运行时设计,给出信号响应、DOM diff参数与无捆绑器部署要点。
面向轻量级微应用,给出 Dagger.js 无构建运行时的工程化信号响应与 DOM 优化要点。
利用 Genkit Flows 在 Node.js 上构建可组合的多 LLM 管道,集成 RAG、向量数据库和代理机制,提供实用参数与部署指南。
通过 Haystack 框架的模块化组件,连接 LLM 模型、向量数据库和检索器,构建高效 RAG 管道。提供索引与查询管道配置、混合检索参数及代理编排指南,确保生产级部署与监控。
基于 simdjson 库,利用 SIMD 加速在数据管道中高效解析 JSON,支持结构索引、错误恢复和零分配嵌套数据处理,提供工程参数与监控要点。
面向浏览器AI代理,给出基于Web Workers的沙箱化和权限检查的工程化参数与安全要点。
基于 x86 架构,从零构建最小 OS 内核,集成 GRUB 引导程序,实现页式内存管理、IDT 中断处理和基本进程调度,无需外部库。