Hotdry.
所有分类

ai-systems

机器智能

LLM 管道:科学论文到动画视频生成

通过 LLM 解析学术论文,提取视觉与叙述元素,利用文本到图像扩散模型和时序插值生成平滑动画视频的工程化实践。

阅读全文 →

Engineering ThalamusDB for Multimodal Queries

ThalamusDB 是一个开源数据库引擎,支持通过 SQL-like 查询统一处理文本、图像和音频等多模态数据。本文探讨其嵌入向量表示、混合索引和语义操作符的工程实现,提供模型配置、近似参数和高效检索的落地指南。

阅读全文 →
51 / 67 页 · 共 5282