跨平台研究Agent技能：多源信息聚合与结构化综合报告生成

信息孤岛与搜索碎片化

当前 AI 搜索面临一个结构性困境：每个平台都是一座 walled garden。Google 搜索无法触及 Reddit 评论或 X 帖子，ChatGPT 与 Reddit 有合作但无法搜索 X 或 TikTok，Gemini 拥有 YouTube 但缺少 Reddit 数据，Claude 则原生不支持任何社交平台。用户若需全面了解一个主题，不得不在多个标签页间反复切换，手动拼凑信息碎片。

last30days-skill 的核心价值在于打破这种割裂。它不是一个 "更好的搜索引擎"，而是一个Agent 驱动的跨平台信息桥接器—— 通过整合用户自有的 API 密钥和浏览器会话，让单一 Agent 能够同时搜索十几个分散的平台，并基于真实用户参与度（upvotes、likes、赔率）进行评分排序，最终生成结构化的综合报告。

Agent 驱动的研究架构

该技能的架构设计体现了 Agent 系统在处理复杂信息检索任务时的典型模式：

1. 主题解析与实体预研究

v3 版本引入的 "智能搜索" 是架构升级的关键。引擎不再直接搜索关键词，而是先通过 Python 预研究模块理解主题，自动解析出相关的 X handles、GitHub 仓库、Reddit 子版块、YouTube 频道和 TikTok 标签。例如查询 "OpenClaw" 时，引擎会解析出 @steipete（项目创建者）、r/openclaw、r/ClaudeCode 以及相关技术视频频道，然后才发起 API 调用。这种实体解析层大幅提升了搜索的精准度。

2. 并行多源搜索

解析完成后，Agent 向所有可用源并行发起查询：

Reddit：通过公开 JSON 接口获取帖子与 top comments（含 upvote 数）
X/Twitter：依赖用户浏览器 session 获取推文与互动数据
YouTube：使用 yt-dlp 提取视频转录文本
Polymarket：获取预测市场赔率（反映真实金钱押注的置信度）
GitHub：查询 PR 速度、仓库 stars、release notes
TikTok/Instagram/Threads：通过 ScrapeCreators API 获取创作者内容

3. 参与度评分与排序

与传统搜索引擎依赖 SEO 权重不同，该技能采用社交相关性作为核心评分维度：1,500 upvotes 的 Reddit 帖子强于无人阅读的博客文章，3.6M 播放量的 TikTok 视频比新闻稿更具文化信号价值，Polymarket 上 $66K 押注量的赔率比专家猜测更难辩驳。每个结果都携带其参与度指标进入排序流程。

关键技术机制

跨源聚类合并（Cross-source Cluster Merging）

同一事件往往在不同平台以不同形式出现 ——Reddit 上的讨论帖、X 上的反应推文、YouTube 上的深度分析视频。v3 引入的实体重叠检测机制能够识别这些变体，将它们合并为单一信息簇，避免报告中的重复冗余。

GitHub 个人模式（Person-mode）

当查询主题为人物时，引擎自动切换查询策略：不再搜索 "谁提到了这个名字"，而是聚焦 "此人正在交付什么"。通过--github-user参数，报告会展示该用户近 30 天的 PR 合并率、活跃仓库、star 数量以及 release notes，形成技术贡献维度的画像。

Best Takes 提取

除相关性评分外，v3 还引入 "幽默 / 病毒度" 评分维度。Reddit 和 X 上的机智评论、病毒式 quote 会被识别并整合进报告的 "Best Takes" 章节，让综合报告不仅信息密集，还保留了社区文化的鲜活感。

可落地的配置参数

对于希望部署或定制该技能的团队，以下是关键配置要点：

零配置即可使用的源：Reddit（含评论）、Hacker News、Polymarket、GitHub

需要额外配置的源：

X/Twitter：在任意浏览器登录 x.com 即可
YouTube：brew install yt-dlp
TikTok/Instagram/Threads/Pinterest：需SCRAPECREATORS_API_KEY（100 次免费调用后按量付费）
Perplexity Sonar：需OPENROUTER_API_KEY
Brave Search：BRAVE_API_KEY（每月 2,000 次免费查询）

输出控制参数：

--emit=html：生成可分享的独立 HTML 简报（含 dark mode、打印友好格式）
--store：启用 SQLite 持久化存储，支持趋势监控与定期简报
--save-suffix=<name>：为同一主题的多次查询创建变体文件
EXCLUDE_SOURCES=tiktok,instagram：排除特定源
INCLUDE_SOURCES=youtube_comments,tiktok_comments：包含评论区数据（会增加 API 调用成本）

推理模式：

--competitors：自动发现前 2 个竞品并进行三方对比
eli5 on：将综合报告重写为通俗语言版本

典型应用场景

会议前人物研究：/last30days Peter Steinberger 可获取此人近 30 天动态 —— 加入 OpenAI Codex 团队、GitHub 上 23 个 PR 以 85% 合并率推进、r/ClaudeCode 社区对其评价 —— 这些信息不会出现在 LinkedIn 上。

工具选型对比：/last30days OpenClaw vs Hermes vs Paperclip 会并行查询三个项目的 GitHub stars、社区讨论热度、架构差异，生成带引用来源的对比表格。

事件实时追踪：/last30days Iran vs USA 聚合 X 上的实时反应、YouTube 深度分析、Polymarket 预测赔率（如 "12 月 31 日前停火概率 74%"），形成多维度态势感知。

趋势监控：结合--store与scripts/watchlist.py，可设置定时任务监控特定主题的社区讨论变化，并在发现新动态时通过 Slack webhook 推送。

局限与权衡

该架构的约束同样清晰：首先，数据访问依赖用户自有凭证，没有统一的数据授权层，每个源都需要单独配置。其次，部分高价值源（TikTok、Instagram 等）依赖付费 API，大规模使用需考虑成本。最后，时效性受限于各平台索引延迟，Polymarket 和 Reddit 数据实时性较高，但 YouTube 转录和 TikTok 内容可能存在数小时到数天的滞后。

尽管如此，last30days-skill 展示了 Agent 系统在信息聚合领域的工程化路径：不是构建更大的索引，而是编排多个异构数据源，通过实体解析与参与度评分实现跨平台的信息融合。对于需要快速获取社区真实声音的研究者、内容创作者和商务人士，这种模式提供了传统搜索无法替代的价值。

资料来源

mvanhorn/last30days-skill GitHub 仓库文档

ai-systems

内容声明：本文无广告投放、无付费植入。

如有事实性问题，欢迎发送勘误至 i@hotdrydog.com。