信息孤岛与搜索碎片化
当前 AI 搜索面临一个结构性困境:每个平台都是一座 walled garden。Google 搜索无法触及 Reddit 评论或 X 帖子,ChatGPT 与 Reddit 有合作但无法搜索 X 或 TikTok,Gemini 拥有 YouTube 但缺少 Reddit 数据,Claude 则原生不支持任何社交平台。用户若需全面了解一个主题,不得不在多个标签页间反复切换,手动拼凑信息碎片。
last30days-skill 的核心价值在于打破这种割裂。它不是一个 "更好的搜索引擎",而是一个Agent 驱动的跨平台信息桥接器—— 通过整合用户自有的 API 密钥和浏览器会话,让单一 Agent 能够同时搜索十几个分散的平台,并基于真实用户参与度(upvotes、likes、赔率)进行评分排序,最终生成结构化的综合报告。
Agent 驱动的研究架构
该技能的架构设计体现了 Agent 系统在处理复杂信息检索任务时的典型模式:
1. 主题解析与实体预研究
v3 版本引入的 "智能搜索" 是架构升级的关键。引擎不再直接搜索关键词,而是先通过 Python 预研究模块理解主题,自动解析出相关的 X handles、GitHub 仓库、Reddit 子版块、YouTube 频道和 TikTok 标签。例如查询 "OpenClaw" 时,引擎会解析出 @steipete(项目创建者)、r/openclaw、r/ClaudeCode 以及相关技术视频频道,然后才发起 API 调用。这种实体解析层大幅提升了搜索的精准度。
2. 并行多源搜索
解析完成后,Agent 向所有可用源并行发起查询:
- Reddit:通过公开 JSON 接口获取帖子与 top comments(含 upvote 数)
- X/Twitter:依赖用户浏览器 session 获取推文与互动数据
- YouTube:使用 yt-dlp 提取视频转录文本
- Polymarket:获取预测市场赔率(反映真实金钱押注的置信度)
- GitHub:查询 PR 速度、仓库 stars、release notes
- TikTok/Instagram/Threads:通过 ScrapeCreators API 获取创作者内容
3. 参与度评分与排序
与传统搜索引擎依赖 SEO 权重不同,该技能采用社交相关性作为核心评分维度:1,500 upvotes 的 Reddit 帖子强于无人阅读的博客文章,3.6M 播放量的 TikTok 视频比新闻稿更具文化信号价值,Polymarket 上 $66K 押注量的赔率比专家猜测更难辩驳。每个结果都携带其参与度指标进入排序流程。
关键技术机制
跨源聚类合并(Cross-source Cluster Merging)
同一事件往往在不同平台以不同形式出现 ——Reddit 上的讨论帖、X 上的反应推文、YouTube 上的深度分析视频。v3 引入的实体重叠检测机制能够识别这些变体,将它们合并为单一信息簇,避免报告中的重复冗余。
GitHub 个人模式(Person-mode)
当查询主题为人物时,引擎自动切换查询策略:不再搜索 "谁提到了这个名字",而是聚焦 "此人正在交付什么"。通过--github-user参数,报告会展示该用户近 30 天的 PR 合并率、活跃仓库、star 数量以及 release notes,形成技术贡献维度的画像。
Best Takes 提取
除相关性评分外,v3 还引入 "幽默 / 病毒度" 评分维度。Reddit 和 X 上的机智评论、病毒式 quote 会被识别并整合进报告的 "Best Takes" 章节,让综合报告不仅信息密集,还保留了社区文化的鲜活感。
可落地的配置参数
对于希望部署或定制该技能的团队,以下是关键配置要点:
零配置即可使用的源:Reddit(含评论)、Hacker News、Polymarket、GitHub
需要额外配置的源:
- X/Twitter:在任意浏览器登录 x.com 即可
- YouTube:
brew install yt-dlp - TikTok/Instagram/Threads/Pinterest:需
SCRAPECREATORS_API_KEY(100 次免费调用后按量付费) - Perplexity Sonar:需
OPENROUTER_API_KEY - Brave Search:
BRAVE_API_KEY(每月 2,000 次免费查询)
输出控制参数:
--emit=html:生成可分享的独立 HTML 简报(含 dark mode、打印友好格式)--store:启用 SQLite 持久化存储,支持趋势监控与定期简报--save-suffix=<name>:为同一主题的多次查询创建变体文件EXCLUDE_SOURCES=tiktok,instagram:排除特定源INCLUDE_SOURCES=youtube_comments,tiktok_comments:包含评论区数据(会增加 API 调用成本)
推理模式:
--competitors:自动发现前 2 个竞品并进行三方对比eli5 on:将综合报告重写为通俗语言版本
典型应用场景
会议前人物研究:/last30days Peter Steinberger 可获取此人近 30 天动态 —— 加入 OpenAI Codex 团队、GitHub 上 23 个 PR 以 85% 合并率推进、r/ClaudeCode 社区对其评价 —— 这些信息不会出现在 LinkedIn 上。
工具选型对比:/last30days OpenClaw vs Hermes vs Paperclip 会并行查询三个项目的 GitHub stars、社区讨论热度、架构差异,生成带引用来源的对比表格。
事件实时追踪:/last30days Iran vs USA 聚合 X 上的实时反应、YouTube 深度分析、Polymarket 预测赔率(如 "12 月 31 日前停火概率 74%"),形成多维度态势感知。
趋势监控:结合--store与scripts/watchlist.py,可设置定时任务监控特定主题的社区讨论变化,并在发现新动态时通过 Slack webhook 推送。
局限与权衡
该架构的约束同样清晰:首先,数据访问依赖用户自有凭证,没有统一的数据授权层,每个源都需要单独配置。其次,部分高价值源(TikTok、Instagram 等)依赖付费 API,大规模使用需考虑成本。最后,时效性受限于各平台索引延迟,Polymarket 和 Reddit 数据实时性较高,但 YouTube 转录和 TikTok 内容可能存在数小时到数天的滞后。
尽管如此,last30days-skill 展示了 Agent 系统在信息聚合领域的工程化路径:不是构建更大的索引,而是编排多个异构数据源,通过实体解析与参与度评分实现跨平台的信息融合。对于需要快速获取社区真实声音的研究者、内容创作者和商务人士,这种模式提供了传统搜索无法替代的价值。
资料来源
- mvanhorn/last30days-skill GitHub 仓库文档
内容声明:本文无广告投放、无付费植入。
如有事实性问题,欢迎发送勘误至 i@hotdrydog.com。