TrendRadar：AI聚合35平台热点的情感分析与趋势挖掘工程

在信息爆炸的时代，如何高效捕捉和分析多平台热点新闻，成为企业舆情监控和个人信息获取的关键挑战。TrendRadar 项目通过 AI 驱动的聚合管道，实现了从 35 个主流平台的热点数据采集、筛选到深度分析的无缝工程化流程。本文聚焦其核心 AI 分析模块，强调基于 MCP 协议的 13 个自然语言处理工具在情感分析、趋势跟踪和相似检索方面的应用，帮助读者构建一个无需手动过滤的自动化系统，支持谣言检测和内容深度挖掘。

TrendRadar 的工程管道首先从数据聚合入手。该系统集成 newsnow API，支持知乎、抖音、B 站、华尔街见闻、财联社、微博、百度热搜等 35 个平台（实际默认监控 11 个，可扩展）。管道采用定时爬虫机制，默认每 30 分钟执行一次采集任务，确保实时性。采集后，数据进入关键词筛选阶段，使用配置文件 frequency_words.txt 定义普通词、必须词（+ 前缀）和过滤词（! 前缀），例如监控 “AI + 技术！广告” 以精确捕获相关热点。该阶段的证据在于项目的权重算法：排名权重 0.6、频次权重 0.3、热度权重 0.1，通过公式 score = 0.6 * (1/rank) + 0.3 * frequency + 0.1 * hotness 计算热点优先级，避免平台算法偏差，实现跨平台统一排序。

进入 AI 分析核心，TrendRadar v3.0 引入基于 Model Context Protocol (MCP) 的 13 个工具，这些工具通过自然语言接口（如 Claude Desktop、Cursor）与本地新闻数据交互，支持对话式查询。工具分类为基础查询（get_latest_news、get_news_by_date、get_trending_topics）、智能检索（search_news、search_related_news_history）、高级分析（analyze_topic_trend、analyze_data_insights、analyze_sentiment、find_similar_news、generate_summary_report）和系统管理（get_current_config、get_system_status、trigger_crawl）。例如，情感分析工具 analyze_sentiment 使用预训练 NLP 模型（如 BERT 变体）对新闻标题和摘要进行 polarity scoring，输出正 / 中 / 负情感分数，阈值设为 0.5 以上视为积极。该工具的证据是其在谣言检测中的应用：通过相似检索 find_similar_news 计算余弦相似度 > 0.8 的新闻簇，识别重复传播的虚假信息，避免单源误导。

趋势跟踪是另一个亮点。analyze_topic_trend 工具追踪话题生命周期，从首次出现到热度峰值衰减，参数包括时间窗口（默认 7 天）和最小频次阈值（5 次）。例如，查询 “比特币” 趋势时，它生成时间序列图，预测下一周期热度变化，准确率依赖历史数据积累。证据显示，在项目测试数据（2025 年 11 月 1-15 日）中，该工具成功捕捉 “ChatGPT-5 发布” 从知乎到微博的跨平台扩散路径，峰值时段内出现频次达 15 次。相似检索 search_related_news_history 进一步支持深度挖掘，结合 embedding 模型（如 Sentence Transformers）检索历史相关新闻，参数设置 embedding_dim=768、top_k=10，确保检索相关性 > 0.7。

为实现可落地，该管道提供工程化参数和监控清单。首先，部署方面：优先 Docker 方式，使用 wantcat/trendradar:latest 镜像，挂载 config 和 output 卷。环境变量覆盖机制允许 NAS 用户直接设置 ENABLE_CRAWLER=true、REPORT_MODE=incremental（增量监控，避免重复）、PUSH_WINDOW_ENABLED=true（推送时间 08:00-22:00）。AI 模块需额外安装 uv 工具，运行 python -m mcp_server.server --transport stdio。参数调优：关键词词组用空行分隔，每组≤10 词；权重调整 rank_weight=0.8 适合实时热点，frequency_weight=0.5 适合深度跟踪。推送集成多渠道：企业微信（WEWORK_WEBHOOK_URL）、飞书（FEISHU_WEBHOOK_URL）、ntfy（NTFY_TOPIC，自托管隐私优先）。

监控要点包括：1. 数据完整性 —— 检查 output 目录每日文件生成，阈值 <90% 平台成功率触发警报；2. AI 准确性 —— 定期验证 analyze_sentiment 在标注数据集上的 F1-score>0.85，回滚到默认模型；3. 性能指标 —— 爬虫延迟 < 5s / 平台，MCP 响应 < 2s；4. 风险控制 ——API 限流（newsnow 每日 < 1000 调用），使用代理轮换；5. 回滚策略 —— 若 AI 工具失败，fallback 到规则 - based 筛选。清单式部署步骤：1. Fork 仓库，配置 Secrets；2. 编辑 frequency_words.txt 添加自定义词组；3. 运行 docker-compose up -d；4. 测试 MCP 连接（npx @modelcontextprotocol/inspector）；5. 监控日志（docker logs trend-radar）。

通过这些参数，TrendRadar 不仅实现了无手动过滤的热点聚合，还将 AI 工具工程化为生产级管道。例如，在舆情场景中，情感分析结合相似检索可自动标记 “负面 + 高相似” 簇为潜在谣言，趋势工具预测爆火话题支持内容策略。相比传统工具，该系统零编程门槛，30 秒 GitHub Pages 部署，1 分钟手机通知，真正让算法服务用户。

资料来源：本分析基于 TrendRadar GitHub 仓库（https://github.com/sansan0/TrendRadar），v3.1.0 版本文档和测试数据。

（字数：1028）