Sub2API 是一个用 Go 语言实现的开源 AI API 网关平台,专为统一 Claude、OpenAI、Gemini 等大模型订阅接入而设计。其核心创新在于 “拼车共享” 机制,让团队或社区用户分摊高额订阅成本,同时实现成本优化和原生工具的无缝透传。该项目解决了多 LLM API 碎片化管理的痛点,提供单一 API Key 接入所有上游服务,避免重复订阅和认证复杂性。
在实际工程中,多模型接入常面临订阅昂贵、负载不均和工具兼容问题。以 Claude Pro 月费 20 美元、Gemini Advanced 类似计为例,单人难以负担全栈需求。Sub2API 通过后台管理多个上游账户(支持 OAuth 和 API Key),将订阅额度转化为用户级 API Key,并按 token 使用精确计费。“Sub2API is an AI API gateway platform designed to distribute and manage API quotas from AI product subscriptions (like Claude Code $200/month)。” 平台生成 Key 后,用户调用标准 OpenAI 兼容端点,如 /v1/chat/completions,即可路由至最佳上游。
关键技术实现聚焦智能调度和并发控制。调度算法结合负载均衡、粘性会话(sticky sessions)和故障转移:优先选择 token 剩余最多的账户,并在会话内固定路由,避免上下文切换导致的幻觉或延迟。并发限流分层:用户级默认 5 并发(config.yaml: default.user_concurrency: 5),账户级防止单点过载;全局 rate limiting 通过 rate_multiplier(默认 1.0)调整速率乘数,支持 RPM/TPM 阈值自定义。
计费模块是成本优化的核心,按输入 / 输出 token 实时追踪,计算上游成本后 markup 分摊。Admin Dashboard 提供可视化监控:用户消耗曲线、账户额度余量、Top 消费者榜单。示例:团队 10 人共享一 Claude 账户,月成本分摊至 2 美元 / 人,同时保留原生工具调用,如 Claude 的 tools 参数直接透传至上游,无需代理修改。
部署落地参数清单(推荐 Docker Compose,本地目录版,便于备份):
-
环境准备:
- Docker 20.10+ & Compose v2+
- 创建目录:mkdir sub2api-deploy && cd sub2api-deploy
-
一键脚本:
curl -sSL https://raw.githubusercontent.com/Wei-Shaw/sub2api/main/deploy/docker-deploy.sh | bash docker-compose -f docker-compose.local.yml up -d -
关键 .env 配置(脚本自动生成安全密钥):
POSTGRES_PASSWORD=openssl rand -hex 32 生成 JWT_SECRET=openssl rand -hex 32 # 会话持久 TOTP_ENCRYPTION_KEY=openssl rand -hex 32 # 2FA 支持 SERVER_PORT=8080 -
config.yaml 优化(可选,覆盖 .env):
default: user_concurrency: 10 # 生产调高,视服务器 CPU user_balance: 0.01 # 用户最低余额 USD rate_multiplier: 1.2 # 20% 利润 markup security: url_allowlist: enabled: true allow_insecure_http: false # 生产强制 HTTPS billing: circuit_breaker: true # 计费异常熔断 -
访问与初始化:http://IP:8080,日志 grep admin password 获取初始账号。Wizard 引导连 Postgres/Redis。
升级:docker-compose pull && up -d,支持一键回滚。
监控与运维要点:
- 日志:docker-compose logs -f sub2api,关注调度失败 / 限流事件。
- 指标:Dashboard 查看 QPS、token 消耗、错误率 >5% 报警。
- 扩容:Redis 集群化(host: redis-cluster),Postgres 主从。
- 安全:Turnstile CAPTCHA(release 模式必备),CORS 白名单,响应头过滤。
风险控制:
- 上游不稳:启用 hybrid 调度,Antigravity 专用端点 /antigravity/v1/messages 隔离 Claude。
- 成本超支:设置 user_balance 阈值,低余额自动限流;circuit_breaker 防计费异常。
- 工具兼容:测试 tools passthrough,如 OpenAI function calling 直接代理。
实际案例:开发团队用 Sub2API 接入 Gemini + Claude,共享 2 个 Pro 订阅,月省 80% 成本;Codex CLI 配置 base_url: https://api.sub2api.ai,支持 WebSocket v2 流式输出。
相比通用 proxy,Sub2API 的订阅共享更工程化:token 级审计、Dashboard 自助管理、无缝支持 Gemini Droid/Antigravity。未来可扩展 Sora 等,但当前暂避。
参数调优表:
| 参数 | 默认 | 优化建议 | 场景 |
|---|---|---|---|
| user_concurrency | 5 | 20 | 高 QPS 团队 |
| rate_multiplier | 1.0 | 1.1-1.5 | 盈利模式 |
| jwt.expire_hour | 24 | 168 | 长会话 |
| security.csp | 默认 | 自定义 | 前端安全 |
通过以上配置,Sub2API 可落地为生产级多 LLM relay,实现 99.9% 可用性和成本最小化。
资料来源: