Hotdry.
ai-systems

Sub2API:统一多 LLM API 中继与订阅拼车共享

Sub2API 是 Go 开源项目,提供 Claude/OpenAI/Gemini 等 API 统一网关,支持订阅共享分摊成本、token 级计费、智能调度与原生工具透传。详述部署参数、优化阈值与监控策略。

Sub2API 是一个用 Go 语言实现的开源 AI API 网关平台,专为统一 Claude、OpenAI、Gemini 等大模型订阅接入而设计。其核心创新在于 “拼车共享” 机制,让团队或社区用户分摊高额订阅成本,同时实现成本优化和原生工具的无缝透传。该项目解决了多 LLM API 碎片化管理的痛点,提供单一 API Key 接入所有上游服务,避免重复订阅和认证复杂性。

在实际工程中,多模型接入常面临订阅昂贵、负载不均和工具兼容问题。以 Claude Pro 月费 20 美元、Gemini Advanced 类似计为例,单人难以负担全栈需求。Sub2API 通过后台管理多个上游账户(支持 OAuth 和 API Key),将订阅额度转化为用户级 API Key,并按 token 使用精确计费。“Sub2API is an AI API gateway platform designed to distribute and manage API quotas from AI product subscriptions (like Claude Code $200/month)。” 平台生成 Key 后,用户调用标准 OpenAI 兼容端点,如 /v1/chat/completions,即可路由至最佳上游。

关键技术实现聚焦智能调度和并发控制。调度算法结合负载均衡、粘性会话(sticky sessions)和故障转移:优先选择 token 剩余最多的账户,并在会话内固定路由,避免上下文切换导致的幻觉或延迟。并发限流分层:用户级默认 5 并发(config.yaml: default.user_concurrency: 5),账户级防止单点过载;全局 rate limiting 通过 rate_multiplier(默认 1.0)调整速率乘数,支持 RPM/TPM 阈值自定义。

计费模块是成本优化的核心,按输入 / 输出 token 实时追踪,计算上游成本后 markup 分摊。Admin Dashboard 提供可视化监控:用户消耗曲线、账户额度余量、Top 消费者榜单。示例:团队 10 人共享一 Claude 账户,月成本分摊至 2 美元 / 人,同时保留原生工具调用,如 Claude 的 tools 参数直接透传至上游,无需代理修改。

部署落地参数清单(推荐 Docker Compose,本地目录版,便于备份):

  1. 环境准备

    • Docker 20.10+ & Compose v2+
    • 创建目录:mkdir sub2api-deploy && cd sub2api-deploy
  2. 一键脚本

    curl -sSL https://raw.githubusercontent.com/Wei-Shaw/sub2api/main/deploy/docker-deploy.sh | bash
    docker-compose -f docker-compose.local.yml up -d
    
  3. 关键 .env 配置(脚本自动生成安全密钥):

    POSTGRES_PASSWORD=openssl rand -hex 32 生成
    JWT_SECRET=openssl rand -hex 32  # 会话持久
    TOTP_ENCRYPTION_KEY=openssl rand -hex 32  # 2FA 支持
    SERVER_PORT=8080
    
  4. config.yaml 优化(可选,覆盖 .env):

    default:
      user_concurrency: 10  # 生产调高,视服务器 CPU
      user_balance: 0.01    # 用户最低余额 USD
      rate_multiplier: 1.2  # 20% 利润 markup
    security:
      url_allowlist:
        enabled: true
        allow_insecure_http: false  # 生产强制 HTTPS
    billing:
      circuit_breaker: true  # 计费异常熔断
    
  5. 访问与初始化http://IP:8080,日志 grep admin password 获取初始账号。Wizard 引导连 Postgres/Redis。

升级:docker-compose pull && up -d,支持一键回滚。

监控与运维要点:

  • 日志:docker-compose logs -f sub2api,关注调度失败 / 限流事件。
  • 指标:Dashboard 查看 QPS、token 消耗、错误率 >5% 报警。
  • 扩容:Redis 集群化(host: redis-cluster),Postgres 主从。
  • 安全:Turnstile CAPTCHA(release 模式必备),CORS 白名单,响应头过滤。

风险控制:

  1. 上游不稳:启用 hybrid 调度,Antigravity 专用端点 /antigravity/v1/messages 隔离 Claude。
  2. 成本超支:设置 user_balance 阈值,低余额自动限流;circuit_breaker 防计费异常。
  3. 工具兼容:测试 tools passthrough,如 OpenAI function calling 直接代理。

实际案例:开发团队用 Sub2API 接入 Gemini + Claude,共享 2 个 Pro 订阅,月省 80% 成本;Codex CLI 配置 base_url: https://api.sub2api.ai,支持 WebSocket v2 流式输出。

相比通用 proxy,Sub2API 的订阅共享更工程化:token 级审计、Dashboard 自助管理、无缝支持 Gemini Droid/Antigravity。未来可扩展 Sora 等,但当前暂避。

参数调优表:

参数 默认 优化建议 场景
user_concurrency 5 20 高 QPS 团队
rate_multiplier 1.0 1.1-1.5 盈利模式
jwt.expire_hour 24 168 长会话
security.csp 默认 自定义 前端安全

通过以上配置,Sub2API 可落地为生产级多 LLM relay,实现 99.9% 可用性和成本最小化。

资料来源

查看归档