在 LLM 时代,Claude、Gemini 等高级模型订阅费用高企,三五好友拼车分摊是常见需求,但第三方镜像站存在隐私泄露、性能不稳和价格不透明等问题。自建代理服务如 Claude Relay Service (CRS) 提供完美解决方案:数据直连官方 API,仅经自家服务器转发,确保隐私安全;小团队使用下性能稳定;token 使用统计透明,便于精确分摊成本。本文聚焦 CRS 的工程化部署与接入实践,给出可落地参数清单,帮助团队快速上线统一 LLM 接入口,支持原生工具如 Claude Code 无缝兼容。
自建优势与适用场景
自建代理的核心价值在于成本分摊透明化。以 Claude Max 订阅(约 200 美元 / 月)为例,3-5 人分摊每月人均 40-70 美元,远低于官方单人订阅。服务内置使用统计,按 Key 记录每个人的输入 / 输出 token,月结时直接按官方计费公式(Claude 3.5 Sonnet 输入 $3 / 百万 token,输出 $15 / 百万)分账,避免纠纷。
证据显示,第三方镜像常因高峰拥堵导致延迟 >10s,而自建仅服务内部用户,RTT <500ms。隐私上,直连 Anthropic API 无中间记录,适合商业场景。
适用团队:技术基础中等、3-10 人、月 token 消耗 <10M 的开发 / 研究小组。硬件门槛低:1 核 1GB 内存 VPS(月费 30-60 元),选美西 / 新加坡节点避开 Cloudflare 拦截。
一键部署参数清单
CRS 提供脚本化部署,5 分钟上线。优先脚本,其次 Docker,手动备选。
脚本部署(推荐,非 Docker 用户):
-
执行安装:
curl -fsSL https://pincc.ai/manage.sh -o manage.sh && chmod +x manage.sh && ./manage.sh install交互提示:
- 安装目录:
~/claude-relay-service - 服务端口:
3000(避开 80/443,留给反向代理) - Redis 地址:
localhost,端口6379,密码空(生产设强密码)
自动安装 Node.js 18+、Redis,生成管理员凭据存
data/init.json。 - 安装目录:
-
管理命令:
命令 作用 参数示例 crs start启动 - crs status状态 检查 PID / 端口 crs update升级 拉最新代码
Docker Compose 部署(容器化首选):
下载脚本生成 docker-compose.yml:
curl -fsSL https://pincc.ai/crs-compose.sh -o crs-compose.sh && chmod +x crs-compose.sh && ./crs-compose.sh
编辑 .env:
JWT_SECRET=随机32+字符(如 openssl rand -hex 32)
ENCRYPTION_KEY=精确32字符(如 0123456789abcdef0123456789abcdef)
ADMIN_USERNAME=admin
ADMIN_PASSWORD=SecurePass123!
REDIS_PASSWORD=redis_pass
LOG_LEVEL=info
启动:docker-compose up -d。数据持久 ./data ./logs。健康检查:curl http://IP:3000/health。
硬件 / 网络阈值:
- CPU: 1 核(峰值 20% 负载 / 人)
- 内存: 1GB(Redis 峰值 200MB)
- 带宽: 10Mbps 上 / 下(token 流式传输)
- 位置:非大陆阿里 / 腾讯海外(Cloudflare 拦截率 100%),优先 Vultr/Linode 美西。
回滚:crs stop && crs uninstall,数据清空。
账户与 Key 配置:分摊核心
-
访问面板:
http://IP:3000/web,用 init.json 登录。 -
添加 Claude 账户(OAuth,必科学上网):
- 标签 “Claude 账户” > “添加账户”
- 可设静态代理 IP(防多 IP 封禁)
- 生成授权链接 > Claude.ai 登录 > 复制 code 粘贴
- 支持多账户轮换,异常自动切换。
-
创建 API Key(分摊单位):
- 标签 “API Keys” > “创建新 Key”
- 名称:
user-zhangsan - 限制参数(防滥用):
限制类型 推荐阈值 目的 速率 (req/min) 60 防刷 Token / 窗口 (1h) 500K in/250K out 月 10M 预算 并发 3 服务器负载 模型白名单 claude-3.5-sonnet,gemini-2.5-pro 成本控制 客户端 ClaudeCode, Gemini-CLI 防爬虫
生成 Key 如
cr_xxx...,分发给用户。
类似添加 Gemini/Codex 账户,统一面板管理。
原生工具接入清单
CRS 模拟官方 API,无需改工具代码,仅设环境变量。
Claude Code:
export ANTHROPIC_BASE_URL="http://your-domain:3000/api/"
export ANTHROPIC_AUTH_TOKEN="cr_你的Key"
Antigravity 池(高级模型):/antigravity/api/,模型 claude-opus-4-5。
Gemini CLI(Assist API):
CODE_ASSIST_ENDPOINT="http://your-domain:3000/gemini"
GOOGLE_CLOUD_ACCESS_TOKEN="cr_你的Key"
GOOGLE_GENAI_USE_GCA="true"
GEMINI_MODEL="gemini-2.5-pro"
Codex CLI:
~/.codex/config.toml:
[model_providers.crs]
name = "crs"
base_url = "http://your-domain:3000/openai"
auth.json:"OPENAI_API_KEY": "cr_你的Key"
监控接入:面板实时 dashboard,导出 CSV 月结。日志 logs/app.log,grep Key 统计。
生产优化与反向代理参数
裸服务勿公网暴露,用 Caddy/Nginx。
Caddyfile(自动 HTTPS):
your-domain.com {
reverse_proxy 127.0.0.1:3000 {
flush_interval -1 # SSE 支持
header_up X-Real-IP {remote_host}
transport http { read_timeout 300s; write_timeout 300s; }
}
header { Strict-Transport-Security "max-age=31536000"; X-Frame-Options "DENY"; }
}
Nginx:proxy_read_timeout 300s; proxy_buffering off; underscores_in_headers on;(Codex 必备)。
监控阈值:
- 告警:RTT >2s、错误率 >1%、Redis 内存 >80%
- 回滚:Key 限流 >50% 触发,降级单账户。
风险控制与维护清单
风险:TOS 违规(自担),v1.1.248- 安全漏洞(立即升 v1.1.249+ 或迁 sub2api)。维护周检:账户健康、token 预算、日志异常。
通过以上参数,团队可 1 小时上线稳定代理,实现 LLM 成本分摊自动化。实际测试:5 人组月费 50 元 / 人,Opus 无限刷。
资料来源: [1] GitHub - Wei-Shaw/claude-relay-service:CRS 自建中转服务,支持拼车共享。"一站式开源中转服务,让 Claude 等订阅统一接入。" [2] 推荐迁移:https://github.com/Wei-Shaw/sub2api (CRS 2.0)。
(正文字数:1268)