在呼叫中心场景中,serverless 出站电话编排是实现 AI 代理高效扩展的关键。通过 Azure Container Apps 与 Communication Services 的组合,可以按需弹性扩展呼叫容量,避免传统服务器的闲置成本,同时集成 Azure OpenAI 实现智能对话。这种架构特别适合保险理赔、IT 支持等中等复杂度任务,支持 API 一键发起出站呼叫,代理自动拨打客户电话并收集结构化数据。
核心优势在于其无服务器部署模式。整个系统容器化运行在 Azure Container Apps 上,按 vCPU 和内存计费,例如 2 个副本的 1 vCPU + 2GB 内存,每月约 160 美元(基于 1000 通 10 分钟呼叫)。呼叫网关由 Azure Communication Services 处理,支持购买专用号码用于出站拨打,避免第三方依赖。语音流经 Speech-to-Text (STT)、LLM 推理、Text-to-Speech (TTS) 全链路实时处理,使用 gpt-4o-mini 等高效模型降低延迟至可接受范围。证据显示,该方案已演示处理意外事故理赔:代理询问事件描述、位置、涉事方,并生成 claim JSON 与提醒事项。
出站呼叫通过简单 POST API 触发,参数高度可配置。示例 curl 请求指定 bot_company、bot_name、phone_number(E.164 格式,如 +11234567890)、task(英文任务描述,如 "Help the customer with their digital workplace...")及 agent_phone_number。claim 数组定义数据 schema,例如 [{"name": "hardware_info", "type": "text"}, {"name": "first_seen", "type": "datetime"}],支持 text、datetime、email、phone_number 类型,并可选 description 指导 LLM 采集。系统使用 Redis 缓存历史对话,Cosmos DB 持久化 claim、messages、synthesis 与 reminders;AI Search 提供 RAG 检索内部文档,确保代理理解领域术语。
工程落地需关注关键参数阈值,避免常见痛点如延迟或断线。语音活动检测 (VAD) 参数包括 vad_threshold=0.5(0.1-1 范围,敏感度平衡噪音与误检)、vad_silence_timeout_ms=500、vad_cutoff_timeout_ms=250,确保自然交互。STT 配置 recognition_retry_max=3、recognition_stt_complete_timeout_ms=100,处理口吃或噪音。LLM 响应超时分软硬阈值:answer_soft_timeout_sec=4(播放等待提示)、answer_hard_timeout_sec=15(中止并报错);phone_silence_timeout_sec=20 触发代理警告。callback_timeout_hour=3 限制自动回拨。所有参数通过 Azure App Configuration 动态调整,无需重启,TTL=60s 刷新,支持 A/B 测试。
监控与优化是生产化的核心。集成 Application Insights 追踪端到端指标:call.answer.latency(用户说完到代理回应时间)、call.aec.droped/missed(回声消除失败率)。自定义指标暴露 LLM 令牌消耗、STT 重试率。成本优化建议:优先 gpt-4o-nano(输入 0.15/百万 tokens,输出 0.60),预热 Provisioned Throughput Unit (PTU) 减半首句延迟;采样日志降低 Monitor 费用(500GB 仅 322 美元)。RAG 索引使用 text-embedding-3-large,仅检索相关 chunk。风险控制包括内容过滤(Azure OpenAI 阈值 0-7,类别如 hate、violence)、人类转接 fallback,以及 jailbreak 检测。
部署清单简明高效:
- 创建资源组、Communication Services 资源、购买号码(inbound/outbound + voice)。
- 配置 config.yaml:指定 LLM endpoint、Speech keys、自定义 voice/schema/prompts。
- make deploy name=my-rg-name,使用预构建镜像 ghcr.io/clemlesne/call-center-ai:main。
- 测试 API:POST /call,查看 /report/{phone} 报告(对话历史、claim、满意度)。
- 启用 recording(feature flag true + Storage 容器),自定义语言(fr-FR-DeniseNeural 等)。
回滚策略:feature flags 瞬时切回默认提示;多模型 fallback(nano to full gpt-4o);容量警报阈值 80% 触发 autoscaling。虽为 POC,生产需加 IaC、多区、vNET,但 serverless 已支持 24/7 低复杂度呼叫,扩展至高负载仅增成本而非运维。
资料来源:Microsoft Call Center AI GitHub 仓库(https://github.com/microsoft/call-center-ai),包含架构图、demo 与成本估算。“Send a phone call from AI agent, in an API call.”
(正文约 950 字)