2025年09月27日 ai-systems

Gemini CLI 插件扩展：基于 MCP 的模块化终端命令开发

介绍 Gemini CLI 的 MCP 插件架构，实现用户自定义 AI 命令和工作流集成，提供配置、开发指南与工程实践。

内容加载中...

Gemini CLI 作为 Google 开源的终端 AI 代理工具，将 Gemini 模型的强大能力直接注入命令行环境，但其核心价值在于可扩展性。通过插件式架构，用户无需修改核心代码，即可注入自定义命令和工作流，实现高度模块化的 AI 终端交互。这种设计不仅提升了开发效率，还确保了系统的稳定性和安全性。

MCP（Model Context Protocol）协议是 Gemini CLI 扩展的核心机制。它定义了一套标准化接口，允许外部服务器向 CLI 暴露工具和资源。Gemini CLI 通过发现、注册和执行这些工具，实现与本地环境或远程服务的无缝集成。例如，内置工具已支持文件操作、Shell 命令和 Web 获取，而 MCP 则开启了无限扩展可能。根据官方文档，Gemini CLI 支持 MCP 的三种传输模式：Stdio（本地进程通信）、SSE（服务器发送事件）和 HTTP 流（远程集成），适用于不同场景。

配置 MCP 插件是扩展的第一步。所有配置集中在 ~/.gemini/settings.json 文件中，mcpServers 字段定义服务器列表。每个服务器需指定传输类型、命令/URL 和可选参数如超时和信任级别。例如，添加一个简单的计算器 MCP 服务器：

{
  "mcpServers": {
    "calculator": {
      "command": "node",
      "args": ["/path/to/calculator-server.js"],
      "timeout": 5000,
      "trust": true
    }
  }
}

保存后，重启 Gemini CLI，使用 /mcp 命令验证连接。成功后，用户可在对话中通过 @calculator 提及工具，如“@calculator 计算 2+3 的结果”。这种配置方式确保插件隔离，避免核心污染。证据显示，这种机制已在社区广泛应用，如集成 Playwright 用于自动化浏览器测试，或 Context7 用于文档查询，显著提升了工作流效率。

开发自定义插件需遵循 MCP SDK 规范。首先，安装依赖：npm install @modelcontextprotocol/sdk zod。SDK 提供服务器实例化和工具注册 API。以 Node.js 为例，构建一个 GitHub 集成插件：

创建服务器实例：

import { McpServer } from '@modelcontextprotocol/sdk/server/mcp.js';
import { StdioServerTransport } from '@modelcontextprotocol/sdk/server/stdio.js';
import { z } from 'zod';

const server = new McpServer({
  name: 'github-tool',
  version: '1.0.0',
  description: 'GitHub API 集成工具'
});

注册工具：定义参数 schema 和执行函数。

server.registerTool(
  'list_prs',
  {
    description: '列出指定仓库的拉取请求',
    parameters: z.object({
      owner: z.string().describe('仓库所有者'),
      repo: z.string().describe('仓库名称')
    })
  },
  async ({ owner, repo }) => {
    // 调用 GitHub API
    const response = await fetch(`https://api.github.com/repos/${owner}/${repo}/pulls`);
    const prs = await response.json();
    return { prs: prs.slice(0, 5).map(pr => ({ number: pr.number, title: pr.title })) };
  }
);

启动传输并运行：

const transport = new StdioServerTransport();
await server.connect(transport);
console.log('GitHub MCP server running');

运行服务器后，按上述配置集成到 Gemini CLI。在终端中，用户可输入“@github-tool list_prs owner=google repo=gemini-cli”，CLI 将自动调用工具并返回结果。这种开发流程强调参数验证（Zod schema）和异步执行，确保工具可靠。

落地参数与清单是工程化关键。配置清单包括：

传输选择：本地工具用 Stdio（低延迟），远程用 HTTP（兼容性强）。
超时阈值：默认 5000ms，复杂任务设为 30000ms，避免挂起。
信任设置：初始为 false，要求用户确认敏感操作。
环境变量：如 API 密钥，通过 env 字段注入，避免硬编码。

监控要点：使用 /mcp list 检查服务器状态，日志记录工具调用频率。回滚策略：若插件冲突，移除 settings.json 条目并重启 CLI。风险缓解：实施 sandboxing（如 Docker 容器运行服务器），限制工具权限仅读/写指定目录；处理速率限制，集成重试机制（指数退避，最大 3 次）。

在实际工作流中，MCP 插件可构建复杂集成。例如，结合 Shell 工具和自定义 MCP，实现 CI/CD 自动化：用户指令“检查代码变更并自动提交 PR”，插件先拉取 diff，再调用 GitHub 工具创建 PR。这种模块化设计不只提升效率，还促进团队协作，用户可共享插件配置。

总之，MCP 驱动的插件扩展使 Gemini CLI 从简单代理演变为可定制 AI 平台。通过标准化协议和简单开发路径，开发者能快速注入领域特定功能，推动终端 AI 的工程化应用。未来，随着生态丰富，这一架构将进一步解锁创新潜力。