他们在吵什么

2026 年 3 月,AI Agent 圈最热的话题不是哪个模型更强,而是一个听起来很无聊的架构问题:

Agent 该用什么方式调用外部工具?

三个阵营各执一词:

MCP 派(Model Context Protocol):Anthropic 2024 年底推出的开放标准1。通过 JSON-RPC 协议统一封装各类服务接口,Agent 一次接入就能跨平台调用多种工具。OpenAI、Google、Microsoft、AWS 全部跟进2。听起来很美好。

CLI 派:直接让 Agent 跑 shell 命令——git loggh pr listcurlkubectl。不需要任何协议层,不需要额外服务器。50 年前的 grepawk 在 AI 时代焕发第二春。

Skills 派:一个 Markdown 文件当"小抄",教 Agent 在什么场景用什么工具。30 token 待命,触发时才加载完整指令。Flask 作者 Armin Ronacher 全面转向这个方案3

2026 年 3 月:各方最新动态

MCP 阵营的压力:

  • Perplexity 发博客宣布准备全面抛弃 MCP 转向 CLI4
  • Eric Holmes 的 “MCP is dead. Long live the CLI” 登上 Hacker News 热榜5
  • ScaleKit 基准测试:MCP 28% 失败率(超时),CLI 100% 成功6
  • 值得注意的是,MCP 的发起者 Anthropic,其自家产品 Claude Code 的核心架构也更接近 CLI 而非 MCP

CLI 阵营的势头:

  • Andrej Karpathy 2026 年 2 月在 X 上说 CLI “super exciting precisely because they are legacy”7
  • Smithery 发布 756 次基准测试,系统对比 CLI vs MCP 在 Codex 和 Claude Code 上的表现8
  • Google 专门开源了给 AI 用的命令行工具9

Skills 阵营的崛起:

  • Simon Willison(Python 社区知名开发者)在 Claude Skills 发布时称其 “maybe a bigger deal than MCP”10
  • Armin Ronacher 全面从 MCP 转向 Skills,并给出了核心理由3

“Skills 本质上只是一份简短的摘要,告诉 Agent 有哪些能力、去哪个文件了解更多。关键是——Skills 不会往上下文里塞任何工具定义。工具还是原来的工具:bash 和 Agent 已有的那些。”

  • 社区开始出现"删掉所有 MCP,用 Skills + CLI 替代"的实践文章11

CLI 赢在哪?技术层面拆解

1. MCP 的上下文污染

MCP 最大的问题:Agent 一启动就要把所有工具的 schema 塞进上下文。

GitHub 的 Copilot MCP Server 暴露 43 个工具,连接它就往上下文注入约 55,000 token 的工具定义11。还没开始干活,token 预算花掉一大半。接 10 个 MCP Server、100 个工具?上下文直接爆炸。

CLI 完全不同——渐进式发现。Agent 先跑 gh --help 看有什么命令,需要时再 gh pr --help 看子命令参数。信息按需加载,不是开局全塞。

2. LLM 天然会用 CLI

LLM 训练数据里有几十年的 Unix 文档、Stack Overflow 回答、GitHub 上的 shell 脚本。模型天生认识 gitcurlgrepdocker

MCP 呢?大量的 JSON schema,模型更难处理,还要输出格式化的 JSON token。你自定义的 MCP 工具,模型从训练数据里学不到怎么调。

3. 管道操作

MCP 工具返回结果如果需要后处理(过滤、搜索、截取),得写额外代码。CLI 直接 pipe:

1
gh pr list --json number,title | jq '.[] | select(.title | contains("fix"))'

Agent 输出几个命令用 | 连起来,后处理就搞定了。更简单、更灵活、维护成本更低。

4. CLI + Skills 天然搭配

Skill 文件里教 Agent 用 CLI,干净利落:

1
2
## 查看 PR 状态
gh pr list --state open --json number,title,author

换成 MCP?Skill 文件会充斥 function call、JSON schema,整个文档混乱不堪。

数据说话

ScaleKit 75 次基准测试6,同一个 GitHub 任务(Claude Sonnet 4,同一 prompt):

graph LR subgraph Token 消耗对比 CLI["CLI
1,365 tokens"] Skills["CLI + Skills
4,724 tokens"] MCP["MCP
44,026 tokens"] end CLI -->|"3.5x"| Skills Skills -->|"9.3x"| MCP CLI -->|"32x"| MCP style CLI fill:#22c55e,color:#fff style Skills fill:#eab308,color:#fff style MCP fill:#ef4444,color:#fff
方案 月成本(1 万次) 可靠性
CLI ~$3.20 100%
CLI + Skills ~$4.50 100%
MCP ~$55.20 72%(28% 超时)

CLI 便宜 17 倍,可靠性 100% vs 72%。成本按 Claude Sonnet 4 定价($3/M input,$15/M output)计算12。差距显著。

到这里,CLI 似乎完胜

Token 更省、模型更熟悉、支持管道操作、与 Skills 天然互补。从效率指标看,MCP 在各个维度都处于劣势。

公允地说:MCP 在自我修正

MCP 没有坐以待毙。2026 年 1 月,Anthropic 推出了 progressive discovery13——本质上借鉴了 Skills 的按需加载思路:

  • 初始只加载工具名 + 短描述(20-50 token/工具)
  • 完整 schema 仅在 Agent 决定使用该工具时才加载

效果:

  • Token 开销降低 85%(77,000 → 8,700 token,50+ 工具场景)
  • 工具调用准确率提升:Claude Opus 4 从 49% 升到 74%

差距在缩小。但 Skills 在纯效率上仍然胜出——因为它根本不注入 schema,只注入知识。

不过,即使 MCP 的效率问题被完全解决,还有一个更根本的问题没人提:

所有基准测试都在同一个场景下跑——一个开发者,用自己的凭证,自动化自己的工作流。

很多文章写到这就会说:“但 MCP 有 OAuth,多租户场景不可替代!CLI 做不了认证!”

真的吗?

一个来自今天的亲身体验

我今天用 OpenCode(CLI 形式的 AI Agent)部署了这个博客。Agent 调了 Vercel CLI:

1
2
3
4
5
$ vercel login
→ 自动弹出浏览器 OAuth 页面
→ 点一下授权
→ CLI 自动拿到 token,本地保存
→ 之后所有命令无感使用

十秒钟。一个 CLI 工具,完整跑了 OAuth 浏览器授权流程。

我又想到 gh auth login——GitHub CLI 也是一模一样。弹出浏览器,OAuth 授权,scoped token,本地持久化。

所以:

CLI 不是"架构上不支持 OAuth"。ghvercel 已经证明了。

如果微信愿意做一个 wx auth login,流程跟 gh 一模一样:

1
2
3
4
5
6
$ wx auth login
→ 弹出微信扫码页面
→ 手机确认授权
→ 本地保存 token
→ wx send abin "你好"
→ wx moments list

技术上零障碍。但它永远不会出现。

不是做不到,是做了等于把苦苦经营的生态壁垒和反爬体系直接关掉。

那 MCP 到底有什么用?

MCP 的价值不是"做了 CLI 做不了的事"——gh 已经证明 CLI 能做 OAuth。

MCP 的价值是标准化

graph TB subgraph "没有 MCP 的世界" P1["GitHub: gh auth login"] P2["Vercel: vercel login"] P3["AWS: aws configure"] P4["平台 N: 又一套新的"] end subgraph "有 MCP 的世界" MCP_std["统一的 OAuth 发现协议
统一的工具 schema
统一的调用方式"] end style MCP_std fill:#6366f1,color:#fff

接入 1 个平台,gh 就够了。但当需要接入 50 个平台时,每个平台各自一套 CLI auth 流程的维护成本是不可接受的。MCP 提供了"所有平台使用同一套协议开放"的标准化可能性。

但标准化有个前提:平台愿意实现它。

所以整个争论都问错了问题

graph TB subgraph "社区在争的" Debate["CLI vs MCP 哪个更好?"] end subgraph "应该问的" Real["平台愿不愿意开放数据?"] end Debate --> Solved["已经有答案
CLI 更高效 / MCP 更标准 / Skills 更轻量"] Real --> Unsolved["没有答案
微信不做 wx CLI
淘宝不开放比价 API
美团不给评分数据"] style Debate fill:#94a3b8,color:#fff style Real fill:#ef4444,color:#fff style Solved fill:#22c55e20,stroke:#22c55e style Unsolved fill:#ef444420,stroke:#ef4444

GitHub 做了 gh,CLI 在 GitHub 生态内全面领先。 Vercel 做了 vercel login,部署体验极其流畅。 微信没做 wx——你只能选择爬虫,或者等待。

决定 Agent 能力边界的,不是你选了 CLI 还是 MCP,而是平台愿不愿意给你一根管道——不管什么形式的管道。

CLI vs MCP 争的是管道的材质。真正缺的是水龙头。

Token 成本是工程问题,协议选择是架构问题,数据开放是政治问题。 前两个正在被解决,第三个才是真正卡住整个 Agent 生态的瓶颈。而整个社区都在用技术问题的框架,回避那个真正难的政治问题。


这是 “Agent 生态思考” 系列第一篇。下一篇聊:就算平台有 API,你也大概率用不了——Agent 落地的两层壁垒比你想的厚得多。


参考资料


  1. Anthropic, “Introducing the Model Context Protocol”, Nov 2024. MCP 于 2024 年 11 月发布,2025 年 12 月捐赠给 Linux Foundation 的 Agentic AI Foundation (AAIF)。 ↩︎

  2. OpenAI 于 2025 年 3 月、Google DeepMind 于 2025 年 4 月、Microsoft Copilot Studio 及 AWS 于 2025 年 7 月先后宣布支持 MCP。参见 CLI-Based Agents vs MCP: The 2026 Showdown。 ↩︎

  3. Armin Ronacher (Flask creator), “Skills vs Dynamic MCP Loadouts”,解释了他为什么从 MCP 全面转向 Skills。参见 Skills vs MCP: The Token Efficiency War 中的引用。 ↩︎ ↩︎

  4. Perplexity CTO Denis Yarats 在 Ask 2026 开发者大会(2026 年 3 月 11 日)上宣布内部弃用 MCP,转向 REST API 和 CLI。参见 Awesome Agents 报道Agent Engineering 深度分析。 ↩︎

  5. Eric Holmes, “MCP is dead. Long live the CLI”, Feb 28, 2026. 登上 Hacker News 热榜,400+ 点赞,近 300 条评论。 ↩︎

  6. ScaleKit, “MCP vs CLI: Benchmarking AI Agent Cost & Reliability”, Mar 2026. 75 次基准测试的完整数据和方法论。基准测试代码开源于 GitHub。 ↩︎ ↩︎

  7. Andrej Karpathy 于 2026 年 2 月在 X (Twitter) 上发言,称 CLI 对 Agent 工作流 “super exciting precisely because they are a legacy”。参见 Why CLIs Beat MCP for AI Agents。 ↩︎

  8. Smithery (Henry Mao), “MCP vs CLI is the wrong fight”, Mar 2026. 756 次跨 3 个 API 的基准测试,覆盖 Codex 和 Claude Code,含 skills、code mode、pretraining bias 等维度分析。 ↩︎

  9. Google 开源的 AI CLI 工具:gws(Google Workspace CLI,21.8k star,100+ Agent Skills)和 Gemini CLI(Apache-2.0)。 ↩︎

  10. Simon Willison, “Claude’s Skills”, Oct 2025. 在 Claude Skills 发布时称其 “maybe a bigger deal than MCP”。 ↩︎

  11. Agent Native, “Delete your MCPs: Skills + CLI outperform at ~20x lower cost”, Mar 2026. 文中指出 GitHub Copilot MCP Server 暴露 43 个工具,初始化注入约 55,000 token。 ↩︎ ↩︎

  12. Anthropic Claude 定价页:Claude Sonnet 4 — $3/M input tokens, $15/M output tokens。月成本估算基于 ScaleKit 基准测试的 median token 数据。 ↩︎

  13. Anthropic MCP progressive discovery,参见 “MCP Tool Search: Claude Code Context Pollution Guide”。Token 开销降低 85%,准确率提升数据来自 Skills vs MCP: The Token Efficiency War。 ↩︎