CLI vs MCP vs Skills：整个争论都问错了问题

他们在吵什么

2026 年 3 月，AI Agent 圈最热的话题不是哪个模型更强，而是一个听起来很无聊的架构问题：

Agent 该用什么方式调用外部工具？

三个阵营各执一词：

MCP 派（Model Context Protocol）：Anthropic 2024 年底推出的开放标准¹。通过 JSON-RPC 协议统一封装各类服务接口，Agent 一次接入就能跨平台调用多种工具。OpenAI、Google、Microsoft、AWS 全部跟进²。听起来很美好。

CLI 派：直接让 Agent 跑 shell 命令——git log、gh pr list、curl、kubectl。不需要任何协议层，不需要额外服务器。50 年前的 grep 和 awk 在 AI 时代焕发第二春。

Skills 派：一个 Markdown 文件当"小抄"，教 Agent 在什么场景用什么工具。30 token 待命，触发时才加载完整指令。Flask 作者 Armin Ronacher 全面转向这个方案³。

2026 年 3 月：各方最新动态

MCP 阵营的压力：

Perplexity 发博客宣布准备全面抛弃 MCP 转向 CLI⁴
Eric Holmes 的 “MCP is dead. Long live the CLI” 登上 Hacker News 热榜⁵
ScaleKit 基准测试：MCP 28% 失败率（超时），CLI 100% 成功⁶
值得注意的是，MCP 的发起者 Anthropic，其自家产品 Claude Code 的核心架构也更接近 CLI 而非 MCP

CLI 阵营的势头：

Andrej Karpathy 2026 年 2 月在 X 上说 CLI “super exciting precisely because they are legacy”⁷
Smithery 发布 756 次基准测试，系统对比 CLI vs MCP 在 Codex 和 Claude Code 上的表现⁸
Google 专门开源了给 AI 用的命令行工具⁹

Skills 阵营的崛起：

Simon Willison（Python 社区知名开发者）在 Claude Skills 发布时称其 “maybe a bigger deal than MCP”¹⁰
Armin Ronacher 全面从 MCP 转向 Skills，并给出了核心理由³：

“Skills 本质上只是一份简短的摘要，告诉 Agent 有哪些能力、去哪个文件了解更多。关键是——Skills 不会往上下文里塞任何工具定义。工具还是原来的工具：bash 和 Agent 已有的那些。”

社区开始出现"删掉所有 MCP，用 Skills + CLI 替代"的实践文章¹¹

CLI 赢在哪？技术层面拆解

1. MCP 的上下文污染

MCP 最大的问题：Agent 一启动就要把所有工具的 schema 塞进上下文。

GitHub 的 Copilot MCP Server 暴露 43 个工具，连接它就往上下文注入约 55,000 token 的工具定义¹¹。还没开始干活，token 预算花掉一大半。接 10 个 MCP Server、100 个工具？上下文直接爆炸。

CLI 完全不同——渐进式发现。Agent 先跑 gh --help 看有什么命令，需要时再 gh pr --help 看子命令参数。信息按需加载，不是开局全塞。

2. LLM 天然会用 CLI

LLM 训练数据里有几十年的 Unix 文档、Stack Overflow 回答、GitHub 上的 shell 脚本。模型天生认识 git、curl、grep、docker。

MCP 呢？大量的 JSON schema，模型更难处理，还要输出格式化的 JSON token。你自定义的 MCP 工具，模型从训练数据里学不到怎么调。

3. 管道操作

MCP 工具返回结果如果需要后处理（过滤、搜索、截取），得写额外代码。CLI 直接 pipe：

1

gh pr list --json number,title | jq '.[] | select(.title | contains("fix"))'

Agent 输出几个命令用 | 连起来，后处理就搞定了。更简单、更灵活、维护成本更低。

4. CLI + Skills 天然搭配

Skill 文件里教 Agent 用 CLI，干净利落：

1
2


## 查看 PR 状态
gh pr list --state open --json number,title,author

换成 MCP？Skill 文件会充斥 function call、JSON schema，整个文档混乱不堪。

数据说话

ScaleKit 75 次基准测试⁶，同一个 GitHub 任务（Claude Sonnet 4，同一 prompt）：

graph LR subgraph Token 消耗对比 CLI["CLI
1,365 tokens"] Skills["CLI + Skills
4,724 tokens"] MCP["MCP
44,026 tokens"] end CLI -->|"3.5x"| Skills Skills -->|"9.3x"| MCP CLI -->|"32x"| MCP style CLI fill:#22c55e,color:#fff style Skills fill:#eab308,color:#fff style MCP fill:#ef4444,color:#fff

方案	月成本（1 万次）	可靠性
CLI	~$3.20	100%
CLI + Skills	~$4.50	100%
MCP	~$55.20	72%（28% 超时）

CLI 便宜 17 倍，可靠性 100% vs 72%。成本按 Claude Sonnet 4 定价（$3/M input，$15/M output）计算¹²。差距显著。

到这里，CLI 似乎完胜

Token 更省、模型更熟悉、支持管道操作、与 Skills 天然互补。从效率指标看，MCP 在各个维度都处于劣势。

公允地说：MCP 在自我修正

MCP 没有坐以待毙。2026 年 1 月，Anthropic 推出了 progressive discovery¹³——本质上借鉴了 Skills 的按需加载思路：

初始只加载工具名 + 短描述（20-50 token/工具）
完整 schema 仅在 Agent 决定使用该工具时才加载

效果：

Token 开销降低 85%（77,000 → 8,700 token，50+ 工具场景）
工具调用准确率提升：Claude Opus 4 从 49% 升到 74%

差距在缩小。但 Skills 在纯效率上仍然胜出——因为它根本不注入 schema，只注入知识。

不过，即使 MCP 的效率问题被完全解决，还有一个更根本的问题没人提：

所有基准测试都在同一个场景下跑——一个开发者，用自己的凭证，自动化自己的工作流。

很多文章写到这就会说：“但 MCP 有 OAuth，多租户场景不可替代！CLI 做不了认证！”

真的吗？

一个来自今天的亲身体验

我今天用 OpenCode（CLI 形式的 AI Agent）部署了这个博客。Agent 调了 Vercel CLI：

1
2
3
4
5


$ vercel login
→ 自动弹出浏览器 OAuth 页面
→ 点一下授权
→ CLI 自动拿到 token，本地保存
→ 之后所有命令无感使用

十秒钟。一个 CLI 工具，完整跑了 OAuth 浏览器授权流程。

我又想到 gh auth login——GitHub CLI 也是一模一样。弹出浏览器，OAuth 授权，scoped token，本地持久化。

所以：

CLI 不是"架构上不支持 OAuth"。gh 和 vercel 已经证明了。

如果微信愿意做一个 wx auth login，流程跟 gh 一模一样：

1
2
3
4
5
6


$ wx auth login
→ 弹出微信扫码页面
→ 手机确认授权
→ 本地保存 token
→ wx send abin "你好"
→ wx moments list

技术上零障碍。但它永远不会出现。

不是做不到，是做了等于把苦苦经营的生态壁垒和反爬体系直接关掉。

那 MCP 到底有什么用？

MCP 的价值不是"做了 CLI 做不了的事"——gh 已经证明 CLI 能做 OAuth。

MCP 的价值是标准化：

graph TB subgraph "没有 MCP 的世界" P1["GitHub: gh auth login"] P2["Vercel: vercel login"] P3["AWS: aws configure"] P4["平台 N: 又一套新的"] end subgraph "有 MCP 的世界" MCP_std["统一的 OAuth 发现协议
统一的工具 schema
统一的调用方式"] end style MCP_std fill:#6366f1,color:#fff

接入 1 个平台，gh 就够了。但当需要接入 50 个平台时，每个平台各自一套 CLI auth 流程的维护成本是不可接受的。MCP 提供了"所有平台使用同一套协议开放"的标准化可能性。

但标准化有个前提：平台愿意实现它。

所以整个争论都问错了问题

graph TB subgraph "社区在争的" Debate["CLI vs MCP 哪个更好？"] end subgraph "应该问的" Real["平台愿不愿意开放数据？"] end Debate --> Solved["已经有答案
CLI 更高效 / MCP 更标准 / Skills 更轻量"] Real --> Unsolved["没有答案
微信不做 wx CLI
淘宝不开放比价 API
美团不给评分数据"] style Debate fill:#94a3b8,color:#fff style Real fill:#ef4444,color:#fff style Solved fill:#22c55e20,stroke:#22c55e style Unsolved fill:#ef444420,stroke:#ef4444

GitHub 做了 gh，CLI 在 GitHub 生态内全面领先。 Vercel 做了 vercel login，部署体验极其流畅。微信没做 wx——你只能选择爬虫，或者等待。

决定 Agent 能力边界的，不是你选了 CLI 还是 MCP，而是平台愿不愿意给你一根管道——不管什么形式的管道。

CLI vs MCP 争的是管道的材质。真正缺的是水龙头。

Token 成本是工程问题，协议选择是架构问题，数据开放是政治问题。 前两个正在被解决，第三个才是真正卡住整个 Agent 生态的瓶颈。而整个社区都在用技术问题的框架，回避那个真正难的政治问题。

这是 “Agent 生态思考” 系列第一篇。下一篇聊：就算平台有 API，你也大概率用不了——Agent 落地的两层壁垒比你想的厚得多。

参考资料

Anthropic, “Introducing the Model Context Protocol”, Nov 2024. MCP 于 2024 年 11 月发布，2025 年 12 月捐赠给 Linux Foundation 的 Agentic AI Foundation (AAIF)。 ↩︎
OpenAI 于 2025 年 3 月、Google DeepMind 于 2025 年 4 月、Microsoft Copilot Studio 及 AWS 于 2025 年 7 月先后宣布支持 MCP。参见 CLI-Based Agents vs MCP: The 2026 Showdown。 ↩︎
Armin Ronacher (Flask creator), “Skills vs Dynamic MCP Loadouts”，解释了他为什么从 MCP 全面转向 Skills。参见 Skills vs MCP: The Token Efficiency War 中的引用。 ↩︎ ↩︎
Perplexity CTO Denis Yarats 在 Ask 2026 开发者大会（2026 年 3 月 11 日）上宣布内部弃用 MCP，转向 REST API 和 CLI。参见 Awesome Agents 报道、Agent Engineering 深度分析。 ↩︎
Eric Holmes, “MCP is dead. Long live the CLI”, Feb 28, 2026. 登上 Hacker News 热榜，400+ 点赞，近 300 条评论。 ↩︎
ScaleKit, “MCP vs CLI: Benchmarking AI Agent Cost & Reliability”, Mar 2026. 75 次基准测试的完整数据和方法论。基准测试代码开源于 GitHub。 ↩︎ ↩︎
Andrej Karpathy 于 2026 年 2 月在 X (Twitter) 上发言，称 CLI 对 Agent 工作流 “super exciting precisely because they are a legacy”。参见 Why CLIs Beat MCP for AI Agents。 ↩︎
Smithery (Henry Mao), “MCP vs CLI is the wrong fight”, Mar 2026. 756 次跨 3 个 API 的基准测试，覆盖 Codex 和 Claude Code，含 skills、code mode、pretraining bias 等维度分析。 ↩︎
Google 开源的 AI CLI 工具：gws（Google Workspace CLI，21.8k star，100+ Agent Skills）和 Gemini CLI（Apache-2.0）。 ↩︎
Simon Willison, “Claude’s Skills”, Oct 2025. 在 Claude Skills 发布时称其 “maybe a bigger deal than MCP”。 ↩︎
Agent Native, “Delete your MCPs: Skills + CLI outperform at ~20x lower cost”, Mar 2026. 文中指出 GitHub Copilot MCP Server 暴露 43 个工具，初始化注入约 55,000 token。 ↩︎ ↩︎
Anthropic Claude 定价页：Claude Sonnet 4 — $3/M input tokens, $15/M output tokens。月成本估算基于 ScaleKit 基准测试的 median token 数据。 ↩︎
Anthropic MCP progressive discovery，参见 “MCP Tool Search: Claude Code Context Pollution Guide”。Token 开销降低 85%，准确率提升数据来自 Skills vs MCP: The Token Efficiency War。 ↩︎

他们在吵什么#

2026 年 3 月：各方最新动态#

CLI 赢在哪？技术层面拆解#

1. MCP 的上下文污染#

2. LLM 天然会用 CLI#

3. 管道操作#

4. CLI + Skills 天然搭配#

数据说话#

到这里，CLI 似乎完胜#

公允地说：MCP 在自我修正#

一个来自今天的亲身体验#

那 MCP 到底有什么用？#

所以整个争论都问错了问题#

参考资料#