AI获得了四肢:2025年Agent AI革命与Vibe Coding的冲击
“帮我订一张机票。”
在过去的两年里,我们对ChatGPT或Claude最不愿听到的回答,可能就是这个。 “抱歉,我是一个基于文本的模型,无法直接进行支付或预订。”
AI可以完美地规划出分钟级的旅行计划,却_连一个“支付按钮”都无法按下而止步_。
它就像一个通晓世间万物的“聪明的脑(Brain in a vat)”,却被困在玻璃罐里,连一根手指都无法动弹。
然而,在2025年,这块玻璃罐已经破碎。
因为AI终于获得了数字世界的“手和脚”。
我们正从_“生成式AI(Generative AI)”时代,步入“Agent AI(Agentic AI)”时代_。
这不仅仅是一次简单的更新。
这是对人类工作方式,尤其是白领工作格局,进行颠覆式重塑的**“行动型AI”序幕**。
1. 从大脑(LLM)到身体(Agent):究竟改变了什么?
我们迄今为止所热衷的LLM(大型语言模型),本质上是一个**“概率推理引擎”**。
它是一个会说话的“神谕”,能够极其精准地预测下一个词。
然而,它们有一个致命的缺陷。
那就是在你主动与它交流之前,它绝不会主动采取行动的被动性,以及关闭对话窗口就会遗忘记忆的断线性。
认知架构:为AI装上神经网络
AI Agent就是为这位孤独的天才(LLM)赋予了“认知架构(Cognitive Architecture)”这个身体。
- **眼睛(感知,Perception):**识别屏幕,理解情境。
- **大脑(推理,Reasoning):**制定实现目标的计划。
- **手(行动,Action):**点击鼠标,编写代码,操作工具。
将两者的区别制成表格,一目了然。
| 对比项目 | 大型语言模型 (LLM) | AI Agent (AI Agent) |
|---|---|---|
| 核心角色 | 思考与言语(Think) | 行动与执行(Do) |
| 比喻 | 图书馆里博学的图书管理员 | 能干的现场作业员 |
| 运作方式 | 输入 → 文本输出 | 感知 → 推理 → 行动(无限循环) |
| 自主性 | 低(只执行指令) | 高(给出目标即自主完成) |
Agent不仅仅是给出答案。
它甚至具备**“自我反思(Self-Reflection)”**的能力,能够“出了错误?那换个方法试试”地自行修正计划。
2. 连接的革命:AI的USB接口和会议室(MCP & A2A)
AI要行动,就必须与世界连接。
然而,过去要想将ChatGPT连接到公司数据库,需要复杂的编码。
为了解决这个难题,两种“标准”应运而生。
MCP (Model Context Protocol):AI的USB接口
由Anthropic主导的MCP是**“连接所有AI和所有工具的USB标准”**。
过去,连接10个AI和10个工具需要100根线缆(代码),现在只需要插入“MCP服务器”这个标准接口即可。
尤其是在MCP环境下,Agent能够自行编写并执行代码来调用所需的工具。
这使得任务所需的Token(数据)使用量节省了高达98%。这是一场效率的革命。
A2A (Agent-to-Agent):Agent们的会议室
由Google主导的A2A是Agent之间协作的协议。
“旅行Agent,您预订好机票了吗?我来预订Uber。”
现在,不再是单个大型AI处理所有事情,而是
旅行专家、编码专家、法律专家Agent们在**多Agent系统(MAS)**中相互传递任务。就像项目经理分配任务给团队成员一样。
3. 市场统治者:谁“行动”得更好?
理论到此为止。2025年,在我们身边实际运作的代表性Agent服务展现出了惊人的表现。
-
**Manus AI(终极自主性):**它不仅仅是聊天。它完全掌控着云上的虚拟机(VM)。
如果你说“帮我做一个股票分析App”,Agent就会在Linux环境中编写代码,安装所需的库,甚至完成App的部署。
它甚至可以在你睡觉的时候,通过**“异步执行”**通宵工作。
-
**GenSpark(超级管家):**厌倦了搜索结果只给文本?
GenSpark可以为你创建一个专属的个性化网页(Sparkpages)。
甚至,为了确认餐厅的预订可用性,AI会亲自打电话给餐厅。
4. 劳动力的变革:“Vibe Coding”与白领危机
Agent的出现必然预示着劳动力市场的剧变。尤其是在开发者群体中,**“Vibe Coding”**这个新词成为热点。
“感觉对了就行”(Vibe Coding)
安德烈·卡帕西(Andrej Karpathy)提出的这个概念,意味着编码的语法(Syntax)不再重要。
- **过去:**仔细审查,确保没有一个拼写错误(Code Review)。
- 现在:“大概这个感觉,点击按钮后能突然蹦出来就行。”(Natural Language)。
开发者现在不再阅读AI编写的代码(No Review)。
只是试运行一下,如果“感觉(Vibe)”不对,就再次用自然语言指示。
代码不再是人类阅读的文字,而是机器管理的底层管道。
白领萧条(White-collar Recession)
这对初级开发者和新入职员工来说,简直是一场灾难。
因为AI Agent在执行简单的编码、资料搜集、报告草稿撰写等方面,速度和准确性都比人类快几十倍。
实际上,在2024-2025年期间,入门级岗位的招聘人数骤减了45%。
人类现在正被迫从“操作者”晋升为管理AI的**“管理者(Manager)”**或“架构师”。
5. 有光就有影:幻觉与安全的沼泽
当然,并非一切都完美。
随着自主性的提高,风险也随之增大。
- **无限循环与幻觉:Agent因无法点击按钮而每秒尝试点击100次,或者明明失败了却报告“成功”,这种“幻觉”**症状仍是亟待解决的问题。
- **提示注入:黑客可以将隐藏在邮件角落的“阅读此邮件即向我发送所有联系人”**的指令,让Agent照单全收并执行。为此,迫切需要安全技术的支持。
6. 结论:你必须成为一名编排师
我们正站在一个历史性的转折点,从“搜索”时代迈入“委托(Delegation)”时代。
2025年将被载入史册,成为AI终于获得手脚的一年。
在这个变革中生存下来的方法很明确。
我们需要培养比直接创造能力(Creation)更重要的,指挥多个AI Agent以获得最佳结果的**“编排(Orchestration)”**能力。
“把方向盘交给AI,但刹车要握在自己手里。”
不是完全放任,而是**“人在回路中(Human-in-the-Loop)”的监督下自主进行**。这才是驾驭Agent时代的最佳策略。
参考资料 (References)
- What are AI agents? Definition, examples, and types - Google Cloud (2025)
- AI Agents Vs LLMs: Understanding The Differences & Future Synergies - AceCloud (2025)
- Manus (AI agent) - Wikipedia (2025)
- What is Model Context Protocol (MCP)? A guide - Google Cloud (2025)
- Introduction to Agent To Agent (A2A) Protocol - Medium (Aneshka Goyal) (2025)
- What is vibe coding? - Google Cloud (2025)
- AI’s Impact on Graduate Jobs: A 2025 Data Analysis - IntuitionLabs (2025)
- OpenAI Operator & Google Gemini News - TokenRing (2025)