Meta（Meta）股价暴跌的真相：21万亿韩元恐惧背后隐藏的“自主推理”奇点

前言：21万亿韩元的幻觉与两个世界

2025年10月的最后一个夜晚，华尔街一片尖叫。因为全球科技巨头Meta Platforms Inc.的股价在盘后交易中暴跌超过9%。一夜之间，约2000亿美元，相当于数千亿美元的市值蒸发殆尽。

表面原因看似清晰。利润锐减，以及不断攀升的AI投资成本。在市场眼中，Meta就像一个“无底洞”里的危险赌徒。

但就在同时，门洛帕克（Menlo Park）的Meta总部深处，一个研究实验室里却涌动着另一种激动。

因为导致股价暴跌的巨额资本流入的地方，人类长期以来梦想逾越的技术障碍——**“自主推理（Autonomous Reasoning）”**的壁垒正在被打破。

本文将剖析金融市场的恐惧与技术前沿的狂喜之间形成的鲜明对比，即**“Meta悖论（Meta Paradox）”**。

我们将深入探究159亿美元成本背后隐藏的真相，并深入到马克·扎克伯格精心设计的“个人超智能”的技术机制（AZR、SPICE）层面。

1. 数字的欺骗：2025年第三季度财报剖析

市场最厌恶不确定性，但有时清晰的数字反而会引发更大的误解。Meta在2025年第三季度的财报发布就是一个很好的例子。

名为“宏大而美好的法案”的税收炸弹

让投资者陷入恐慌的159亿美元（约21万亿韩元）成本，究竟是公司运营恶化的迹象吗？

结论是，这与基本面恶化毫无关系。

这是由于美国政府实施的新公司税法规，即所谓的“宏大而美好的法案（One Big Beautiful Bill Act）”所导致的一次性会计调整。

因此，虽然看起来前一年同期的净利润157亿美元骤降至27亿美元，降幅高达83%，但这只是账面上的幻觉。

剔除这笔非现金（non-cash）成本后，Meta的调整后每股收益（EPS）为7.25美元，反而超出了市场预期（6.70美元）。

700亿美元的CapEx：是成本，还是入场费？

真正的焦点不是税收，而是业绩指引（Guidance）。

Meta将其2025年的资本支出（CapEx）上调至700亿至720亿美元，并宣布2026年将进一步“显著（significantly）”增加。

这笔天文数字般的款项将投入到_Nvidia的H100及下一代Blackwell GPU的采购和数据中心的建设中_。

华尔街问道：“到底什么时候才能盈利？”

但Meta的视角不同。

他们认为，这笔支出不仅仅是简单的消耗，而是用于建设生产未来“智能（Intelligence）”的工厂，是迈向下一个时代必须支付的昂贵入场费。

2. 战略大转型：“替代”而非“扩展”

当CFO忙于应对财务报表时，马克·扎克伯格正在改变公司的DNA。

他在2025年7月发布的备忘录明确定义了Meta所追求的AI未来。

个人超智能（Personal Superintelligence）宣言

当竞争对手专注于开发可替代人类的通用人工智能（AGI）时，Meta高举“个人超智能”的旗帜。

扎克伯格的愿景是坚定的。

“AI不应是少数公司的专属，而应成为每个人实现自身目标、扩展创造力的工具。”

这反映了Meta特有的开源理念，即超智能也应像智能手机一样被普及。

推理时间（Inference-time）的经济学

Meta为何要在2025年底前 확보60万个H100级别的GPU？

答案在于“智能体（Agentic）”功能。

与仅仅回答问题的聊天机器人（System 1 Thinking）不同，代表用户规划旅行或编写代码的智能体需要经历复杂的推理过程（System 2 Thinking）。

这个过程需要模型在给出答案之前进行数千次的模拟，即“推理时间（Inference-time）”。

也就是说，未来AI的竞争力不再取决于“回答速度有多快”，而是**“思考深度有多深”**，而支持这一切的海量计算能力已成为生存的必要条件，而非可选项。

3. 1亿美元的头脑们：Meta超级智能实验室（MSL）

硬件是躯体，软件是灵魂。

Meta为了赋予这副躯体灵魂，进行了一场颠覆行业格局的“人才战争”。

Alexandr Wang的加盟： Meta收购了Scale AI的股份，并将数据标注公司Scale AI的创始人、数据巨头Alexandr Wang任命为“Meta超级智能实验室（MSL）”的负责人。这标志着Meta实现了AI学习原材料——数据管道的垂直整合。
Daniel Gross & Trapit Bansal： 来自SSI的Daniel Gross负责安全性，而OpenAI推理模型“o1”的主要开发者Trapit Bansal也已加入。

特别是Trapit Bansal的加入，预示着Meta的研究方向已从单纯的语言模型（LLM）急剧转向“基于强化学习的自主推理”。

4. 技术奇点 I：绝对零度（AZR）

现在是时候讲述华尔街未曾关注的、Meta实验室深处的故事了。

当前AI领域最大的威胁是**“数据壁垒（Data Wall）”**，因为互联网上高质量的人类数据正在枯竭。

Meta的解决方案是革命性的。

无人类学习：AZR（Absolute Zero）

在论文*“Absolute Zero: Reinforced Self-play Reasoning with Zero Data”*中公开的AZR是一种模型在没有人为干预的情况下自我成长的研究方法。

AZR的工作机制（双重角色机制）：

提议者（Proposer）： 自主生成具有一定难度、以其当前能力勉强能解决的问题。
解决者（Solver）： 编写代码并展开逻辑来解决该问题。
验证者（Verifier）： 通过实际执行（Python Execution）编写的代码来机械地判断答案是否正确。

这个过程中排除了人类的主观评价。

代码执行并得出正确结果后会获得奖励，否则将进行修正。

令人惊讶的是，在编码（Code）领域训练出的这种逻辑思维能力可以迁移（Transfer）到数学或一般推理领域。

5. 技术奇点 II：SPICE与地面化（Grounding）

然而，沉浸在自我思考中的AI是危险的。

因为它可能陷入将谎言视为真理的“幻觉（Hallucination）”。

为了防止这种情况，Meta还开发了另一个安全机制——“SPICE”。

信息不对称博弈与基于方差的奖励

如果说AZR是“纯粹逻辑”，那么SPICE则负责**“知识的准确性”**。该模型以文档地面化（Document Grounding）为核心，并应用了独特的博弈论。

挑战者（Challenger）： 看着带有答案的文档，生成问题。
推理者（Reasoner）： 在未看到文档的情况下，仅凭自己的知识和逻辑寻找答案。

这里的关键是**基于方差的奖励函数（Variance-Based Reward）**。

该函数指示AI_“不要出太容易或太难的问题”_。

当挑战者AI出能够让推理者AI有50%概率出错的问题时，它将获得最大的奖励。

这在数学上实现了教育学的**“最近发展区（ZPD）”**理论，使AI能够自主制定最高效的学习和验证知识的课程。

6. 结论：非对称性押注与时间线的错位

Meta所有的这些技术成就都指向2026年即将发布的Llama 4以及代号为**“Avocado（牛油果）”**的项目。

目前围绕Meta的形势是一场典型的“非对称性押注（Asymmetric Bet）”。

金融市场只关注眼前的21万亿韩元成本和700亿美元支出这两项“确定的痛苦”，从而压低股价。

但与此同时，Meta通过AZR和SPICE，正在独占未来最稀缺的资源——“自主推理能力”和“超级智能基础设施”。

当竞争对手因数据枯竭而陷入瓶颈时，_能够自主生成、验证并进化的Meta的AI将占据压倒性的竞争优势。_

目前的股价下跌，或许不是危机，而是Meta为跨越奇点（Singularity）所支付的必然代价。

您是选择关注眼前下跌的 K 线图，还是仰望那即将诞生的、超越一切的巨大智能？

参考资料

Meta Reports Third Quarter 2025 Results \[Meta Investor Relations\]
Meta Stock Falls 9% After Q3 Earnings; Here’s Why \[INDmoney\]
Absolute Zero: Reinforced Self-play Reasoning with Zero Data \[OpenReview\]
SPICE: Self-Play In Corpus Environments Improves Reasoning \[arXiv/AlphaXiv\]
Explained: Mark Zuckerberg’s ‘Personal Superintelligence’ \[AI Magazine\]
Meet 29-year-old Alexandr Wang… hired by Mark Zuckerberg \[The Times of India\]