前言:21万亿韩元的幻觉与两个世界
2025年10月的最后一个夜晚,华尔街一片尖叫。因为全球科技巨头Meta Platforms Inc.的股价在盘后交易中暴跌超过9%。一夜之间,约2000亿美元,相当于数千亿美元的市值蒸发殆尽。
表面原因看似清晰。利润锐减,以及不断攀升的AI投资成本。在市场眼中,Meta就像一个“无底洞”里的危险赌徒。
但就在同时,门洛帕克(Menlo Park)的Meta总部深处,一个研究实验室里却涌动着另一种激动。
因为导致股价暴跌的巨额资本流入的地方,人类长期以来梦想逾越的技术障碍——**“自主推理(Autonomous Reasoning)”**的壁垒正在被打破。
本文将剖析金融市场的恐惧与技术前沿的狂喜之间形成的鲜明对比,即**“Meta悖论(Meta Paradox)”**。
我们将深入探究159亿美元成本背后隐藏的真相,并深入到马克·扎克伯格精心设计的“个人超智能”的技术机制(AZR、SPICE)层面。
1. 数字的欺骗:2025年第三季度财报剖析
市场最厌恶不确定性,但有时清晰的数字反而会引发更大的误解。Meta在2025年第三季度的财报发布就是一个很好的例子。
名为“宏大而美好的法案”的税收炸弹
让投资者陷入恐慌的159亿美元(约21万亿韩元)成本,究竟是公司运营恶化的迹象吗?
结论是,这与基本面恶化毫无关系。
这是由于美国政府实施的新公司税法规,即所谓的“宏大而美好的法案(One Big Beautiful Bill Act)”所导致的一次性会计调整。
因此,虽然看起来前一年同期的净利润157亿美元骤降至27亿美元,降幅高达83%,但这只是账面上的幻觉。
剔除这笔非现金(non-cash)成本后,Meta的调整后每股收益(EPS)为7.25美元,反而超出了市场预期(6.70美元)。
700亿美元的CapEx:是成本,还是入场费?
真正的焦点不是税收,而是业绩指引(Guidance)。
Meta将其2025年的资本支出(CapEx)上调至700亿至720亿美元,并宣布2026年将进一步“显著(significantly)”增加。
这笔天文数字般的款项将投入到_Nvidia的H100及下一代Blackwell GPU的采购和数据中心的建设中_。
华尔街问道:“到底什么时候才能盈利?”
但Meta的视角不同。
他们认为,这笔支出不仅仅是简单的消耗,而是用于建设生产未来“智能(Intelligence)”的工厂,是迈向下一个时代必须支付的昂贵入场费。
2. 战略大转型:“替代”而非“扩展”
当CFO忙于应对财务报表时,马克·扎克伯格正在改变公司的DNA。
他在2025年7月发布的备忘录明确定义了Meta所追求的AI未来。
个人超智能(Personal Superintelligence)宣言
当竞争对手专注于开发可替代人类的通用人工智能(AGI)时,Meta高举“个人超智能”的旗帜。
扎克伯格的愿景是坚定的。
“AI不应是少数公司的专属,而应成为每个人实现自身目标、扩展创造力的工具。”
这反映了Meta特有的开源理念,即超智能也应像智能手机一样被普及。
推理时间(Inference-time)的经济学
Meta为何要在2025年底前 확보60万个H100级别的GPU?
答案在于“智能体(Agentic)”功能。
与仅仅回答问题的聊天机器人(System 1 Thinking)不同,代表用户规划旅行或编写代码的智能体需要经历复杂的推理过程(System 2 Thinking)。
这个过程需要模型在给出答案之前进行数千次的模拟,即“推理时间(Inference-time)”。
也就是说,未来AI的竞争力不再取决于“回答速度有多快”,而是**“思考深度有多深”**,而支持这一切的海量计算能力已成为生存的必要条件,而非可选项。
3. 1亿美元的头脑们:Meta超级智能实验室(MSL)
硬件是躯体,软件是灵魂。
Meta为了赋予这副躯体灵魂,进行了一场颠覆行业格局的“人才战争”。
- Alexandr Wang的加盟: Meta收购了Scale AI的股份,并将数据标注公司Scale AI的创始人、数据巨头Alexandr Wang任命为“Meta超级智能实验室(MSL)”的负责人。这标志着Meta实现了AI学习原材料——数据管道的垂直整合。
- Daniel Gross & Trapit Bansal: 来自SSI的Daniel Gross负责安全性,而OpenAI推理模型“o1”的主要开发者Trapit Bansal也已加入。
特别是Trapit Bansal的加入,预示着Meta的研究方向已从单纯的语言模型(LLM)急剧转向“基于强化学习的自主推理”。
4. 技术奇点 I:绝对零度(AZR)
现在是时候讲述华尔街未曾关注的、Meta实验室深处的故事了。
当前AI领域最大的威胁是**“数据壁垒(Data Wall)”**,因为互联网上高质量的人类数据正在枯竭。
Meta的解决方案是革命性的。
无人类学习:AZR(Absolute Zero)
在论文*“Absolute Zero: Reinforced Self-play Reasoning with Zero Data”*中公开的AZR是一种模型在没有人为干预的情况下自我成长的研究方法。
AZR的工作机制(双重角色机制):
- 提议者(Proposer): 自主生成具有一定难度、以其当前能力勉强能解决的问题。
- 解决者(Solver): 编写代码并展开逻辑来解决该问题。
- 验证者(Verifier): 通过实际执行(Python Execution)编写的代码来机械地判断答案是否正确。
这个过程中排除了人类的主观评价。
代码执行并得出正确结果后会获得奖励,否则将进行修正。
令人惊讶的是,在编码(Code)领域训练出的这种逻辑思维能力可以迁移(Transfer)到数学或一般推理领域。
5. 技术奇点 II:SPICE与地面化(Grounding)
然而,沉浸在自我思考中的AI是危险的。
因为它可能陷入将谎言视为真理的“幻觉(Hallucination)”。
为了防止这种情况,Meta还开发了另一个安全机制——“SPICE”。
信息不对称博弈与基于方差的奖励
如果说AZR是“纯粹逻辑”,那么SPICE则负责**“知识的准确性”**。该模型以文档地面化(Document Grounding)为核心,并应用了独特的博弈论。
- 挑战者(Challenger): 看着带有答案的文档,生成问题。
- 推理者(Reasoner): 在未看到文档的情况下,仅凭自己的知识和逻辑寻找答案。
这里的关键是**基于方差的奖励函数(Variance-Based Reward)**。
该函数指示AI_“不要出太容易或太难的问题”_。
当挑战者AI出能够让推理者AI有50%概率出错的问题时,它将获得最大的奖励。
这在数学上实现了教育学的**“最近发展区(ZPD)”**理论,使AI能够自主制定最高效的学习和验证知识的课程。
6. 结论:非对称性押注与时间线的错位
Meta所有的这些技术成就都指向2026年即将发布的Llama 4以及代号为**“Avocado(牛油果)”**的项目。
目前围绕Meta的形势是一场典型的“非对称性押注(Asymmetric Bet)”。
金融市场只关注眼前的21万亿韩元成本和700亿美元支出这两项“确定的痛苦”,从而压低股价。
但与此同时,Meta通过AZR和SPICE,正在独占未来最稀缺的资源——“自主推理能力”和“超级智能基础设施”。
当竞争对手因数据枯竭而陷入瓶颈时,_能够自主生成、验证并进化的Meta的AI将占据压倒性的竞争优势。_
目前的股价下跌,或许不是危机,而是Meta为跨越奇点(Singularity)所支付的必然代价。
您是选择关注眼前下跌的 K 线图,还是仰望那即将诞生的、超越一切的巨大智能?
参考资料
- Meta Reports Third Quarter 2025 Results \[Meta Investor Relations\]
- Meta Stock Falls 9% After Q3 Earnings; Here’s Why \[INDmoney\]
- Absolute Zero: Reinforced Self-play Reasoning with Zero Data \[OpenReview\]
- SPICE: Self-Play In Corpus Environments Improves Reasoning \[arXiv/AlphaXiv\]
- Explained: Mark Zuckerberg’s ‘Personal Superintelligence’ \[AI Magazine\]
- Meet 29-year-old Alexandr Wang… hired by Mark Zuckerberg \[The Times of India\]