posts / Science

AI 时代隐秘的战场,“冷启动”(Cold Rush)的胜者是谁?

phoue

2 min read --

冷却 AI 的核心:LG 和 SK 绘制的“热战”图景

Liquid cooling in ai data centers
Liquid cooling in ai data centers

想象一下,你向 ChatGPT 询问“人生的意义是什么?”的这短短一瞬间。

在某个地方的数据中心里,一场无声却极其激烈的战斗正在进行。

为了处理你提出的一个问题,数千个 GPU 会同时苏醒并开始猛烈的计算。

此时产生的不仅仅是“信息”。它必然伴随着巨大的“热量”。

仅一块英伟达最新的 H100 芯片产生的热量就超过 700 瓦特 (W)。 (这相当于一台高性能吹风机全天 24 小时持续以最高温度运行的水平。)

如果一个服务器机架(架子)上插满了数十个,甚至数百个这样的芯片,会怎样? 如果无法解决,芯片就会融化,我们狂热追求的 AI 就会停止。

这正是人类面临的 “热障 (Thermal Wall)”

在这场炙热的战场上,代表韩国的两家企业——LG 电子SK 集团——已经撸起袖子,投身其中。

究竟谁能最冷、最高效地冷却 AI 的核心呢?

1. 危机的开始:空气停止流动,AI 也将停止

几十年来,数据中心一直依赖“空气”。

通过巨大的风扇吹入冷空气,再将变热的空气排出,风冷 (Air Cooling) 模式简直就是“行业标准”。

但是,随着生成式 AI 这个巨人的出现,这种平静的秩序被打破了。

站在“热峭壁 (Thermal Cliff)”前

坦白说,空气传递热量的能力远远不足。与水相比,其导热率只有 1/24

  • 飙升的功率密度:每机架的功率密度已超过 50kW,正朝着 100kW 迈进。
  • 低效的恶性循环:为了冷却芯片,需要产生更强的气流,为此需要疯狂地消耗电力。
  • 顾此失彼:最终,数据中心总电力的 40% 以上仅用于“冷却”的局面出现。

业界称之为 “热峭壁 (Thermal Cliff)”。仿佛站在悬崖前,空气已无法让其进一步发展。

2. LG 电子的战略:指挥宏大风流的指挥家

面对这道悬崖,LG 电子选择了搭建新桥梁的方式。

他们关注的是“现实优化”和“整个建筑的协调”。

凭借在家电和商用空调 (HVAC) 市场积累的全球技术实力,也就是所谓的“经验”,他们开始控制数据中心这个巨大建筑的呼吸。

让整个建筑呼吸:高科技冷水机组 (Chiller)

LG Hightech Chiller
LG Hightech Chiller

LG 电子战略的核心是 “冷水机组 (Chiller)”

冷水机组就像一个巨大的心脏,利用制冷剂产生冷水。但 LG 的冷水机组并非我们所熟知的空调室外机那么简单

  1. 变频涡旋式冷水机组:数据中心的温度并非恒定。用户多时会升温,夜晚则会冷却。LG 的变频技术可以自由调节电机转速,只提供必需的冷量。这是从根本上阻止能源浪费的技术。
  2. 无油磁悬浮离心式冷水机组:这可以称得上是技术巅峰。通过电磁力将电机轴悬浮在空中旋转。
    • 零摩擦:由于没有摩擦,可实现压倒性的效率 (IPLV 12.1)。
    • 无油:不需要润滑油,消除了维护的麻烦。

One LG:从芯片到电池,完美的交响乐

有趣的是,LG 电子并非只打算卖冷水机组。他们指挥着一个名为“One LG”的宏大交响乐团。

“棘手的冷却和电力问题,就全权委托给我们吧。”

  • LG CNS:AI 数据中心管理系统
  • LG Energy Solution:ESS(能源储存系统)电池
  • LG 电子:机架和空调设备

最近通过与 Flex 的合作进军模块化数据中心市场,可以看出,

他们有将这一战略扩展到全球的野心。

One LG Solution
One LG Solution

3. SK 集团的战略:弃水就油的炼金术士

LG 采取了将风力效率推向极限的正统路线,而 SK 集团则决定重写物理法则。

“如果空气不行……那就直接浸泡在液体里吧?”

SK Enmove 和 SK Telecom 主导的 “浸没式冷却 (Immersion Cooling)” 堪称革命性。

Immersion Cooling
Immersion Cooling

逆向思维的美学:不导电的液体

将服务器浸泡在液体中的想法,初听起来似乎很疯狂。

如果是水,短路就会导致一切瘫痪。但 SK Enmove 在这里下了一招“妙棋”。

他们开发了不导电的特殊流体 (Dielectric Fluid)。

这是其在全球高级基础油市场排名第一的专业知识大放异彩的时刻。

  • 无噪音:无需运转嘈杂的风扇。
  • 高效率:热量立即传递给液体。也没有火灾风险。
  • PUE 1.02:可以将电力使用效率 (PUE) 降低到接近理论上完美的 1.02 水平。

掌控生态系统:SK Inside

SK 并非孤军奋战。

他们正在制定一个将所有高性能数据中心都“沉浸”在 SK 的油液中的生态系统掌控计划。

  • 与 GRC 合作:对浸没式冷却罐领域的全球领导者美国 GRC 进行了大胆投资。
  • 与 Dell 合作:与服务器制造商 Dell 合作,在自家流体中验证了服务器的无故障运行。
  • Iceotope:与英国公司合作,还获得了精密液体冷却技术。

4. 战场:拯救垂死的数据中心(改造)

这两家公司的技术最激烈碰撞,又奇妙合作的焦点在于 “改造 (Retrofit)” 市场。

Retrofit
Retrofit

全世界有无数老旧的数据中心。

它们拥有电力和空间,但冷却能力不足,无法容纳最新的 AI 服务器,这些被称为“搁浅资产 (Stranded Asset)” 。

类别 LG 电子的解决方案 SK 集团的解决方案
方法 建筑优化 空间密度最大化
方案 更换高效冷水机组,安装后门冷气机 (RDHx) 安装浸没式冷却罐,引入机箱式液体冷却
优点 最小化结构改造,快速应用 能够在狭小空间运行超高密度服务器

最终,这些技术为垂死的资产注入了新的生命,创造了数万亿韩元的经济价值。

5. 未来展望:向大海,向太空,再回到我们身边

冷却技术的进化并未止步。随着液体冷却的普及,数据中心不再需要建在昂贵的土地上。

  • 空间扩展:正在讨论将其扩展到便于散热的海底(微软 Natick 项目)或零下寒冷的太空。
  • 废热回收 (Heat Reuse):不会将变热的冷却水直接排放,而是用作附近公寓供暖或智能农场温室的热源。

数据中心正从令人厌恶的设施,转变为 “能源共享的环保设施”

space data center
space data center

结论:冷酷的头脑创造火热的未来

如果说 AI 时代的“数据是 21 世纪的原油”,

那么冷却处理这些数据产生的热量的技术,就相当于“21 世纪的炼油厂设备”。

LG 电子正以“稳定性和集成性”为武器,试图掌控当前市场,

SK 集团则以“材料创新和颠覆性技术”力图抢占未来的标准。

尽管方法不同,但目标一致。

“用更少的能源,创造更多的智能。”

谁能冷却 AI 的炽热,谁就能掌握即将到来的未来的霸权。

是时候关注由韩国企业主导的这场 “冷革命 (Cold Revolution)” 将如何改变全球数据中心的格局了。

参考资料
  1. AI Datacenter Liquid Cooling Market Analysis Report - 2035 \[Future Market Insights\]
  2. Data Center Cooling Market Size & Industry Report, 2030 \[Grand View Research\]
  3. Air vs Liquid vs Immersion: Best Cooling for Your Data Center \[Onfra.io\]
  4. LG Expands Availability of Next-Gen Air-Cooled Inverter Scroll Chiller \[LG Electronics Newsroom\]
  5. Immersion Cooling Fluids Business Overview \[SK Enmove\]
  6. Sustainable by design: Next-generation datacenters consume zero water for cooling \[Microsoft Cloud Blog\]
#AI 数据中心冷却#数据中心热管理#浸没式冷却技术#LG 电子冷水机组#SK Enmove 浸没式冷却#英伟达 H100 发热#数据中心能源效率#PUE 改进#超大规模数据中心#环保数据中心解决方案

Recommended for You

40% 的数据中心电力未用于计算 — 钱去哪儿了?

40% 的数据中心电力未用于计算 — 钱去哪儿了?

5 min read
智能的热力学:AI引发的电力瓶颈与全球能源霸权战争(美、中、韩的生存战略)

智能的热力学:AI引发的电力瓶颈与全球能源霸权战争(美、中、韩的生存战略)

2 min read
2025年数据大灾难:您的隐私还好吗?(数字社会的生存契约)

2025年数据大灾难:您的隐私还好吗?(数字社会的生存契约)

2 min read

Advertisement

评论