液体冷却: AI 時代の次の光学モジュール

Oct 04, 2024

伝言を残す

I. 水冷は「オプション」から「必須」に移行しました

 

1. 計算能力と光モジュールの需要の急増

急速に進化する人工知能 (AI) の状況において、コンピューティング能力に対する需要は前例のない高さに達しています。 OpenAI の ChatGPT で使用されているような大規模なモデルの出現により、必要なコンピューティング能力に大きなギャップが生じています。 OpenAI は、モデルのコンピューティング能力の成長率が AI ハードウェアの進歩を驚異的に 10 倍上回っていると報告しています。大規模なモデルが数兆のパラメーターに拡張されるにつれ、AI トレーニング チップのパフォーマンス向上の必要性が重要になり、より高速なデータ送信への期待が高まっています。

 

このコンピューティング規模の急激な増加により、データセンター内の相互接続が中心的な問題となっています。 AI トレーニングが進むにつれて、シングル カード/サーバー コンピューティングの限界が明らかになってきています。チップ間の相互接続が優先事項として浮上しており、迅速なデータ交換を促進するために効率的で高速な光モジュールが必要です。したがって、特にデータセンターのコンピューティング能力アーキテクチャをアップグレードする場合、相互接続効率を高めるには高速光モジュールの導入が不可欠です。

 

Optical modules facilitating high-speed data transmission in data centers

▲データセンターの高速データ伝送を実現する光モジュール

2. 液体冷却の転換点

液体冷却は、光学モジュールの進化と並行して、AI インフラストラクチャの次の重要な要素となる準備が整っています。電子製品が進化し続けるにつれて、効率的な冷却システムの必要性が否定できなくなってきています。光モジュールが贅沢品から必需品へと移行したのと同じように、液体冷却技術もこれに追随しています。

 

歴史的に、冷却ソリューションは、自然空冷やヒートシンクなどの受動的な方法から、空調、そして最終的には液体冷却などのより高度な技術へと進化してきました。この移行は、コンポーネントの最適なパフォーマンスと寿命を確保するために熱管理が最も重要であるというエレクトロニクス分野の幅広い傾向を反映しています。

 

3. 液体冷却が今不可欠な理由

チップス

環境温度が半導体チップに及ぼす影響は重要です。温度が上昇すると、電子部品の性能と寿命が大幅に低下する可能性があります。高温環境では、コンデンサや抵抗器などの材料が熱膨張し、機械的な故障が発生し、通常の動作が妨げられる可能性があります。 ANJIE のレポートによると、従来の空冷では最大 800 W までの熱放散しか管理できませんが、このしきい値はいくつかの NVIDIA 製品によって超えられています。

 

データセンター

空冷データセンターは通常、キャビネットあたり 8-10 kW の密度をサポートします。しかし、AI クラスターのコンピューティング能力は 2025 年までにキャビネットあたり 20-50 kW に達すると予測されているため、空冷の限界がはっきりと明らかになります。電力密度の増加により、より効率的な冷却方法が求められ、液体冷却が優れた代替手段として位置づけられています。

 

An AI data center designed for high-density computing, utilizing advanced liquid cooling systems

▲液冷技術を採用した高密度AIデータセンター

 

 

II.液体冷却政策は市場に「刺激剤」を注入する

 

PUE (電力使用効率) は、データセンターのエネルギー効率を評価するための重要な指標として機能します。 PUE が低いほど、施設で消費される総エネルギーと IT 負荷のみで消費されるエネルギーの比率が反映されるため、より環境に優しく、より効率的なデータセンターであることを示します。一般的なデータセンターでは、IT 機器がエネルギー消費の約 50% を占め、冷却システムは約 35% を占めます。

 

液体冷却技術は、従来の空冷と比較して PUE 値が大幅に低い傾向があります。たとえば、従来の空冷では PUE が約 1.3 に維持されますが、液体冷却方式では、使用する特定のテクノロジーに応じてこれを 1.05 ~ 1.2 に下げることができます。

 

Graph comparing PUE values of air cooling and various liquid cooling technologies in data centers

▲ 空冷技術と液冷技術の PUE 比較

 

 

。液体冷却による Vertiv の戦略的成長

 

Vertiv は、CoolTera の買収により、液体冷却機能の強化において大きな進歩を遂げました。この英国に本拠を置くこの企業は、液体冷却インフラストラクチャを専門とし、複数のデータセンターおよびスーパーコンピューティング プロジェクトで数年間 Vertiv と協力してきました。この買収により、熱管理市場における Vertiv の地位が強化され、データセンターの進化するニーズに合わせたより堅牢なソリューションを提供できるようになると期待されています。

 

 

IV.液体冷却の中核バリューチェーン

1. 液体冷却について

液体冷却は、コンピューター システムの最適な動作温度を維持するために使用される方法を指します。この技術は、液体の高い比熱容量を利用することにより、内部コンポーネントから発生した熱を外部環境に効果的に伝達します。液体冷却システムは、直接冷却技術と間接冷却技術に分類できます。コールド プレート システムなどの間接冷却では、冷却液が加熱されたコンポーネントに直接接触しないようにしますが、直接冷却方法には浸漬冷却が含まれ、冷却媒体が加熱されたコンポーネントと直接相互作用します。

 

2. 液体冷却産業のエコシステム: コールド プレート システム

液体冷却業界は、次のようなさまざまなコンポーネントとシステムで構成されています。

  • RCM (冷媒供給および戻り) ユニット:これらのユニットは、液体冷却キャビネット内の冷媒の分配と収集を管理します。
  • 冷却分配ユニット (CDU):CDU は、冷却源側の冷却水からコールド プレート コンポーネントに入る冷媒の分離を促進します。
  • LCM (液体循環モジュール):これらのモジュールは、冷却システム全体にわたる冷媒の輸送と戻りを管理します。

 

使用する冷媒はさまざまで、脱イオン水やグリコールベースの溶液などのオプションがあり、どちらも効果的な熱伝達に貢献します。

 

 Diagram depicting the various components of a liquid cooling ecosystem in data centers

▲ データセンターにおける液冷エコシステムの概要

 

 

V. 液体冷却サプライチェーンにおける受益企業の特定

1. 受益企業: サーバー内部コンポーネント

液冷サプライ チェーンは、内部サーバー コンポーネント、液冷構造、液冷インフラストラクチャ プロバイダーという 3 つの主要なカテゴリに分類できます。内部コンポーネントには、高性能 AI チップのパフォーマンスを向上させるために不可欠なコールド プレート システムとクイック ディスコネクトが含まれます。ファーウェイやNVIDIAなどの企業は、この分野の主要なプレーヤーです。

 

2.液冷構造

液冷構造には、フルチェーン ソリューション プロバイダーとサーバー メーカーが含まれます。 Vertiv のようなフルチェーン プロバイダーは包括的なソリューションを提供しますが、サーバーを直接供給しない場合があるため、チップ メーカーとの協力が必要です。

 

3. IDCの構築

IDC メーカーは、データ センターの建設と、顧客のニーズに合わせた液体冷却ソリューションの開発を担当します。これらのメーカーは、性能を最適化するために液体冷却技術を設計に統合することが増えています。

 

4. インフラストラクチャプロバイダー

インフラストラクチャ プロバイダーは、CDU や LCM などの特定の液体冷却コンポーネントを提供します。これらのテクノロジーの需要が高まるにつれて、データセンター設計における液体冷却の重要性の高まりを反映して、これらの製品の量と価格の両方が増加すると予想されます。

 

 

結論

 

AI インフラストラクチャにおける空冷から液冷への移行は、単なるトレンドではなく、コンピューティング需要の増大によって推進される本質的な進化です。大型モデルの急増と効率的な熱管理の必要性により、液体冷却技術はデータセンターの将来において極めて重要な役割を果たすことになります。 Vertiv のような企業が戦略的買収やパートナーシップを通じて自社の能力を強化するにつれ、液体冷却市場は大幅な成長を遂げる準備が整っています。この移行は、最終的には、より効率的で持続可能な高性能コンピューティング環境の実現に貢献します。

 

 

 

 

お問い合わせを送る