2024年6月4日,Intelは,サーバー向け新型CPU「
Xeon 6」を正式発表した。Xeon 6は,Coreプロセッサにおける高性能CPUコアである「P-core」で構成する「
Xeon 6 P-cores」(開発コードネーム:Granite Rapid)と,高効率CPUコアの「E-Core」で構成した「
Xeon 6 E-cores」(開発コードネーム:Sierra Forest)をラインナップしている。今回発表となったのは,Xeon 6 E-coresシリーズの下位モデルにあたる「
Xeon 6 6700E」で,Xeon 6 P-coresシリーズなど,そのほかの製品は2024年第3四半期から2025年第1四半期に登場するという。
Xeon 6
 |
Xeon 6のロードマップ
 |
Xeon 6は,2024年4月にIntelが公開したCPUだ(
関連記事)。前世代までは「Intel Xeon Scarable Processor」というブランドで提供されていたが,今回から「Xeon+世代番号」といった形にブランドを変更した。
Intelによると,現在のサーバー市場では,AIの学習や推論処理など,高い性能が求められる分野と,動画配信やEコマースといった複数の機能を組み合わせて提供するマイクロサービスの分野が大きく成長しているそうだ。Xeon 6では,特性が異なる2種類の製品を用意することで,こうした要望に答えていくとのこと。
用途によってCPUに求められる特性が異なる
 |
Xeon 6 P-coreとXeon 6 E-coreが担うワークロード
 |
Xeon 6は,前世代の第5世代「Xeon Scalable Processor」と比べて,パッケージ内に搭載するチップのモジュール化を進めた。これにより,I/O周りを管理する「I/O die」はそのままに,CPUを搭載する「Compute die」は,CPUコア数に応じて柔軟に変えられるのがポイントだ。
Xeon 6ではチップのモジュール化を進めた
 |
Compute dieの構成を柔軟に変更できる
 |
 |
Compute dieは,Intel 3プロセスで製造するダイで,CPUコアに加えて,Last Levelキャッシュやメモリコントローラを統合する。一方のI/O dieは,Intel 7プロセスによる製造で,PCI Express(以下,PCIe)や,チップ間を接続するIntel独自のインターコネクト機能「Ultra Path Interface」(UPI),CPUとメモリ,そのほかの周辺機器を接続するCompute Express Link(CXL)などを備える。
Compute dieの構成図
 |
I/O dieの構成図
 |
Xeon 6 E-coresは,動画のトランスコードなど,高密度のワークロード向けの製品で,CPUコアのアーキテクチャには,ノートPC向けCPU「Core Ultra」のE-coreと同じ「Crestmont」を採用した。CPUコア数は,Xeon 6 6700Eで最大144コア,その上位モデルである「
Xeon 6 6900E」で,最大288コアとなる。
Xeon 6 E-coresは,5年前に登場した
第2世代「Xeon Scalable Processor」と比べて,性能は4.2倍,電力効率は2.6倍に向上した。この性能向上により,サーバールームのラックをおよそ3割ほどまで減らせるという。
第2世代Xeon Scalable Processorとの性能比較
 |
サーバーラックを3分の1まで減らせる
 |
一方のXeon 6 P-coresは,従来のXeonと同様にビックデータの解析や設計業務,AIの学習と推論などに向けた製品だ。CPUコアのアーキテクチャは,Core UltraのP-coreと同じ「Redwood Cove」である。こちらは「
Xeon 6 6900P」「
Xeon 6 6700P」「
Xeon 6 6500P」「
Xeon 6 6300P」「
Xeon 6 SoC」と幅広いラインナップをそろえている。CPUコア数は最大128コアだ。
詳しい性能については示されなかったが,AIの推論処理では,AMDのサーバー向けCPU「EPYC」と比べて,最大3.7倍の性能を発揮するそうだ。また,第5世代Xeon Scalable Processorと比べて,2〜2.3倍ほどの性能を実現するとのことだ。
第5世代Xeon Scalable Processortの性能比較
 |
また,IntelがNVIDIAを猛追すべく力を入れているデータセンター向けAIアクセラレータ「
Gaudi 3 AI Accelerator」(以下,Gaudi 3)を搭載した,ベースボードキットの価格も明らかとなった。
Gaudi 3
 |
Gaudi 3は,AI処理に使う第5世代の「Tensor Processor Cores」と「Matrix Math Engines」,容量128GBのHBM2eメモリ,PCIeなどを統合したSoCとなる。Intelによると,NVIDIAのデータセンター向けGPU「
H100 Tensor Core GPU」(以下,H100)と比べて,AIの学習処理で,最大1.4倍,推論処理で平均2倍の性能を実現するという。
H100と比べて,大規模言語モデルの学習で1.4倍の性能
 |
推論処理では平均2倍の性能を実現する
 |
Gaudi 3は,専用コネクタで接続する拡張カードタイプのほか,単独で利用できるベースボードタイプと,PCI Express(以下,PCIe)拡張カードという3種類のフォームファクタで提供する。今回価格が明らかとなったのはベースボードタイプでGaudi 3を8基搭載した「
Gaudi 3 AI Accelerator kit」が
12万5000ドル(約1942万円)だ。Intelは,1ドルあたりの性能は,H100と比べて,2.3倍にもなるとアピールしていた。
Gaudi 3 AI Accelerator kitの価格
 |