|
大規模計算クラスタは CPUノードとしてHPE社製 Apollo 2000 を 104ノード、GPUノードとしてHPE社製 DL380 を 9ノード導入しています。
ハードウェア(CPUノード)
CPUノードは搭載メモリの異なる3タイプの大規模計算クラスタ Apollo 2000 (合計104ノード)から構成されています。
搭載メモリ256GB、512GB および 1,024GB のノード数はそれぞれ44ノード、40ノード、20ノードです。
いずれの計算ノードも、28コアを有する Intel 64bit Xeon プロセッサ G6348 2.6GHz を2ソケット、合計56コアを搭載した計算ノードです。
クラスタ構成のシステムは、ノード障害によるシステム全体への影響が最小限にとどまり、保守性が良いという特徴があります。
| CPUノード | Apollo2000 |
| CPU型番 | Intel Xeon Gold 6348 (Ice Lake) |
| 基本動作周波数 | 2.6GHz |
| L3キャッシュ | 42MB |
| ノードあたりのコア数 | 56 |
| ノードあたりのCPU理論演算性能 | 4.65TFLOPS |
| ノードあたりの主記憶 | DDR4-3200 256GB | DDR4-3200 512GB | DDR4-3200 1,024GB |
| ノードあたりの内蔵ディスク | 480GB SATA RI SSD |
| OS | Red Hat Enterprise Linux 8 |
| インターコネクト | ノード間:InfiniBand HDR200 (200Gbps) |
| ノード数 | 44 | 40 | 20 |
| CPU理論演算性能 | 205TFLOPS | 186TFLOPS | 93.2TFLOPS |
| バッチキュー | SMALL, APC |
ハードウェア(GPUノード)
GPUノードは大規模計算クラスタ DL380G11(9ノード)から構成されています。
DL380G11 は、32コアを有する Intel 64bit Xeon プロセッサ P8462Y+ 2.8GHz を2ソケット、合計64コアを搭載した計算ノードです。
搭載メモリは 1,024GB、GPUボードとして NVIDIA H100(80GBメモリ搭載) を2枚搭載しています。
GPUノードを利用する場合には、専用のバッチキュー(APGキュー)をご利用いただくことになります。
なお、ログインノードにもGPUが搭載されていますが、そのボードはNVIDIA A100(80GBメモリ搭載)となりますのでご注意ください。
| GPUノード | DL380G11 |
| CPU型番 | Intel Xeon Platinum 8462Y+ (Sapphire Rapids) |
| 基本動作周波数 | 2.8GHz |
| L3キャッシュ | 60MB |
| ノードあたりのコア数 | 64 |
| ノードあたりのCPU理論演算性能 | 5.73TFLOPS |
| ノードあたりの主記憶 | DDR5-4800 1,024GB |
| ノードあたりの内蔵ディスク | 480GB SATA RI SSD x2 (RAID1) |
| ノードあたりのGPU | NVIDIA H100 80GB x2 |
| OS | Red Hat Enterprise Linux 8 |
| インターコネクト | ノード間:InfiniBand HDR200 (200Gbps) |
| ノード数 | 9 |
| CPU理論演算性能 | 51.6TFLOPS |
| バッチキュー | APG |
| GPUカード | NVIDIA H100 (PCIe用) |
| Compute Capability | 9.0 |
| Micro architecture | NVIDIA Hopper |
| TF32 Tensorコア(TFlops) | 378 756(スパース性機能を用いた場合) |
| FP64 Tensorコア(TFlops) | 51 |
| FP32 (非Tensor演算)(TFlops) | 51 |
| FP64 (非Tensor演算)(TFlops) | 26 |
| Tensorコア数 | 456 |
| FP32コア数 | 14,592 |
| 相互接続インタフェース | PCI Express Gen5 |
| 相互接続帯域幅 | 128GB/s |
| GPUメモリ | 80GB HBM2e |
| GPUメモリ帯域幅 | 2,000 GB/s |
ソフトウェア
Apollo 2000 および DL380 上で動作するオペレーティングシステムは HPE Superdome Flex (以下 SDF ) と同じく
Red Hat Enterprise Linux (RHEL) です。
また、GPUカードを搭載しているGPUノードではGPU対応アプリケーションの実行も可能です。
|