오클리지 국립연구소에는 공개 AMD의 최적화된 3세대 EPYCCPU와 InstinctMI250XGPU를 탑재한 크러셔 시스템의 개요.
ORNL의 모든 AMD 탑재 크러셔 시스템 개요 공개 : 기능 최적화된 3세대 EPYCCPU와 InstinctMI250X GPU
크러셔 시스템은 최신 AMDEPYC ‘Torrent’가 장착된 ORNL의 차기 프론티어 슈퍼컴퓨터 테스트 플랫폼입니다. CPU와 InstinctMI250X’Aldebaran’GPU. 그 때문에, 노드의 수는 적게 됩니다만, 그래도, 그 안에 탑재되고 있는 CPU/GPU 코어의 양이 많은 것을 생각하면, 많은 펀치가 막혀 있습니다.
ASUS, AMDAGESA1.2.0.6 베타 버전 출시 ROG CrosshairVIII 마더보드용 BIOS 펌웨어
크러셔는 NCCS(National Center for Computational Sciences)의 중간 보안 시스템으로, 다음 프론티어 시스템과 동일한 하드웨어와 유사한 소프트웨어를 포함합니다. 이는 CAAR(Center for Accelerated Application Readiness) 및 ECP(Exascale Computing Project) 팀, NCCS 직원 및 공급업체 파트너의 조기 액세스 테스트 베드로 사용됩니다.
ORNL 경유
ORNL이 공개한 개요에 따르면 Crushes 테스트 시스템은 두 개의 캐비닛으로 구성됩니다. 하나는 128개의 계산 노드이고, 다른 하나는 64개의 계산 노드이며, 전체 구성에서는 총 192개의 계산 노드가 됩니다. 각 노드는 3세대 최적화된 EPYCCPU 아키텍처를 기반으로 하는 단일 64코어 AMDEPYC 7A53CPU를 갖추고 있습니다. 프론티어는 밀라노 칩의 최적화된 버전인 AMD의 토런트 CPU를 탑재할 예정이다. 동일한 64코어와 128스레드를 갖추고 있지만 클럭과 전력 효율이 최적화되었습니다. 각 CPU는 512GBDDR4 메모리에 액세스할 수 있습니다.
GPU 측의 경우 각 노드에는 4개의 AMD Instinct MI250X GPU가 있으며 2개의 GCD를 팩하고 각 노드는 GCD를 별도의 GPU로 취급하므로 Crusher는 총 8개의 GPU에 액세스할 수 있습니다. 각 MI250XGPU는 최대 52 TFLOP의 최고 FP64 계산 마력, 220 계산 단위(GCD당 110) 및 128GB HBM2e 메모리(GPU당 64GB)를 제공하며, MI250X 가속기당 최대 3.2TB/s의 대역폭을 제공합니다. 제공합니다. 각 GCD는 200GB/s 양방향 대역폭을 제공하는 InfinityFabric 링크를 통해 서로 연결됩니다.
상호 연결에 대해 말하면, AMD EPYC CPU는 36개의 피크 대역폭을 가진 InfinityFabric을 사용하여 GPU에 연결됩니다. + 36GB/초. 크러셔 노드는 4개의 HPE Slingshot 200Gbit/s NIC(25GB/s)를 통해 연결되어 800Gbps(100GB/s)의 노드 주입 대역폭을 제공합니다.
[4x ]노드당 NUMA 도메인 및 NUMA당[2x] L3 캐시 영역, 합계[8x] L3 캐시 영역. 8개의 GPU는 각각 다음과 같이 L3 리전 중 하나와 연관되어 있습니다.
NUMA 0:
하드웨어 스레드 000-007, 064-071 | GPU 4 하드웨어 스레드 008-015, 072-079 | GPU 5
NUMA 1:
하드웨어 스레드 016-023, 080-087 | GPU 2 하드웨어 스레드 024-031, 088-095 | GPU 3
NUMA 2:
하드웨어 스레드 032-039, 096-103 | GPU 6 하드웨어 스레드 040-047, 104-111 | GPU 7
NUMA 3:
하드웨어 스레드 048-055, 112-119 | GPU 0 하드웨어 스레드 056-063, 120-127 | GPU 1
단일 크러셔 노드의 다음 블록 다이어그램은 AMD EPYCCPU와 InstinctMI250XGPU 가속기 간의 상호 연결 대역폭을 보여줍니다.
AMDRAMP는 AMD의 Ryzen7000 XMP입니다 CPU, AM5 플랫폼에서 DDR5 메모리를 가속화
게다가 Crusher 시스템은 250 PB의 스토리지를 핫하고 피크 쓰기 속도는 2.5 TB/s로 센터 전체의 NFS 기반에 액세스할 수 있습니다. 파일 시스템. 올해 프론티어 슈퍼컴퓨터에서 작동하게 되면 AMD의 EPYCCPU 및 InstinctGPU 플랫폼에서 더 많은 것을 기대할 수 있습니다.
뉴스 소스: coelacanth-dream
Categories: IT Info Tags: it-info