Helios z Cyfronetu AGH na 3. miejscu światowej listy Green500 najbardziej ekologicznych superkomputerów
Podczas międzynarodowej konferencji ISC High Performance 2024 odbywającej się w tym tygodniu w Hamburgu, zostały ogłoszone nowe listy Top500 i Green500 - najszybszych i najefektywniejszych energetycznie superkomputerów na świecie. Najszybszą maszyną obliczeniową w Polsce oficjalnie został Helios z Akademickiego Centrum Komputerowego Cyfronet AGH.
Po raz pierwszy w historii polskiej informatyki aż 4 superkomputery z jednego ośrodka – z ACK Cyfronet AGH, znalazły się na prestiżowej liście TOP500.
Ponadto Helios zajął 3. miejsce na liście Green500 - najefektywniejszych energetycznie superkomputerów. Dotychczas żadnemu polskiemu systemowi nie udało się znaleźć tak wysoko!
Superkomputery umożliwiają wykonanie w ciągu kilku godzin lub dni obliczeń, które przy użyciu pojedynczych komputerów zajęłyby wiele lat. Helios będzie realizował rocznie kilkaset projektów badawczych dla naukowców z całej Polski, m.in. z zakresu chemii, fizyki, inżynierii materiałowej, energetyki, medycyny, biologii oraz sztucznej inteligencji. Helios został zbudowany w ramach projektu realizowanego w ramach Programu Operacyjnego Inteligentny Rozwój, dzięki czemu jego moc obliczeniowa może zostać wykorzystana komercyjnie także przez gospodarkę. Cyfronet od 2021 roku jest liderem Narodowego Centrum Kompetencji HPC w ramach międzynarodowego projektu prowadzonego przez Wspólne Przedsięwzięcie EuroHPC, którego celem jest budowa kompetencji z zakresu obliczeń i sztucznej inteligencji oraz ułatwienia dostępu do zasobów obliczeniowych jednostkom naukowym, administracji publicznej i przedsiębiorstwom, ze szczególnym naciskiem na Małe i Średnie Przedsiębiorstwa i startupy. Jednym z mechanizmów wsparcia MŚP są krótkie projekty typu Proof-of-Concept, które będą realizowane na Heliosie, mające zademonstrować możliwości wykorzystania superkomputerów w biznesie.
Helios posiada 35 PFLOPS teoretycznej mocy obliczeniowej, ponad 108 tysięcy rdzeni obliczeniowych, 460 TB pamięci operacyjnej i 18 PB pojemności systemów dyskowych, które łącznie oferują wydajność niemal 2 TB/s. Jego instalacja zakończyła się w grudniu 2023 roku w wyniku prac realizowanych w koordynowanym przez Cyfronet projekcie Narodowa Infrastruktura Superkomputerowa dla EuroHPC – EuroHPC PL. Superkomputer został zbudowany według projektu Cyfronetu przez Hewlett-Packard Enterprise w oparciu o platformę HPE Cray EX4000 i składa się z trzech partycji obliczeniowych:
- CPU wyposażonej w 75.264 rdzeni obliczeniowych AMD Zen4 oraz 200 TB pamięci operacyjnej DDR5,
- GPU wyposażonej w 440 superczipów NVIDIA Grace Hopper GH200 oraz
- INT dla pracy interaktywnej, wyposażonej w 24 akceleratory NVIDIA H100 i szybką lokalną pamięć NVMe.
Wszystkie komponenty superkomputera połączone są ze sobą siecią Slingshot o prędkości 200 Gb/s. Platforma HPE Cray EX4000, w oparciu o którą zbudowano Heliosa, jest także używana w budowie najszybszych superkomputerów na świecie (Frontier) oraz w Europie (LUMI). Partycje CPU i GPU systemu są chłodzone cieczą, dzięki czemu możliwe jest osiągnięcie bardzo niskiego wskaźnika PUE (Power Usage Effectiveness), a w efekcie zwiększenie jego efektywności energetycznej i obniżenie kosztów eksploatacji. Dodatkowo, odzyskane w ten sposób ciepło może być wykorzystane do ogrzewania.
Helios zadebiutował na liście TOP500, która od 1993 roku przedstawia 500 najszybszych superkomputerów na świecie, w listopadzie 2023, kiedy jego partycja CPU znalazła się na 291. miejscu ze wstępnym wynikiem testów wydajności. W obecnej edycji listy system znajduje się aż na dwóch pozycjach. Partycja GPU Heliosa ulokowała się na 55. miejscu, a partycja CPU na 305. Podział na dwie osobne pozycje jest spowodowany chęcią zaprezentowania pełni możliwości każdej z partycji obliczeniowych dzięki wykorzystaniu specjalnie zoptymalizowanych wersji benchmarków, powstałych jako efekt współpracy ekspertów Cyfronetu z HPE, NVIDIĄ i AMD. Moc obliczeniowa Heliosa odpowiada prędkości ok. 50.000 współczesnych laptopów, czyli mocy obliczeniowej całkiem dużego miasta.
Ogromnym sukcesem jest otrzymanie wyniku pomiaru efektywności energetycznej partycji GPU Heliosa, który ulokował ją na trzecim miejscu listy Green500. Jednocześnie warto zauważyć, że systemy z Niemiec i Wielkiej Brytanii na pozycjach poprzedzających polski superkomputer są od niego znacznie mniejsze. Oznacza to, że Helios jest najbardziej efektywnym energetycznie superkomputerem z pierwszej setki listy TOP500. Efektywność energetyczna jest obecnie jedną z najważniejszych metryk używanych do oceny nowych superkomputerów, gdyż bezpośrednio wpływa na koszty eksploatacji takich maszyn, które potrzebują ogromnej ilości mocy elektrycznej - w przypadku najszybszych komputerów na świecie jest to nawet 30 MW, co przekłada się na ogromne roczne koszty prądu. Tak wysoka efektywność energetyczna oznacza, że Helios oferuje więcej mocy obliczeniowej za każdą skonsumowaną kilowatogodzinę niż mniej efektywne systemy, a więc obliczenia z jego wykorzystaniem są nie tylko tańsze niż w przypadku innych maszyn, ale także w mniejszym stopniu wpływają na środowisko.
Na liście TOP500 znalazło się 8 superkomputerów z Polski (w nawiasach teoretyczna moc obliczeniowa):
# 55 - Helios GPU (30,44 PFLOPS) - ACK Cyfronet AGH
# 76 - Proxima (23,32 PFLOPS) - PCSS IChB PAN
# 80 - Lem (20,37 PFLOPS) - WCSS PWr
# 154 - Kraken-Fregata (10,02 PFLOPS) - CI TASK PG
# 177 - Athena (7,71 PFLOPS) - ACK Cyfronet AGH
# 250 - Altair (5,88 PFLOPS) - PCSS IChB PAN
# 305 - Helios CPU (3,35 PFLOPS) - ACK Cyfronet AGH
# 442 - Ares (3,51 PFLOPS) - ACK Cyfronet AGH
Dostęp do większości superkomputerów z powyższej listy, jak również do najszybszego superkomputera w Europie, jest zapewniany za pośrednictwem infrastruktury PLGrid (https://plgrid.pl/).
Superkomputer Helios
Superkomputer Athena
Superkomputer Ares
Centrum Danych Nawojki
Centrum Danych Podole