Akademickie Centrum Komputerowe Cyfronet AGH ACK Cyfronet AGH
Serwis używa plików cookies zgodnie z polityką prywatności. Pozostając w serwisie akceptują Państwo te warunki.

Pamięć dyskowa

Odpowiednie skorelowanie projektu architektury infrastruktury obliczeniowej z właściwym doborem technologii rozwiązań składowania danych pozwala zoptymalizować usługi świadczone na rzecz użytkowników naukowych. Skala problemów w tym obszarze rośnie wraz ze złożonością i wydajnością eksploatowanych superkomputerów − obecnie systemy składowania danych dołączone do superkomputerów Cyfronetu przechowują miliardy plików o rozmiarach sięgających terabajtów. Szeroki zakres tematyczny prac badawczych realizowanych na zasobach udostępnianych przez Cyfronet znajduje swoje odbicie w różnorodności konfiguracji kluczowych superkomputerów Centrum, a przez to również w konfiguracji dedykowanych im zasobów pamięci masowej.

W superkomputerach stosuje się min. wydajną przestrzeń tymczasową, tzw. scratch. Tu kluczowym elementem jest szybkość działania, dlatego jest ona oparta na bardzo szybkiej architekturze rozproszonego systemu plików – Lustre. Zaletą Lustre jest możliwość skalowania pojemności jak i wydajności przestrzeni dyskowej. W wyniku łączenia pojemności wielu serwerów, przepustowość I/O jest również zagregowana i skaluje się z dodatkowymi serwerami. Ponadto, przepustowość i/lub pojemność może być łatwo zwiększona poprzez dynamiczne dodawanie większej liczby serwerów, bez konieczności przerywania obliczeń użytkowników. Obecnie w Cyfronecie wszystkie superkomputery korzystają z przestrzeni scratch realizowanych przez Lustre. W przypadku Prometheusa przestrzeń ta charakteryzuje się pojemnością 5 PB i szybkością 120 GB/s. Ares dysponuje przestrzenią o pojemności 4 PB i szybkością 80 GB/s. W obu tych komputerach przestrzeń scratch jest realizowana przy pomocy dysków mechanicznych. W przypadku Atheny i Heliosa dane użytkowników przechowywane są na dyskach półprzewodnikowych. Zastosowanie tego typu rozwiązania znacząca zwiększa wydajność systemu. Pojemność tego typu przestrzeni dla Atheny wynosi 1,5 PB oraz osiąga przepustowość 400 Gb/s. W przypadku Heliosa przestrzeń scratch charakteryzuje się pojemnością 1,5 PB i szybkością 1,8 TB/s.

Większa część zasobów pamięci dyskowej Cyfronetu jest przeznaczona dla potrzeb użytkowników usług dziedzinowych rozwijanych w programie PLGrid. Infrastruktura PLGrid oferuje dedykowaną przestrzeń roboczą dla grup korzystających z usług dziedzinowych – funkcjonalność niezbędną do umożliwienia współpracy między naukowcami pracującymi w rozproszonych geograficznie lokalizacjach. Funkcjonalność ta jest realizowana za pomocą systemu plików Lustre. Maksymalna pojemność zasobu /pr1 w superkomputerze Prometheus to 5 PB, a sumaryczna szybkość operacji zapisu i odczytu sięga 30 GB/s. W przypadku Aresa i Atheny zasób /pr2 charakteryzuje się pojemnością 5 PB i szybkością 30 GB/s. W przypadku Heliosa zasoby /pr3 i /pr4 charakteryzują się łączną pojemnością 16 PB i szybkością 200 GB/s.

Dodatkowymi zasobami do przechowywania zasobów danych użytkowników oraz projektów w Cyfronecie jest system obiektowego przechowywania danych. Jest on oparty o oprogramowanie CEPH. Dane w tym systemie dostępne są poprzez protokół S3 oparty na REST API i znajdują się w unikalnych globalnie kontenerach (bucket), w których użytkownicy przechowują swoje dane w formie obiektów.

Szczególnym przypadkiem pamięci masowej są zasoby dla dużych projektów i kolaboracji międzynarodowych, w których uczestniczy Cyfronet, takich jak WLCG (Worldwide LHC Computing Grid), analizujący dane z detektora LHC w CERN czy CTA (Cherenkov Telescope Array), badający promieniowanie gamma za pomocą sieci radioteleskopów. Tego typu projekty wymagają ogromnych zasobów dyskowych, dostępnych najczęściej za pomocą nietypowych protokołów takich jak SRM, xroot czy GridFTP. Cyfronet dostarcza tego typu przestrzeń dyskową przy użyciu kilku instancji dedykowanego oprogramowania DPM (Disk Pool Manager) i za pomocą dedykowanych sieci, takich jak LHCone. Łączna pojemność systemów DPM w Cyfronecie przekracza 2 PB.

Aktualnie całkowita udostępniana pojemność dyskowa eksploatowana przez ACK Cyfronet AGH wynosi około 140 PB.