Infrastruktura superkomputerowa (HPC) oraz wsparcie naszych specjalistów przyspieszają rozwój projektów i procesów opartych na sztucznej inteligencji.
Środowisko HPC jest najwydajniejsze pod względem skalowania w przypadku treningu modelu na ogromnym zbiorze danych. Potrzebna jest również wiedza o tym, jak reagować na ewentualne problemy, jak profilować wydajność, gdzie szukać usprawnień. Mamy to wszystko w jednym miejscu.
Wyróżnia nas własna, fizyczna, bezpieczna infrastruktura przetwarzania danych i specjalizacja w optymalizacji jej wykorzystania.
Nasze zasoby dla AI
Klastry HPC (superkomputery):
- Helios: 440 GPU NVIDIA GH200
- Athena: 384 GPU NVIDIA A100 40GB
Platformy i narzędzia wirtualne:
- Platforma LLM Lab dostępna dla użytkowników infrastruktury PLGrid jako dedykowana usługa, umożliwiająca korzystanie przez API z dużych modeli językowych, dostosowanych do różnorodnych potrzeb, takich jak analiza danych, modelowanie oraz automatyzacji procesów badawczych.
Więcej informacji na stronie: Platforma LLM Lab
- Środowiska na klastrach (pełny zestaw oprogramowania i sterowników, umożliwiający od razu wydajną pracę)
Opracowane w ramach projektu Meetween:
- SPEECHM - platforma do testowania i porównywania modeli AI
Więcej informacji na stronie: https://speechm.cloud.cyfronet.pl/
- MLFlow - wdrożenie platformy do monitorowania postępów trenowania modeli
Nasze kompetencje
- Zarządzanie środowiskami obliczeniowymi dla AI (biblioteki, zależności między nimi, przenoszenie środowisk).
- Znajomość wiodących frameworków AI oraz procesu rozproszonego treningu modeli AI.
- Wykorzystanie narzędzi do profilowania zadań AI pod kątem wydajności i analiza tych wyników.
- Optymalizacja potoków przetwarzania danych pod kątem zadań AI (wydajne ładowanie, optymalne wykorzystanie posiadanych systemów plików).
- Skalowalne serwowanie wytrenowanych modeli AI.
Na bazie naszych zasobów i kompetencji oferujemy kompleksowe usługi. Na każdym etapie realizacji klient otrzymuje profesjonalne wsparcie naszych ekspertów – praktyków, specjalizujących się w wykorzystaniu HPC do rozwoju AI.
Nasze usługi AI
- Analiza problemu biznesowego i dobranie odpowiedniego podejścia (wybór techniki uczenia maszynowego).
- Analiza wymagań dotyczących wdrożenia (jakie dane, ile, w jaki sposób je przetwarzać, szacunkowe zapotrzebowanie na zasoby obliczeniowe).
- Stworzenie i utrzymanie środowiska do rozwoju takich rozwiązań.
- Pomoc w projektowaniu procesu treningowego.
- Monitorowanie i profilowanie uruchamianych treningów, optymalizacja.
- Zaprojektowanie procesu wdrożenia modelu w środowisku produkcyjnym.
- Doradztwo, szkolenia i konsultacje dotyczące konkretnych problemów.
Zapraszamy do kontaktu: helpdesk (at) plgrid.pl
Polskie Duże Modele Językowe
Cyfronet zapewnia zasoby obliczeniowe i aktywnie uczestniczy w rozwoju dwóch polskich Dużych Modeli Językowych (LLM): Bielika oraz PLLuM (HIVE AI). Pomagamy w przygotowaniu i uruchomieniu zoptymalizowanych treningów w dużej skali, monitorujemy trening, dbamy o jego wydajność. Utrzymujemy także środowiska i pośrednio wspomagamy proces serwowania modeli.
Więcej informacji na stronie: LLM