Nasz intuicyjny system statusów zapewnia łatwe zarządzanie Twoimi serwerami GPU Blibs. Serwery przechodzą między różnymi statusami – obecnie w statusie A, a zmierzają do statusu B – co umożliwia płynną pracę i kontrolę.
Możliwe statusy
Aktywne stany cyklu życia (normalna praca):
- Uruchomiony: Blib aktywnie przetwarza zadania i jest dostępny.
- Zatrzymany: Zatrzymuje serwer. Zasoby (GPU, rdzenie CPU, pamięć RAM) pozostają przydzielone, umożliwiając szybkie ponowne uruchomienie w ciągu kilku sekund. Zalecane w celu optymalizacji kosztów.
- Uruchamianie ponownie: Blib jest w trakcie uruchamiania po zatrzymaniu. Może to być określane jako wymuszone zresetowanie zasilania. Zalecamy zainicjowanie ponownego uruchomienia systemu za pomocą polecenia
sudo reboot najpierw polecenie.
Stany infrastruktury i konserwacji (specyficzne dla Trooper.AI):
- Zamrożony: Serwer został zarchiwizowany, co zwalnia przydzielone zasoby. Czas uruchomienia może się różnić i może być wymagane ponowne przypisanie portu. Zaleca się użycie stanu zatrzymanego, jeśli krytyczne są przewidywalne czasy uruchomienia! Zamrażanie nie jest zalecane dla klientów korporacyjnych ze względu na potencjalne zmiany portów i wydłużony czas przestoju.
- Przeniesiony: Blib jest przenoszony na inny sprzęt; ten proces może trwać od 10 do 90 minut.
Stany destrukcyjne i nieodwracalne:
- Zakończono: Trwale usuwa serwer i wszystkie powiązane z nim dane. Ta operacja nie może zostać cofnięta.
- Reset: Usuwa wszystkie dane z serwera i ponownie instaluje początkową konfigurację. Aby wykluczyć szablony z ponownej instalacji, usuń je z serwera przed resetem. Ta funkcja nie wpływa na Twój prepaidowy budżet ani zdefiniowane ceny, ale porty mogą ulec zmianie, a przygotowanie nowego Bliba może zająć trochę czasu. STRACISZ WSZYSTKIE DANE! Ta czynność nie może zostać cofnięta. Skontaktuj się z nami, jeśli masz jakiekolwiek pytania dotyczące tej funkcji resetowania!
Pytania i odpowiedzi dotyczące systemu statusu
Dlaczego serwery A100 czasami dłużej wracają do stanu pracy po wznowieniu z zawieszenia w porównaniu z innymi typami serwerów?
Serwery A100 są wyposażone w dużą ilość pamięci wideo ECC. Przy wznowieniu pracy ze stanu zamrożonego przeprowadzany jest rygorystyczny test diagnostyczny tej pamięci, aby zapewnić integralność danych i stabilność systemu. Chociaż ten test jest niezbędny, może to czasami powodować dłuższy czas wznowienia.
Jak zminimalizować czas uruchamiania zamrożonych serwerów?
Najefektywniejszą metodą minimalizacji czasu uruchamiania jest zatrzymanie instancji serwera, a nie zamrożenie jej. Należy pamiętać, że zamrożenie serwera spowoduje krótką zwłokę przed ponownym udostępnieniem lub nawet konieczność migracji serwera, co wiąże się ze zmianą portów, warstwy sprzętowej, takiej jak model procesora i jego prędkość, oraz wydłuża czas oczekiwania.