Unser intuitives Statussystem bietet eine einfache Verwaltung Ihrer GPU Server Blibs. Server wechseln zwischen Status – derzeit Status A, und bewegen sich in Richtung Status B – was einen nahtlosen Betrieb und Kontrolle ermöglicht.
Mögliche Status
Aktive Lebenszyklusstatus (normaler Betrieb):
- Ausgeführt: Der Blib verarbeitet aktiv Aufgaben und ist zugänglich.
- Gestoppt: Hält den Server an. Ressourcen (GPUs, CPU-Kerne, RAM) bleiben reserviert, was schnelle Neustarts innerhalb von Sekunden ermöglicht. Empfohlen zur Kostenoptimierung.
- Neustartend: Der Blib wird nach dem Anhalten neu gestartet. Dies kann als erzwungener Neustart bezeichnet werden. Wir empfehlen, einen Systemneustart zu initiieren.
sudo reboot Befehl zuerst.
Infrastruktur- & Wartungszustände (spezifisch für Trooper.AI):
- Gefroren: Der Server wird archiviert, wodurch Ressourcen freigegeben werden. Die Startzeiten können variieren und eine Portneuzuordnung kann erforderlich sein. Die Verwendung des gestoppten Zustands wird empfohlen, wenn vorhersehbare Startzeiten kritisch sind! Das Einfrieren wird für Unternehmenskunden aufgrund potenzieller Portänderungen und erhöhter Ausfallzeiten nicht empfohlen.
- Migriert: Der Blib wird auf andere Hardware verschoben; dieser Vorgang kann 10 bis 90 Minuten dauern.
Destruktive und irreversible Zustände:
- Beendet: Löscht den Server und alle zugehörigen Daten dauerhaft. Diese Aktion kann nicht rückgängig gemacht werden.
- Zurücksetzen: Löscht alle Daten auf dem Server und stellt die ursprüngliche Konfiguration wiederher. Um die Neuinstallation von Vorlagen auszuschließen, entfernen Sie diese vom Server, bevor Sie ihn zurücksetzen. Diese Funktion hat keinen Einfluss auf Ihr vorausbezahltes Guthaben oder Ihre vorgegebenen Preise, aber Ports können sich ändern und die Bereitstellung eines neuen Blibs kann einige Zeit in Anspruch nehmen. ES WERDEN ALLE DATEN GELÖSCHT! Diese Aktion kann nicht rückgängig gemacht werden. Wenden Sie sich bei Fragen zu dieser Reset-Funktion an uns!
Fragen und Antworten zum Status-System
Warum können A100-Server manchmal länger benötigen, um aus einem eingefrorenen Zustand wiederhergestellt zu werden, im Vergleich zu anderen Servertypen?
A100-Server sind mit umfangreichem ECC-Videospeicher ausgestattet. Beim Wiederherstellen aus einem eingefrorenen Zustand wird ein rigoroser Diagnosetest auf diesem Speicher durchgeführt, um Datenintegrität und Systemstabilität zu gewährleisten. Obwohl dieser Test unerlässlich ist, kann er gelegentlich zu einer längeren Wiederherstellungszeit führen.
Wie minimiert man die Startzeit eingefrorener Server?
Die effizienteste Methode, um die Startzeiten zu minimieren, ist das Stoppen der Serverinstanz anstelle des Einfrierens. Bitte beachten Sie, dass das Einfrieren eines Servers eine kurze Verzögerung verursacht, bevor er wieder verfügbar ist, oder sogar eine Migration des Servers erforderlich ist, die Ports, zugrunde liegende Hardware wie CPU-Modell und CPU-Geschwindigkeit ändert und zusätzliche Zeit in Anspruch nimmt.