Blibs-Statusliste

Unser intuitives Statussystem bietet eine einfache Verwaltung Ihrer GPU Server Blibs. Server wechseln zwischen Status – derzeit Status A, und bewegen sich in Richtung Status B – was einen nahtlosen Betrieb und Kontrolle ermöglicht.

Mögliche Status

Aktive Lebenszyklusstatus (normaler Betrieb):

  • Aktiv: Der Blib verarbeitet aktiv Aufgaben und ist zugänglich.
  • Gestoppt: Setzt den Server herunter. Die Ressourcen (GPUs, CPU-Kerne, RAM) bleiben zugewiesen und ermöglichen Neustarts innerhalb von Sekunden. Empfohlen zur Kostensenkung.
  • Neustarten: Der Blib befindet sich im Hochfahrprozess nach einem Stopp. Dies kann auch als erzwungener Neustart bezeichnet werden. Wir empfehlen zunächst einen Systemneustart mit dem Befehl sudo reboot.

Infrastruktur- & Wartungszustände (spezifisch für Trooper.AI):

  • Eingefroren: Der Server wird archiviert und gibt Ressourcen frei. Die Startzeiten können variieren, und eine Neuzuweisung der Ports kann erforderlich sein. Für vorhersehbare Startzeiten wird empfohlen, stattdessen den gestoppt-Zustand zu verwenden! Das Einfrieren ist für Enterprise-Kunden aufgrund möglicher Portänderungen sowie erhöhter Ausfallzeiten nicht empfehlenswert.
  • Migriert: Der Blib wird auf andere Hardware verschoben; dieser Vorgang kann 10 bis 90 Minuten dauern.

Destruktive und irreversible Zustände:

  • Beendet: Löscht den Server und alle damit verbundenen Daten dauerhaft. Diese Aktion lässt sich nicht rückgängig machen.
  • Zurücksetzen: Löscht alle Daten auf dem Server und installiert die ursprüngliche Konfiguration neu. Um Vorlagen von der Neuinstallation auszuschließen, entfernen Sie diese vor dem Zurücksetzen vom Server. Diese Funktion beeinflusst weder Ihr Prepaid-Budget noch Ihre vordefinierten Preise, allerdings können sich Ports ändern und das Bereitstellen eines neuen Blib kann einige Zeit in Anspruch nehmen.
    ALLE DATEN GEHEN VERLOREN! Diese Aktion lässt sich nicht rückgängig machen. Bei Fragen zu dieser Rücksetzfunktion kontaktieren Sie uns bitte.

Fragen und Antworten zum Status-System

Warum benötigen A100-Server manchmal länger zum Wiederaufsetzen aus einem eingefrorenen Zustand im Vergleich zu anderen Servertypen?

A100-Server sind mit umfangreichem ECC-Videospeicher ausgestattet. Beim Wiederherstellen aus einem eingefrorenen Zustand wird ein rigoroser Diagnosetest auf diesem Speicher durchgeführt, um Datenintegrität und Systemstabilität zu gewährleisten. Obwohl dieser Test unerlässlich ist, kann er gelegentlich zu einer längeren Wiederherstellungszeit führen.

Wie lässt sich die Startzeit eingefrorener Server minimieren?

Die effizienteste Methode, um die Startzeiten zu minimieren, ist das Stoppen der Serverinstanz anstelle des Einfrierens. Bitte beachten Sie, dass das Einfrieren eines Servers eine kurze Verzögerung verursacht, bevor er wieder verfügbar ist, oder sogar eine Migration des Servers erforderlich ist, die Ports, zugrunde liegende Hardware wie CPU-Modell und CPU-Geschwindigkeit ändert und zusätzliche Zeit in Anspruch nimmt.