Liste d'état des Blibs

Notre système de statut intuitif permet une gestion facile de vos Blibs Serveur GPU. Les serveurs passent d'un statut à l'autre – actuellement au statut A, et passant au statut B – permettant un fonctionnement et un contrôle fluides.

Statuts possibles

États de cycle de vie actifs (fonctionnement normal) :

  • En cours d'exécution : Le Blib traite activement des tâches et est accessible.
  • Arrêté : Arrête le serveur. Les ressources (GPU, cœurs CPU, RAM) restent allouées, permettant des redémarrages rapides en quelques secondes.
    Recommandé pour l’optimisation des coûts.
  • Redémarrage : Le Blib est en cours de démarrage après avoir été arrêté. Cela peut être considéré comme une réinitialisation forcée d’alimentation. Nous recommandons d’initier un redémarrage système via la commande sudo reboot avant toute autre action.

États d'infrastructure et de maintenance (spécifique à Trooper.AI) :

  • Gelé : Le serveur est archivé et libère l’allocation des ressources. Les temps de démarrage peuvent varier, et une réattribution de ports peut être nécessaire. L’utilisation de l’état arrêté est recommandée si des temps de démarrage prévisibles sont critiques ! La mise en état gelé n’est pas recommandée pour les clients entreprises en raison d’éventuels changements de ports et d’une augmentation du temps d’indisponibilité.
  • Migré : Le Blib est en cours de déplacement vers un matériel différent ; ce processus peut prendre entre 10 et 90 minutes.

États destructifs & irréversibles :

  • Terminé : Supprime définitivement le serveur et toutes les données associées. Cette action est irréversible.
  • Réinitialisation : Supprime toutes les données du serveur et réinstalle la configuration initiale. Pour exclure des modèles de la réinstallation, retirez-les du serveur avant la réinitialisation. Cette fonction n'affecte pas votre budget prépayé ou vos prix prédéfinis, mais les ports peuvent changer et le provisionnement d'un nouveau Blib peut prendre du temps.
    TOUTES LES DONNÉES SERONT PERDUES ! Cette action est irréversible. Contactez-nous pour toute question concernant cette fonction de réinitialisation.

FAQ sur le système de statut

Pourquoi les serveurs A100 mettent-ils parfois plus de temps à redémarrer après un état figé par rapport aux autres types de serveurs ?

Les serveurs A100 sont équipés d'une quantité importante de mémoire vidéo ECC. Lors de la reprise à partir d'un état figé, un test de diagnostic rigoureux est effectué sur cette mémoire afin de garantir l'intégrité et la stabilité du système. Bien que ce test soit essentiel, il peut occasionnellement entraîner un temps de reprise plus long.

Comment minimiser le temps de démarrage des serveurs en état suspendu ?

La méthode la plus efficace pour minimiser les temps de démarrage consiste à arrêter l'instance de serveur plutôt qu'à la suspendre. Veuillez noter que la suspension d'un serveur entraînera un bref délai avant qu'il ne soit à nouveau disponible, voire une migration du serveur qui modifiera les ports, le matériel sous-jacent comme le modèle du CPU et la vitesse du CPU, et prendra plus de temps.