Notre système de statut intuitif permet une gestion facile de vos Blibs Serveur GPU. Les serveurs passent d'un statut à l'autre – actuellement au statut A, et passant au statut B – permettant un fonctionnement et un contrôle fluides.
Statuts possibles
États de cycle de vie actifs (fonctionnement normal) :
- En cours d'exécution : Le Blib traite activement les tâches et est accessible.
- Arrêté : Arrête le serveur. Les ressources (GPU, cœurs de CPU, RAM) restent allouées, permettant des redémarrages rapides en quelques secondes. Recommandé pour l'optimisation des coûts.
- Redémarrage : Le Blib est en cours de démarrage après avoir été arrêté. Ceci peut être considéré comme un redémarrage forcé. Nous recommandons d'initier un redémarrage du système en utilisant la
sudo reboot commande en premier.
États d'infrastructure et de maintenance (spécifique à Trooper.AI) :
- Gelé: Le serveur est archivé, libérant l'allocation de ressources. Les temps de démarrage peuvent varier et une réaffectation de port peut être nécessaire. L'utilisation de l'état arrêté est recommandée si des temps de démarrage prévisibles sont essentiels ! Il n'est pas recommandé de figer les serveurs pour les clients professionnels en raison de modifications potentielles des ports et d'une augmentation du temps d'arrêt.
- Migré : Le Blib est en cours de déplacement vers un matériel différent ; ce processus peut prendre de 10 à 90 minutes.
États destructifs & irréversibles :
- Résilié : Supprime définitivement le serveur et toutes les données associées. Cette action ne peut pas être annulée.
- Réinitialisation : Supprime toutes les données du serveur et réinstalle la configuration initiale. Pour exclure les modèles de la réinstallation, supprimez-les du serveur avant de réinitialiser. Cette fonction n'affecte pas votre budget prépayé ou vos prix prédéfinis, mais les ports peuvent changer et le provisionnement d'un nouveau Blib peut prendre du temps. TOUTES LES DONNÉES SERONT PERDUES ! Cette action ne peut pas être annulée. Contactez-nous pour toute question concernant cette fonction de réinitialisation !
FAQ sur le système de statut
Pourquoi les serveurs A100 mettent-ils parfois plus de temps à reprendre d'un état figé par rapport aux autres types de serveurs ?
Les serveurs A100 sont équipés d'une quantité importante de mémoire vidéo ECC. Lors de la reprise à partir d'un état figé, un test de diagnostic rigoureux est effectué sur cette mémoire afin de garantir l'intégrité et la stabilité du système. Bien que ce test soit essentiel, il peut occasionnellement entraîner un temps de reprise plus long.
Comment minimiser le temps de démarrage des serveurs gelés ?
La méthode la plus efficace pour minimiser les temps de démarrage consiste à arrêter l'instance de serveur plutôt qu'à la suspendre. Veuillez noter que la suspension d'un serveur entraînera un bref délai avant qu'il ne soit à nouveau disponible, voire une migration du serveur qui modifiera les ports, le matériel sous-jacent comme le modèle du CPU et la vitesse du CPU, et prendra plus de temps.