Qdrant

Qdrant est un moteur de recherche de similarité vectorielle conçu pour accélérer les flux de travail de l'IA et de l'apprentissage automatique. Il est particulièrement puissant lorsqu'il est combiné à une infrastructure de serveurs GPU dédiés comme ceux proposés par Trooper.AI, permettant le prototypage et le déploiement rapides de solutions d'IA complexes.

Dashboard of Qdrant
Tableau de bord de Qdrant

Qdrant excelle dans la recherche des vecteurs les plus similaires à un vecteur de requête donné, ce qui le rend idéal pour des applications telles que la recherche sémantique, les systèmes de recommandation et la récupération d'images/vidéos.

Pourquoi Qdrant avec des serveurs GPU ?

Les systèmes de bases de données traditionnels peinent à gérer la haute dimensionnalité et les calculs de similarité complexes inhérents aux intégrations vectorielles. Qdrant, optimisé pour les données vectorielles, combiné à la puissance de traitement parallèle des GPU, offre des gains de performance significatifs. Un serveur GPU Trooper.AI fournit la puissance nécessaire pour gérer des ensembles de données vectorielles à grande échelle et fournir des résultats de recherche à faible latence.

L'accélération GPU est activée par défaut dans notre modèle Qdrant préconfiguré, garantissant des performances optimales pour vos recherches.

Cas d'utilisation

Voici quelques cas d'utilisation spécifiques où Qdrant, propulsé par les serveurs GPU Trooper.AI, excelle :

  • Recherche sémantique : Au lieu de la correspondance de mots-clés, Qdrant vous permet de rechercher des documents ou du contenu en fonction de leur sensLes embeddings capturent l'essence sémantique du texte, et Qdrant trouve les résultats les plus sémantiquement similaires. Par exemple, une recherche pour « comment améliorer la précision du modèle » renverra des résultats discutant de la régularisation, de l'optimisation des hyperparamètres et de l'augmentation des données, même si ces mots-clés exacts ne sont pas présents.
  • Systèmes de recommandation : Représentez les utilisateurs et les éléments sous forme de vecteurs. Qdrant peut rapidement identifier les éléments similaires à ceux avec lesquels un utilisateur a précédemment interagi, fournissant ainsi des recommandations personnalisées. Ceci est applicable au commerce électronique, au streaming de contenu, et plus encore.
  • Récupération d'images et de vidéos : Extraire des embeddings d'images et de vidéos en utilisant des modèles comme CLIP. Qdrant permet de rechercher du contenu visuellement similaire. Imaginez rechercher "un chat jouant avec une balle" et récupérer des images et des vidéos pertinentes, même si elles ne comportent pas ces balises exactes.

API

Voici un exemple de flux de travail API typique avec Qdrant, suivi d'un exemple Python pour interroger des vecteurs similaires :

Workflow normal de l’API avec Qdrant :

  1. Authentification : La plupart des déploiements de Qdrant nécessitent une clé API pour l'authentification. Cette clé doit être incluse dans Authorization en-tête de vos requêtes.
  2. Sélection du point de terminaison : Qdrant expose diverses extrémités pour différentes opérations telles que la recherche, l'upsert (l'ajout) de vecteurs et la gestion de collections.
  3. Format de la requête : Les données sont généralement envoyées et reçues au format JSON.
  4. Gestion des réponses : L'API renvoie des réponses au format JSON contenant les résultats de votre requête, ou des messages d'erreur en cas de problème.

Voici un exemple d’appel Python à Qdrant pour rechercher des vecteurs similaires :

python
import requests
import json
import numpy as np

# Qdrant API endpoint and collection name
QDRANT_API_URL = "https://SECURE-TROOPER-APP-URL"  # Replace with your Qdrant endpoint
QDRANT_COLLECTION_NAME = "my_collection"

# Your API Key
API_KEY = "YOUR_QDRANT_API_KEY" # Replace with your Qdrant API key

# Payload for the search request
payload = {
    "vectors": (np.random.rand(128).tolist()),  # Replace with your query vector
    "limit": 10  # Number of results to return
}

headers = {
    "Authorization": f"Bearer {API_KEY}",
    "Content-Type": "application/json"
}

try:
    response = requests.post(f"{QDRANT_API_URL}/collections/{QDRANT_COLLECTION_NAME}/search",
                             headers=headers,
                             data=json.dumps(payload))

    response.raise_for_status()  # Raise HTTPError for bad responses (4xx or 5xx)

    results = response.json()
    print(json.dumps(results, indent=2))

except requests.exceptions.RequestException as e:
    print(f"Error: {e}")
    print(f"Response text: {response.text}")
except Exception as e:
    print(f"An unexpected error occurred: {e}")

Cet exemple illustre l'interrogation de Qdrant pour des vecteurs similaires. N'oubliez pas de remplacer "https://SECURE-TROOPER-APP-URL", "my_collection", "YOUR_QDRANT_API_KEY" et le vecteur d'exemple avec votre point de terminaison Qdrant réel, le nom de la collection, la clé API et le vecteur de requête. Veuillez consulter la documentation de l'API Qdrant pour plus de points de terminaison et de fonctionnalités : https://qdrant.tech/documentation/ .

Tableau de bord Qdrant

Dashboard Startscreen
Écran d'accueil du tableau de bord

Qdrant fournit un tableau de bord web convivial pour gérer vos vecteurs et vos collections. Le tableau de bord vous permet de :

  • Visualiser les données vectorielles : Explorez vos vecteurs dans un espace multidimensionnel à l'aide de nuages de points et d'autres visualisations.
  • Gérer les collections : Créer, modifier et supprimer des collections pour organiser vos données vectorielles.
  • Recherche et filtrage : Effectuer des recherches rapides et appliquer des filtres pour trouver des vecteurs spécifiques.
  • Surveiller les performances : Suivre les indicateurs clés tels que la latence des requêtes et l'utilisation des ressources.
  • Inspecter les vecteurs : Visualisez des informations détaillées sur les vecteurs individuels, notamment leurs plongements et leurs charges utiles.

Comment accéder au tableau de bord

Vous pouvez accéder au tableau de bord Qdrant via l'interface web de votre déploiement Qdrant.

Ajouter /dashboard à votre URL API pour y accéder.

Veuillez consulter la documentation Qdrant pour des instructions détaillées sur l'accès et l'utilisation du tableau de bord : https://qdrant.tech/documentation/ L'utilisation du tableau de bord en conjonction avec un serveur GPU Trooper.AI garantit une expérience fluide et réactive lors du travail avec des ensembles de données vectorielles à grande échelle.