Zamów serwer GPU z kartą A100 Wszystkie benchmarki serwerów GPU
Ładowanie danych porównawczych...
Nasze testy porównawcze są zbierane automatycznie z serwerów wyposażonych w GPU typu A100 i H100 w naszej flocie. W przeciwieństwie do syntetycznych testów laboratoryjnych, te wyniki pochodzą z rzeczywistych serwerów produkcyjnych obsługujących rzeczywiste obciążenia AI - zapewniając przejrzyste, realne dane dotyczące wydajności.
vLLM (Wysokoprzetwornicowy) oraz Ollama (Jednouserowy). Testy z użyciem ramienia vLLM pokazują wydajność A100 i H100 przy obsłudze 16–64 równoległych żądań – idealne dla produktowych botów czatowych, wieloagentowych systemów AI oraz serwerów API. Benchmarki Ollamy mierzą prędkość pojedynczych żądań przeznaczonych dla osobistych asystentów AI i lokalnego rozwoju. Spośród modeli przetestowano m.in.: Llama 3.1, Qwen3, DeepSeek-R1, a także inne.
Benchmarki generowania obrazów obejmują architektury Flux, SDXL i SD3.5. Jest to kluczowe dla tworzenia sztuki AI, prototypowania projektów oraz aplikacji kreatywnych. Skupienie na prędkości generowania pojedynczego zapytania pozwala zrozumieć, jak karty A100 i H100 radzą sobie z obciążeniem związanym z Twoimi zadaniami graficznymi.
Testy wizualne oceniają przetwarzanie multimodalne i dokumentów przy wysokim obciążeniu równoległym (16–64 żądań jednocześnie), wykorzystując dane z rzeczywistych scenariuszy. LLaVA 1.5 7B (model językowo-wizyjny o parametrach 7B) analizuje fotografię starszej kobiety na polu kwiatowym z golden retrieverem, testując rozumienie sceny oraz logiczne rozumowanie wizualne przy wielkości partii wynoszącej 32, aby zgłaszać wynik jako obrazów na minutę. TrOCR-base (model OCR o parametrach 334M) procesuje 2750 stron Hamleta Szekspira zeskanowanych ze starych książek z typografią epoki przy wielkości partii wynoszącej 16, mierząc wydajność jako stron na minutę dla cyfryzacji dokumentów. Sprawdź, jak karty A100 i H100 radzą sobie z pracami AI w skali produkcyjnej – kluczowe dla moderowania treści, przetwarzania dokumentów oraz automatycznej analizy obrazów.
Uwzględniamy również moc obliczeniową CPU (wpływającą na tokenizację i przetwarzanie wstępne) oraz prędkość dysków NVMe (kluczową dla ładowania dużych modeli i zbiorów danych) - dający pełen obraz Twoich obciążeń związanych ze sztuczną inteligencją.
Wynik w TAIflops (Trooper AI FLOPS) pokazany w pierwszym wierszu łączy wszystkie wyniki benchmarków sztucznej inteligencji w jedną liczbę. Używając karty RTX 3090 jako punktu odniesienia (100 TAIflops), ten wynik natychmiast pokaże Ci, jak A100 i H100 porównują się pod względem ogólnej wydajności dla obciążeń związanych z AI. Dowiedz się więcej o TAIflops →
Uwaga: Wyniki mogą się różnić w zależności od obciążenia systemu i konfiguracji. Te wyniki benchmarkowe reprezentują wartości medyczne uzyskane podczas wielu pomiarów.
Zamów serwer GPU z kartą A100 Zamów serwer GPU z kartą H100 Pokaż wszystkie benchmarki