Nvidia will 2025 hunderttausende Blackwell-GPUs ausliefern. Aufgrund eines Problems hat sich die Fertigung etwas verzögert, ist nun aber in vollem Gange. Inzwischen wurden die ersten Systeme an OpenAI und Microsoft ausgeliefert.
Bei Nvidia ist es schon Tradition geworden, dass OpenAI zuerst mit neuen KI-Beschleunigern beliefert wird. In diesem Jahr bekommt das System vom Typ DGX B200 acht B200-Beschleuniger der neuen Generation Blackwell von Nvidia. Sie werden von zwei Intel-Prozessoren des Typs Platinum 8570 mit jeweils 56 CPU-Kernen angesteuert. Die Auslieferung wurde diesmal nicht von Nvidias CEO Jensen Huang persönlich begleitet. Mit dabei waren Jonah Alben, der Chef-Architekt der Blackwell-Architektur und Senior Vice President des GPU-Engineering, sowie der VP der Accelerated Computing Business Unit, Ian Buck.
Komplettsystem von Nvidia
Die neuen KI-Beschleuniger verkauft Nvidia als Komplettsystem. Die KI-Rechenleistung liegt bei 72 Petaflops. Datenformate sind mit FP8, FP9 und INT8 vorhanden. Mit dem bislang seltenen Datenformat FP4 ist auch eine KI-Rechenleistung von 144 Petaflops möglich. In der B200-Ausführung nimmt jede GPU bis zu1.000 Watt auf. Bei einem kompletten DGX-B200-System beträgt die Leistungsaufnahme 14,3 Kilowatt.
Microsoft mit Eigenkreation
Microsoft wurde mit Blackwell-Boards in Form von GB200-Modellen beliefert. Ein GB200 setzt sich aus einer ARM-Grace-CPU und zwei B200-GPUs zusammen. Die eigentliche Hardware befindet sich links im Rack. Darunter sind acht GB200-Einschübe sowie neun NVLink-Einschübe angeordnet. Der linke Teil ist dem GB200-NVL-72-Rack ähnlich.
Der rechte Teil dient zur Kühlung von GPUs, CPUs und Switches und ist doppelt so breit wie der Hardware-Schrank. Im hinteren Bereich befindet sich ein großer Wärmetauscher. Die Chips sind wassergekühlt. Das Kühlersystem kann im Normalfall mehrere Hardware-Racks kühlen. Beim System von Microsoft könnte es sich um ein Testsystem handeln. Später könnte noch weitere Hardware angeschlossen werden.
Fertigung der Blackwell-GPU zunächst in Kleinserie
Bislang fertigt Nvidia die Blackwell-GPUs nur in Kleinserie. Kurzfristig hat Nvidia das Design gemeinsam mit dem Chipauftragsfertiger TSMC angepasst. Die Ausbeute an Chips soll so erhöht werden. Die Serienproduktion soll zwischen November 2024 und Januar 2025 starten. Mit den angekündigten Blackwell-Supercomputern ist erst irgendwann im Laufe des Jahres 2025 zu rechnen.
Die großen Hyperscaler könnten in den kommenden Wochen und Monaten mit mehr Blackwell-Hardware von Nvidia beliefert werden. Die PR um die ersten Auslieferungen an OpenAI und Microsoft könnte eine vertrauensbildende Maßnahme nach den anfänglichen Verzögerungen bei der Fertigung sein. Die kommenden Quartalsergebnisse werden zeigen, wie es mit der Nachfrage nach Blackwell-Produkten aussieht.
Quellen: Nvidia, Microsoft, OpenAI, Heise, hardwareLUXX