Spiel

#Nvidias neuer KI-Chip ist 40.000 USD teuer, schneidet im Gaming-Benchmark aber unterirdisch ab

Zur GTC 2022 hat Nvidia mit dem H100 einen neuen Hochleistungs-Chip vorgestellt. Ein erster Benchmark im Gaming-Bereich zeigt aber, warum dieser ein anderes Einsatzgebiet hat.

80 Mrd. Transistoren befinden sich auf Nvidias H100-Chip, doch in Gaming-Benchmarks schlägt sich das nicht nieder. (Quelle: Nvidia)
80 Mrd. Transistoren befinden sich auf Nvidias H100-Chip, doch in Gaming-Benchmarks schlägt sich das nicht nieder. (Quelle: Nvidia)

Und wir dachten, die RTX 4090 wäre teuer: Zur GTC 2022 präsentierte Nvidia mit dem H100 die erste GPU auf Basis der neuen Hopper-Architektur, welche in der damaligen Pressemitteilung als neuer Motor der weltweiten KI-Infrastruktur angepriesen wurde.

Kostenpunkt: Stolze 40.000 US-Dollar.

Grundsätzlich werden solche Grafikkarten in Datenzentren mit exorbitant hohen Workloads eingesetzt und die sich den ebenso exorbitant hohen Preis auch leisten können.

Dem Youtuber Geekerwan gelang es aber, gleich vier der H100-Grafikkarten zur Verfügung gestellt zu bekommen und testete diese unter anderem im beliebten Benchmark-Tool 3DMark. Als Standardtest gilt hier der TimeSpy-Score, mit dem sich ein zuverlässiger Vergleichswert ermitteln lässt.


Empfohlener redaktioneller Inhalt

An dieser Stelle findest du einen externen Inhalt von YouTube, der den Artikel ergänzt.
Du kannst ihn dir mit einem Klick anzeigen lassen und wieder ausblenden.


Ich bin damit einverstanden, dass mir Inhalte von YouTube angezeigt werden.

Personenbezogene Daten können an Drittplattformen übermittelt werden. Mehr dazu in unserer Datenschutzerklärung.

Link zum YouTube-Inhalt

80 Milliarden Transistoren, aber kein Raytracing

Fangen wir zunächst mit den schwindelerregenden technischen Daten der H100-GPU an: Mit einer Fertigung von vier Nanometern und ganzen 80 Milliarden Transistoren stellte Nvidia die Grafikkarte als leistungsfähigsten Beschleuniger der Welt vor.

Dank 80 Gigabyte HBM3-Speicher ist eine Speicherbandbreite von bis zu drei Terabyte pro Sekunde möglich.

Mit HBM3 ist eine neue Speicherspezifikation gemeint, wodurch 12 statt 8 SDRAM-Chips gestapelt werden können. Ein einzelner dieser Stacks schafft bis zu 819 Gigabyte pro Sekunde; im H100 sitzen insgesamt sechs dieser Stapel.

Einer davon ist allerdings deaktiviert, was folglich eine theoretische Übertragungsrate von maximal 4,1 Terabyte pro Sekunde ergibt. Vermutlich aufgrund von nicht näher aufgeschlüsselten Taktfrequenzen kann der Nvidia H100 dieses Maximum allerdings nicht erreichen.

Je nachdem, ob der SXM-Formfaktor oder das aus den klassischen Heim-PCs bekannte PCI-Express vorliegt, schafft der H100 zwischen 756 und 989 teraFLOPS Tensor-FP32-Rechenleistung; in Tensor-FP16 sind es hingegen zwischen 1.513 und 1.979 teraFLOPS.

Zum Vergleich: Die Geforce RTX 4090, das aktuelle Nvidia-Flaggschiff für den Heimgebrauch, schafft in den Disziplinen »nur« 330,4 respektive 165,2 TFLOPS.

ASUS TUF Gaming<br>GeForce RTX 4090
Die Standard-4090
ASUS TUF Gaming
GeForce RTX 4090
Release 2022
Eine bessere Grafikkarte bekommt ihr im Moment nicht. Mit 24 GB GDDR6X VRAM seid ihr wirklich für alles bereit – sogar Gaming in 4K bei 240 FPS. Auch Raytracing ist keinerlei Herausforderung.


MSI GeForce RTX 4090<br>Gaming X Trio
Mit RGB-Beleuchtung
MSI GeForce RTX 4090
Gaming X Trio
Release 2022
Die GeForce RTX 4090-Variante von MSI punktet durch besonders ansprechendes Design mit RGB-Beleuchtung, für diejenigen, die ihrem PC gerne beim Arbeiten zusehen.

0


GIGABYTE WINDFORCE<br>GeForce RTX 4090
Preis-Leistungs-4090
GIGABYTE WINDFORCE
GeForce RTX 4090
Release 2022
Das beste Preis-Leistungs-Verhältnis bekommt ihr von GIGABYTE. Sie ist dafür weniger stark übertaktet und hat einen etwas höheren Stromverbrauch als ähnliche Modelle.

But can it run Crysis? Wohl eher nicht

Kehren wir zurück zum Benchmark des Youtubers Geekerwan. Dieser musste sich zunächst um eine adäquate Kühllösung kümmern, denn die H100 hat als klassische Datenzentren-GPU keine eigene Lösung verbaut.

Weitere Tricks sind etwa beim Display-Output notwendig, damit das PC-System die Grafikkarten überhaupt erkennt. Mit dem TimeSpy-Test des Benchmark-Tools 3DMark wurden anschließend die Gaming-Kapazitäten der H100-Grafikkarte getestet.

Das auf ersten Blick ernüchternde Ergebnis: Mit 2.681 Punkten reiht sich die H100 unterhalb integrierter Grafikchips wie der Radeon 680M (2.710 Punkte), vom Vergleich mit aktuellen Spitzen-GPUs ganz zu schweigen.

Der technische Hintergrund hierzu liefert allerdings schnell eine simple Begründung: Mit deutlich weniger Rasterizing-Units als die RTX 4090 (24 statt 160) sowie nur vier zum Rendern fähige Texture-Processing-Cluster ist die H100 schlicht nicht auf Gaming-Arbeiten ausgelegt.

Wer die 40.000 US-Dollar für eine Grafikkarte übrig hat, sollte also von der H100 eher Abstand nehmen, wenn man nicht gerade hochaufwändige KI-Berechnungen durchführen will. Für’s Gaming empfehlen wir stattdessen in unsere GPU-Kaufberatung:

Kaufberatung

20 Mal teurer als die RTX 4090 und trotzdem so wenig Gaming-Leistung – wer von euch hätt’s gedacht? Welche Grafikkarte steckt bei euch in den Rechnern und wie hoch fällt ihr TimeSpy-Score aus? Um wie viel Prozent könnt ihr die 40.000 Euro-Grafikkarte von Nvidia hier schlagen? Lasst es uns gerne in den Kommentaren wissen!

Wenn Ihnen der Artikel gefallen hat, vergessen Sie nicht, ihn mit Ihren Freunden zu teilen. Folgen Sie uns auch in Google News, klicken Sie auf den Stern und wählen Sie uns aus Ihren Favoriten aus.

Wenn Sie an Foren interessiert sind, können Sie Forum.BuradaBiliyorum.Com besuchen.

Wenn Sie weitere Nachrichten lesen möchten, können Sie unsere Spiel kategorie besuchen.

Quelle

Ähnliche Artikel

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert

Schaltfläche "Zurück zum Anfang"
Schließen

Please allow ads on our site

Please consider supporting us by disabling your ad blocker!