Leibniz-Rechenzentrum bekommt HPE-Server mit gigantischem Cerebras-Wafer - Starstube

Leibniz-Rechenzentrum bekommt HPE-Server mit gigantischem Cerebras-Wafer

Leibniz-Rechenzentrum bekommt HPE-Server mit gigantischem Cerebras-Wafer

In einer gemeinsamen Pressemitteilung gibt das Leibniz-Rechenzentrum (LRZ) der Bayerischen Akademie der Wissenschaften und der Chipdesigner Cerebras bekannt, dass am LRZ-Standort Garching im Sommer 2022 ein System mit der von Cerebras betriebenen Wafer Scale Engine 2 errichtet werden soll.

Gefördert durch Mittel der bayrischen Hightech-Agenda, versprechen die Garchinger sich von dem System auf Basis eines HPE Superdome-Servers speziell in der Forschung und KI-Entwicklung Fortschritte. Die Anforderungen an KI-Modelle erhöhen sich mit Angaben rasanter Geschwindigkeit – alle drei bis vier Monate verdoppeln sich laut des LRZ und aus der Industrie die nötigen Berechnungskapazitäten und auch die erforderliche Speichermenge wächst enorm.

Die Wafer Scale Engine 2 wurde vor knapp zwei Jahren auf der Hotchips vorgestellt. Cerebras genau sterben WSE2 als Éinen Chip der Superlative: Hergestellt in 7-Nanometer-Technik hat das körperliche quadratische Monstrum eine Kantenlänge von 215 Millimetern – etwas breiter als eine der DIN-A4-Seiten im c’t-Magazin.

Links Cerebras‘ WSE2, rechts Nvidias A100, einer der aktuellsten Größen GPU-Beschleuniger

(Bild: Großhirn)

In den 46.225 Quadratmillimetern sind 2,6 Milliarden Transistoren zu 850.000 Rechenkernen mit gleichmäßig verteilten 40 GByte SRAM vereint. Pro Kern bleiben zwar nur rund 50 KByte übrig, doch die sind rasend schnell ver- und angebunden: Bis zu 220 Petabit/s soll das Netzwerk aus Datenleitungen auf dem Chip transportieren und sich zusammen mit der Speichertransferrate von 20 Petabyte/s daher besonders für KI -Berechnungen eigenen – zum Speicher selbst macht Cerebras keine Angaben. Hier bezieht man sich wohl auf den on-Chip-SRAM.

Anders als herkömmliche Chips lässt Cerebras die WSE als Ganzes belichten (daher der Name) und die funktional identischen Prozessoren werden auch nicht in einzelnen Teilen zersägt. Dadurch können schnellere Interconnects auf einem einzelnen Silizium-Chip eingesetzt werden, anstatt hinterher die zersägten Chips aufwendig und langsamer wieder zu verbinden.

Das Cerebras-System schluckt bis zu 23 Kilowatt, was durch die hohe Performance bei ausgewählten Algorithmen allerdings sehr effizient ist. Es passt in einen Serverschrank und belegt dort 15 Höheneinheiten.

Das System soll dem LRZ-Pool aus gemischten Rechenressourcen aus CPUs, GPUs, FPGAs und ASICs zur Verfügung stehen und in einem Rack die Leistung herkömmlicher Systeme erreichen. Das spart Energie und Zeit.

Nach Systemen bei Total Energies und einer nicht näher genannten US-Finanzinstitution wäre das Cerebras-System im LRZ die dritte Installation der WSE2. Es soll in Garching unter anderem für Sprachverarbeitung (Natural Language Processing, NLP), computergestützte Diagnosen oder (Wetter-)Vorhersagen, sowie bei Strömungsberechnungen etwa für Luftfahrtentwicklung oder Herstellung eingesetzt werden.

Obwohl die Wafer Scale Engine 2 auf dem Papier beeindruckend aussieht, hat sie es bisher noch nicht in der Top500-Supercomputer geschafft, auch wenn es bereits zum Vorgänger Forschungsprojekte mit beeindruckender Leistung auf Supercomputer-Niveau gab. Doch möglicherweise taucht das erste System ja in der für Montag avisierten Juni-Liste auf, die auf der ISC22 in Hamburg präsentiert wird.


Mehr von c’t Magazin

Mehr von c’t Magazin


Mehr von c’t Magazin

Mehr von c’t Magazin


(csp)

Zur Startseite

.
#LeibnizRechenzentrum #bekommt #HPEServer #mit #gigantischem #CerebrasWafer