Auf der Hot Chips, einer jährlichen Konferenz für die Halbleiterindustrie, zeigte IBM seinen neuen Telum-Prozessor, der die nächste Generation von IBM Z-Systemen antreibt. Neben acht Kernen und viel L2-Cache verfügt der Prozessor über einen dedizierten KI-Beschleuniger, der Betrug in Echtzeit erkennen kann.

Betrug ist auf dem Vormarsch. Die Federal Trade Commission (FTC) erhielt im Jahr 2020 4,7 Millionen Betrugsmeldungen mit einem Gesamtverlust von 3,3 Milliarden US-Dollar. Laut IBM geht Telum dieses Problem an, indem es eine Echtzeit-Erkennung bereitstellt. IBM führte Kreditkartentransaktionen als Beispiel an und sagte, dass Telum eine betrügerische Transaktion erkennen kann, bevor sie überhaupt abgeschlossen ist.

Laut IBM könnte dies zu einer „potenziell neuen Ära der Betrugsprävention im großen Stil“ führen. Obwohl Kreditkartenbetrug die direkteste Anwendung ist, kann der Onboard-KI-Beschleuniger von Telum auch andere Workloads bewältigen. Mittels maschinellem Lernen kann es unter anderem Risikoanalysen durchführen, Geldwäsche erkennen und die Kreditbearbeitung abwickeln.

Der Prozessor selbst sieht aus wie ein moderner Chip von AMD oder Intel. Es verfügt über acht Kerne mit gleichzeitigem Multithreading mit 5 GHz, und jeder Kern verfügt über einen privaten 32 MB L2-Cache. Ein Ring – von IBM als „Datenautobahn“ bezeichnet – verbindet die privaten Cache-Pools, sodass dem Prozessor insgesamt 256 MB Cache zur Verfügung stehen. Der KI-Beschleuniger ist ein Ableger des Datenrings und leitet Informationen mit minimaler Latenz an und von den Kernen weiter.

Laut IBM können Anwendungen auf bis zu 32 Telum-Chips skaliert werden, was von der Erkennung von Kreditkartenbetrug bis hin zu groß angelegten Risikoanalysen für Banken alles ermöglicht. Samsung unterstützt IBM beim Bau des Prozessors unter Verwendung seiner 7-nm-Extrem-Ultraviolett-Prozesstechnologie.

Accelerated Computing setzt sich schnell durch, und der neue Telum-Chip ist ein Beweis dafür. Das Mooresche Gesetz, die Idee, dass sich die Chipdichte etwa alle zwei Jahre verdoppelt, hat in den letzten Jahren abgenommen. Architekturverbesserungen kommen nicht schnell genug, was Unternehmen dazu veranlasst, sich an engagierte „Beschleuniger“ zu wenden, die auf bestimmte Arten von Arbeiten spezialisiert sind.

Heterogene Architekturen, wie sie genannt werden, kombinieren mehrere verschiedene Arten von Verarbeitungseinheiten, um die Leistung und Effizienz zu steigern, ohne auf eine neue Fertigungstechnologie umsteigen zu müssen. KI hat die Beschleunigerbehandlung schon einmal gesehen, aber nicht ganz so. In den meisten Fällen ist der KI-Beschleuniger ein vollständig separater Chip.

Telum setzt den KI-Beschleuniger auf den Prozessor selbst. Dadurch kann IBM den Cache mit dem Beschleuniger teilen und eine Schnittstelle mit geringer Latenz bereitstellen, über die es direkt mit den CPU-Kernen kommunizieren kann. In Anwendungen, in denen Unternehmen auf Algorithmen angewiesen sind, kann KI den Prozess beschleunigen. Und in Anwendungen, in denen Unternehmen KI verwenden, kann Telum dazu beitragen, den Rechenaufwand und die erforderliche Zeit zu reduzieren.

Die ersten Telum-Maschinen werden ab 2022 im IBM-Z-Mainframe auftauchen. Für die meisten wird es ein unsichtbarer Übergang zu einer höheren Rechenleistung sein. Wenn Telum eine „neue Ära“ einläutet, wie IBM vorschlägt, könnte dies viel mehr bedeuten.

Empfehlungen der Redaktion