NACH OBEN

CoolTech: Phillip Schönfelder und der KI Rechner NVIDIA DGX A100

08.06.2021

Nvidia Dgx A100

Forschung am Lehrstuhl Informatik im Bauwesen bedeutet nicht nur neue Herangehensweisen für die Baubranche zu entwickeln, sondern auch den Einsatz von neuen und fortschrittlichen Technologien. Diesmal wird der GPU-Server und die Forschung von Phillip Schönfelder vorgestellt.

Phillip Schönfelder ist seit November letzten Jahres wissenschaftlicher Mitarbeiter am IIB. Im Bachelor hat er Maschinenbau an der PHWT in Diepholz und im Master Computational Engineering an der RUB studiert. Er ist Teil des Projektes „BIMKIT“, in dem es um die Bestandsmodellierung von Gebäuden und Infrastrukturbauwerken mittels KI zur Generierung von Digital Twins geht. Sein Forschungsschwerpunkt sind Machine Learning Methoden, welche sich mit der automatisierten Verarbeitung von Texten beschäftigen. Worum es im Detail geht und was es bedeutet eine KI zu trainieren, erzählt er im Interview.

Womit beschäftigst du dich in deiner Forschung?

Phillip: Momentan beschäftige ich mich mit dem Erarbeiten von KI-Verfahren für die Nutzung im Bauwesen. Dazu kann man bereits trainierte KI nutzen oder neu anlernen, jedoch braucht es dafür eine sehr große Datenmenge. Beispielsweise wäre der gesamte Wikipediakorpus – also alle auf Wikipedia existierenden Beiträge – eine gute Basis.
Eine bereits trainierte KI mit einem gewissen Sprachverständnis kann ich dann zum Beispiel nutzen, um bestimme Schlüsselbegriffe in Texten zu erkennen und diese in vordefinierte Kategorien einzuordnen. Das nennt sich Named Entity Recognition – die Erkennung und Klassifizierung von Schlüsselbegriffen. Das dabei verwendete KI-Modell heißt BERT (Bidirectional Encoder Representations from Transformers) und gehört heute zu den bekanntesten Transformer-Modellen. Zur Feinabstimmung des Modells benutze ich einen speziellen Rechner vom IIB, da allein der vortrainierte Teil des Modells 400 Megabyte groß ist und es sehr viel Rechenleistung erfordert, um es weiter zu trainieren.

Was ist das Besondere an dem Rechner?

Phillip: Der GPU-Server hat durch seine acht verbauten NVIDIA Tesla A100-SXM4-40GB GPUs eine sehr hohe Rechenleistung. Durch die Übersetzung von Wörtern in numerische Vektoren werden die Wörter maschinenlesbar und damit gut zu verarbeiten. Durch die Menge an parallel laufenden Berechnungen, welche die KI ausführt, sind die Anforderung an die Hardware enorm. Ein normaler Heimrechner würde das nicht schaffen, erst recht nicht in der Geschwindigkeit. Über das SSH-Protokoll - also einer verschlüsselten Verbindung – kann man sich dann mit dem GPU-Server verbinden und beispielsweise Python-Skripte darüber laufen lassen – auch ganz bequem vom Home-Office aus.

Weitere technische Daten zum NVIDIA DGX A100:
•    GPU Memory: 320 GB total (40 GB pro GPU)
•    CUDA® Cores (FP32) 55.296
•    Tensor Cores (TF32) 3.456
•    Interconnect GPUs: NVLink Switch 600GB/s
•    CPU: Dual AMD EPYC 7742 128 cores total, 2.25 GHz (base), 3.4 GHz (max boost)
•    System Memory: 2TB DDR4

Was ist dein Ziel im Projekt BIMKIT?

Phillip: Das Ziel ist unter anderem das automatische Auslesen von Dokumenteninformationen wie beispielsweise die Materialnummer oder das Datum der letzten Prüfung, welche anschließend – ebenfalls automatisiert - in ein BIM-Modell übertragen und zugeordnet werden. Das reduziert den manuellen Arbeitsaufwand und erleichtert das aktive Arbeiten mit 3D-Modellen, durch die Anreicherung diverser Informationen.
Ist die KI erst ausreichend trainiert und erfüllt die Erwartungen mit einer hohen Trefferquote, ist ein Rechner mit derart hoher Rechenleistung nicht mehr von Nöten. Bis wir an dem Punkt angekommen sind, dauert es allerdings noch eine ganze Weile.

 

Nvidia Dgx A100

Forschung am Lehrstuhl Informatik im Bauwesen bedeutet nicht nur neue Herangehensweisen für die Baubranche zu entwickeln, sondern auch den Einsatz von neuen und fortschrittlichen Technologien. Diesmal wird der GPU-Server und die Forschung von Phillip Schönfelder vorgestellt.

Phillip Schönfelder ist seit November letzten Jahres wissenschaftlicher Mitarbeiter am IIB. Im Bachelor hat er Maschinenbau an der PHWT in Diepholz und im Master Computational Engineering an der RUB studiert. Er ist Teil des Projektes „BIMKIT“, in dem es um die Bestandsmodellierung von Gebäuden und Infrastrukturbauwerken mittels KI zur Generierung von Digital Twins geht. Sein Forschungsschwerpunkt sind Machine Learning Methoden, welche sich mit der automatisierten Verarbeitung von Texten beschäftigen. Worum es im Detail geht und was es bedeutet eine KI zu trainieren, erzählt er im Interview.

Womit beschäftigst du dich in deiner Forschung?

Phillip: Momentan beschäftige ich mich mit dem Erarbeiten von KI-Verfahren für die Nutzung im Bauwesen. Dazu kann man bereits trainierte KI nutzen oder neu anlernen, jedoch braucht es dafür eine sehr große Datenmenge. Beispielsweise wäre der gesamte Wikipediakorpus – also alle auf Wikipedia existierenden Beiträge – eine gute Basis.
Eine bereits trainierte KI mit einem gewissen Sprachverständnis kann ich dann zum Beispiel nutzen, um bestimme Schlüsselbegriffe in Texten zu erkennen und diese in vordefinierte Kategorien einzuordnen. Das nennt sich Named Entity Recognition – die Erkennung und Klassifizierung von Schlüsselbegriffen. Das dabei verwendete KI-Modell heißt BERT (Bidirectional Encoder Representations from Transformers) und gehört heute zu den bekanntesten Transformer-Modellen. Zur Feinabstimmung des Modells benutze ich einen speziellen Rechner vom IIB, da allein der vortrainierte Teil des Modells 400 Megabyte groß ist und es sehr viel Rechenleistung erfordert, um es weiter zu trainieren.

Was ist das Besondere an dem Rechner?

Phillip: Der GPU-Server hat durch seine acht verbauten NVIDIA Tesla A100-SXM4-40GB GPUs eine sehr hohe Rechenleistung. Durch die Übersetzung von Wörtern in numerische Vektoren werden die Wörter maschinenlesbar und damit gut zu verarbeiten. Durch die Menge an parallel laufenden Berechnungen, welche die KI ausführt, sind die Anforderung an die Hardware enorm. Ein normaler Heimrechner würde das nicht schaffen, erst recht nicht in der Geschwindigkeit. Über das SSH-Protokoll - also einer verschlüsselten Verbindung – kann man sich dann mit dem GPU-Server verbinden und beispielsweise Python-Skripte darüber laufen lassen – auch ganz bequem vom Home-Office aus.

Weitere technische Daten zum NVIDIA DGX A100:
•    GPU Memory: 320 GB total (40 GB pro GPU)
•    CUDA® Cores (FP32) 55.296
•    Tensor Cores (TF32) 3.456
•    Interconnect GPUs: NVLink Switch 600GB/s
•    CPU: Dual AMD EPYC 7742 128 cores total, 2.25 GHz (base), 3.4 GHz (max boost)
•    System Memory: 2TB DDR4

Was ist dein Ziel im Projekt BIMKIT?

Phillip: Das Ziel ist unter anderem das automatische Auslesen von Dokumenteninformationen wie beispielsweise die Materialnummer oder das Datum der letzten Prüfung, welche anschließend – ebenfalls automatisiert - in ein BIM-Modell übertragen und zugeordnet werden. Das reduziert den manuellen Arbeitsaufwand und erleichtert das aktive Arbeiten mit 3D-Modellen, durch die Anreicherung diverser Informationen.
Ist die KI erst ausreichend trainiert und erfüllt die Erwartungen mit einer hohen Trefferquote, ist ein Rechner mit derart hoher Rechenleistung nicht mehr von Nöten. Bis wir an dem Punkt angekommen sind, dauert es allerdings noch eine ganze Weile.