Zwar wird es aktuell nicht auf einer großen kommerziellen Plattform bereitgestellt, so wie z.B. ChatGPT und ist daher (noch) nicht im Alltag für Jeden nutzbar, aber es ist eine der spannenden Entwicklungen im Kontext KI im letzten Jahr. Wir haben die wichtigsten Informationen zusammengefasst.
Was ist Teuken-7B?
Teuken-7B ist ein sogenanntes „Large Language Model“ (LLM), das gezielt auf europäische Anforderungen ausgerichtet ist. Es ist eines der wenigen KI-Sprachmodelle, das von Grund auf mehrsprachig konzipiert wurde. Dabei wurde offene Datenquellen verwendet, die zu etwa 50 Prozent aus nicht-englischsprachigen Daten bestanden und alle 24 Amtssprachen der EU abdeckten. Dadurch eignet sich das Modell ideal für Anwendungen in der öffentlichen Verwaltung, Forschung und Wirtschaft. Ein Fokus liegt auf Datenschutz und Nachvollziehbarkeit, wodurch es besonders attraktiv für Behörden ist, die rechtliche und sicherheitstechnische Vorgaben einhalten müssen.
Die Entstehung von Teuken-7B
Das Modell wurde auf dem Hochleistungsrechner JUWELS am Forschungszentrum Jülich trainiert. Dabei kamen modernste europäische Technologien zur Anwendung, um effizient mit großen Datenmengen zu arbeiten und die Trainingsprozesse zu optimieren. Teuken-7B ist nicht nur ein Produkt der Fraunhofer-Institute IAIS und IIS, sondern auch das Ergebnis einer engen Zusammenarbeit mit weiteren Partnern wie der TU Dresden, dem Deutschen Forschungszentrum für Künstliche Intelligenz (DFKI), IONOS und Aleph Alpha.
Verfügbare Versionen und Anwendungsfelder
Teuken-7B wird in zwei Varianten bereitgestellt: Eine Version steht für Forschungszwecke zur Verfügung, während eine zweite Version unter der Apache-2.0-Lizenz auch kommerzielle Anwendungen erlaubt. Entwicklern, Behörden und Unternehmen wird das Modell kostenlos über die Plattform Hugging Face bereitgestellt um in eigener Entwicklungsumgebung damit zu arbeiten für eigene Anwendungen zu nutzen.
Europäische Datensouveränität als Leitgedanke
Ein zentraler Vorteil von Teuken-7B ist die Unabhängigkeit von externen „Black-Box“-Systemen. Europäische Datenschutzstandards und Datensouveränität standen bei der Entwicklung im Vordergrund. Dadurch bietet das Modell Unternehmen und Behörden in Europa die Möglichkeit, KI-Technologien vertrauenswürdig und transparent einzusetzen und digital souverän zu handeln.