Einführung Generative KI: Erforschung der vielfältigen Landschaft und Auswirkungen jenseits von ChatGPT

--

Von Dr. Jaber Kakar

Generative Künstliche Intelligenz (KI) verändert unsere Welt, indem sie Maschinen befähigt, verschiedene Formen von Inhalten wie Audio, Code, Bilder, Texte, Simulationen und Videos zu generieren. Zu den prominenten Akteuren auf diesem Gebiet gehört ChatGPT, ein sogenanntes generative pretrainer transformer (Deutsch: generatives vorab trainiertes Transformer-Modell) (GPT), entwickelt von OpenAI. Dieser Artikel untersucht die Landschaft der generativen KI, mit einem Fokus auf ChatGPT, seinen Fähigkeiten und den Auswirkungen auf verschiedene Branchen.

ChatGPT als prominentes Beispiel für generative KI bzw. Large Language Models (LLMs)

Generative KI und ChatGPT

Generative KI, eine Untergruppe des maschinellen Lernens (ML), umfasst Algorithmen wie ChatGPT, die die Fähigkeit haben, neuartige Inhalte zu erstellen. ChatGPT, auf Deutsch vermutlich abgekürzt für “generativer vorab trainierter Transformer”, hat beträchtliche Aufmerksamkeit erlangt, dank seiner Fähigkeit, auf eine Vielzahl von Anfragen (engl. Queries) zu reagieren. Im November 2022 der Öffentlichkeit zugänglich gemacht, hat es sich schnell zu einem Benchmark für KI-Chatbots entwickelt, der Millionen mit seiner Fähigkeit begeistert, Computercode, Essays, Gedichte und sogar Witze zu produzieren. Seitdem sind eine Vielzahl von spezialisierten Chatbots — von OpenAI als GPTs bezeichnet — entstanden. Als Abonnent von ChatGPT Plus ($20/Monat) oder ChatGPT Team ($25 pro Person/Monat) können Sie oder Ihr gesamtes Team GPTs innerhalb der Benutzeroberfläche von ChatGPT durchsuchen, erstellen und verwenden. Nur zahlende Abonnenten haben Zugang zum leistungsfähigsten Modell (ChatGPT-4) im Gegensatz zum kostenlosen Modell (ChatGPT 3.5).

Maschinelles Lernen vs. Künstliche Intelligenz

Um den Begriff KI besser zu verstehen, ist es wesentlich, zwischen künstlicher Intelligenz und maschinellem Lernen zu unterscheiden. KI beinhaltet Maschinen, die menschliche Intelligenz nachahmen, um Aufgaben auszuführen, während maschinelles Lernen eine Untergruppe von KI ist, bei der Modelle aus Datenmustern lernen, ohne explizite menschliche Anweisungen. Vielerorts werden die Begriffe KI und ML als gleichbedeutend angesehen. So nutzen viele Anwendungen klassische ML-Algorithmen/Modelle wie neuronale Netze und verwenden aus verschiedensten Gründen den Begriff KI. Der Anstieg der Übernahme von maschinellem Lernen, wie durch eine Umfrage von McKinsey im Jahr 2022 belegt, unterstreicht das transformative Potenzial von generativen KI-Tools wie ChatGPT.

Evolution von maschinellen Lernmodellen

Von den klassischen statistischen Techniken und der grundlegenden Arbeit von Pionieren wie Alan Turing oder John McCarthy ausgehend, hat sich das maschinelle Lernen erheblich weiterentwickelt. Traditionelle prädiktive Modelle wurden durch generative KI ersetzt, die es Systemen wie ChatGPT ermöglicht, Inhalte auf Abruf zu erstellen, jenseits von bloßer Beobachtung und Klassifikation. Wie bei anderen Technologien wurde auch KI und somit maschinelles Lernen von Rückschlägen begleitet, die sich in der Geschichte der KI (seit den frühen 1950er Jahren) durch zwei sogenannte KI-Winter manifestiert haben. Die neuronale Netzwerkarchitektur auf die generative KI-Systeme wie ChatGPT beruhen, werden in der Literatur als Transformer bezeichnet. Für interessierte Leser, hier der Link zu dem entsprechenden wissenschaftlichen Papier von Google Research zu diesen Thema.

Arten von ML-Modellen

Maschinelles Lernen umfasst verschiedene Modelle, die unterschiedliche Zwecke erfüllen. Das Verständnis der Arten von maschinellen Lernmodellen ist wichtig, um bestehende KI-Anwendungen zu differenzieren. Auf der einen Seite gibt es die klassische Kategorisierung von ML-Modellen in die Kategorien (a) überwacht, (b) unüberwacht und (c) verstärkend.

(a) Überwachtes Lernen (engl. Supervised Learning):

Beim überwachten Lernen werden Modelle basierend auf einem gelabelten Datensatz “trainiert”, um die Zuordnung von Eingabedaten zu Ausgabe zu erlernen. Beispiele sind:

  • Spam-Erkennung: Ein Modell, das eine E-Mail basierend auf einem Datensatz von gelabelten E-Mails (d.h., als Spam oder kein Spam gelabelt) klassifiziert.
  • Prognose von Hauspreisen: Ein Modell, das Hauspreise basierend auf Eingaben wie durchschnittliche Anzahl der Zimmer, Kriminalitätsrate, etc. vorhersagen kann (vgl. Vorhersage der Hauspreise in Boston auf Kaggle).

(b) Unüberwachtes Lernen (engl. Unsupervised Learning):

Unüberwachte Lernmodelle werden mit ungelabelten Daten trainiert, um verborgene Muster oder Strukturen in einem Datensatz zu entdecken. Unternehmen könnten beispielsweise ihre Kunden anhand ihres Kaufverhaltens segmentieren wollen. Diese Art der Gruppierung wird als Clustering bezeichnet, und bekannte Algorithmen umfassen unter anderem k-Means.

(c) Verstärkendes Lernen (engl. Reinforcement Learning [RL]):

Beim verstärkenden Lernen interagiert ein Agent mit seiner Umgebung und lernt, Entscheidungen zu treffen, indem er Rückmeldungen in Form von Belohnungen (engl. Rewards) oder Strafen (engl. Penalties) erhält. Das Ziel des Agenten ist es, die kumulierten (kumuliert in diesem Zusammenhang bedeutet, die über die Zeit summierten, gewichteten Rewards) Belohnungen im Laufe der Zeit zu maximieren. Ein Beispiel für RL ist das Computerprogramm AlphaGo von Google DeepMind, das Lee Sedol im chinesischen Spiel Go besiegte. Für Interessierte ist der entsprechende Dokumentarfilm mit dem Titel AlphaGo auch auf YouTube verfügbar.

Abbildung eines vollständiges 19x19 Go-Brett. Im Vergleich dazu hat das Schachbrett “nur” die Dimension 8x8.

Generative KI im Kontext von ChatGPT und großen Sprachmodellen

Wenn wir uns in das Gebiet der generativen KI begeben, wie bei ChatGPT und anderen großen Sprachmodellen (engl. Large Language Models [LLMs]), ist es entscheidend, eine zusätzliche Dimension zu berücksichtigen. Diese Modelle zeigen eine generative Fähigkeit, die es ihnen nicht nur ermöglicht zu klassifizieren oder vorherzusagen, sondern auch neuen Inhalt zu erstellen. Im Gegensatz zu traditionellen ML-Modellen, die hauptsächlich in überwachtem, unüberwachtem oder verstärkendem Lernen fallen, gehen generative Modelle wie ChatGPT darüber hinaus, indem sie verschiedene Arten von Inhalten, einschließlich Text und Code, generieren.

Der generative Aspekt bringt ein kreatives Element in die Landschaft des maschinellen Lernens ein, das diesen Modellen ermöglicht, Antworten, Geschichten und Lösungen auf eine neue und menschenähnliche Weise zu produzieren. Dieses einzigartige Merkmal erweitert die Anwendungen und macht generative Modelle zu einem leistungsstarken Werkzeug für die Erstellung von Inhalten, Problemlösungen und interaktiven User Experiences. Bei der Erkundung der Fähigkeiten der generativen KI wird deutlich, dass dieser Aspekt eine Ebene von Komplexität und Innovation zu den traditionellen Paradigmen des maschinellen Lernens hinzufügt.

Textbasierte maschinelle Lernmodelle

Textbasierte maschinelle Lernmodelle, einschließlich Vorgänger wie GPT-3 und BERT, ebneten den Weg für ChatGPT. Diese Modelle wechselten von überwachtem Lernen, bei dem Menschen Daten für die Klassifizierung beschrifteten, zu selbstüberwachtem Lernen, bei dem Modelle aufgrund von riesigen Mengen Textdaten Ergebnisse vorhersagen. Der Erfolg von ChatGPT liegt in seiner Fähigkeit, kohärente Antworten vorherzusagen und zu generieren, was Fortschritte im textbasierten maschinellen Lernen zeigt.

Entwicklung von generativen KI-Modellen

Die Entwicklung eines generativen KI-Modells ist eine rechenintensive Aufgabe, die oft nur von Tech-Giganten wie OpenAI realisiert werden können. Der Prozess erfordert erhebliche Ressourcen, sowohl in Bezug auf Human Capital als auch Kosten. Die Trainieren von Modellen wie GPT-3 auf massiven Mengen Textdaten, die auf etwa 45 Terabyte geschätzt werden, erfordert erhebliche finanzielle Investitionen und Rechenleistung, was den Zugang für kleinere Unternehmen beschränkt. Im Folgenden finden Sie eine Tabelle, die einige der bestehenden großen Sprachmodelle (LLMs) vergleicht (GPT-4 vs. Bard vs. LlaMa vs. Flan-UL2 vs. BLOOM). Für weitere Details zu einem umfassenderen Vergleich von Open-Source-LLMs bieten sich unter anderem der folgende Beitrag an.

Tabellarischer Vergleich von LLMs

Fähigkeiten und Output von generativer KI

Generative KI-Modelle, wie z.B. ChatGPT, zeigen eine Vielzahl von Fähigkeiten. Von der Generierung hochwertiger Texte in Sekunden bis hin zur Erstellung von Kunst, Code, Video, Audio und Geschäftssimulationen tragen diese Modelle zu verschiedenen Branchen bei. Allerdings können diese Modelle “Halluzinationen” erleben, imaginative, aber ungenaue oder unangemessene Ausgaben generieren, was Herausforderungen bei der Bewältigung von Voreingenommenheit und der Sicherstellung ethischer Nutzung darstellt.

Anwendungen und Grenzen

Generative KI-Tools bieten Unterhaltungswert und praktische Anwendungen in verschiedenen Branchen. Vom Generieren von Code für IT-Unternehmen bis zum Verfassen von Marketingtexten ist das Potenzial für Unternehmen enorm. Allerdings resultieren dadurch auch inhärente Risiken, wie voreingenommene und ungenaue Ausgaben. Diese Risiken gilt es zu vermeiden bzw. wenn nicht anders möglich zu reduzieren. Risikominderungsstrategien umfassen u.a. die sorgfältige Auswahl von Trainingsdaten, den Einsatz spezialisierter Modelle und die Einbindung von Menschen in Entscheidungen von wichtiger Tragweite. Vor kurzem hat die Europäische Union einen bedeutenden Schritt in diese Richtung unternommen, indem sie das EU-KI-Act eingeführt hat. Diese Gesetzgebung zielt darauf ab, die Entwicklung und Nutzung von KI in angemessener Weise zu regulieren, unter Berücksichtigung der Risiken, die KI-Systeme darstellen können. Weitere Informationen zum EU-KI-Gesetz finden Sie in unserem vorherigen Beitrag.

Ausblick

Da davon auszugehen ist, dass generative KI zunehmend integraler Bestandteil von Wirtschaft und Gesellschaft wird, ist damit einhergehend eine neue regulatorische Landschaft zu erwarten. Führungskräfte müssen wachsam bleiben hinsichtlich sich entwickelnder Risiken und Chancen in diesem dynamischen Bereich. Mit laufender Wertschöpfung wird die Auswirkung von generativer KI in den kommenden Jahren sichtbar werden. Lesen Sie mehr über die Zukunft der generativen KI in einem kürzlich erschienenen Artikel von McKinsey & Company.

Fazit

Generative KI hat sich als eine mächtiges Instrument in der Content-Generierung erwiesen und bietet weitere vielversprechende Möglichkeiten. Während ihr Potenzial immens ist, ist die verantwortungsbewusste und ethische Implementierung von generativer KI entscheidend. Wenn Unternehmen die kreativen Fähigkeiten dieser Tools erkunden, wird ein Gleichgewicht zwischen Innovation und Risikomanagement die Zukunft der generativen KI prägen.

Vielen Dank für das Lesen des Blogartikels! Wenn Sie mehr über Sicherheit, Risiko und Compliance erfahren möchten, besuchen Sie unsere Website oder kontaktieren Sie uns über unsere sozialen Medien.

--

--

SRC - Security, Risk, Compliance
SRC - Security, Risk, Compliance

Written by SRC - Security, Risk, Compliance

Beratung, um Security, Risk und Compliance bei Ihnen als Enabler für das Business zu etablieren.

No responses yet