Michael Chen | Content Strategist | 6. Dezember 2023
In der breiten Öffentlichkeit wird KI oftmals schlecht dargestellt. In Filmen wird sie als erster Schritt auf dem Weg zu einer Roboter-Apokalypse präsentiert, während die Nachrichten voll von Berichten darüber sind, wie KI uns alle unsere Jobs wegnehmen wird. Die Wahrheit ist, dass KI schon seit einiger Zeit existiert und keines dieser Worst-Case-Szenarien wahrscheinlich unmittelbar bevorsteht.
Grundsätzlich verwendet KI Daten, um Vorhersagen zu treffen. So können beispielsweise „Ähnliche Inhalte“ bei Streaming-Diensten angezeigt werden. Diese Technologie steckt aber auch hinter Chatbots, die in der Lage sind, natürlichsprachliche Anfragen zu verstehen und die richtige Antwort vorherzusagen, sowie hinter Anwendungen, die ein Foto betrachten und mithilfe der Gesichtserkennung vorschlagen, wer auf dem Bild zu sehen ist. Um zu diesen Vorhersagen zu gelangen, ist jedoch ein effektives Training des KI-Modells erforderlich, und neuere Anwendungen, die auf KI basieren, erfordern möglicherweise etwas andere Lernansätze.
Im Grunde genommen besteht ein KI-Modell sowohl aus einer Reihe ausgewählter Algorithmen als auch aus den Daten, die zum Trainieren dieser Algorithmen verwendet werden, damit sie möglichst genaue Vorhersagen treffen können. In einigen Fällen verwendet ein einfaches Modell nur einen einzigen Algorithmus, sodass sich die beiden Begriffe überschneiden können, aber das Modell selbst ist das Ergebnis nach dem Training.
Mathematisch gesehen kann ein Algorithmus als eine Gleichung mit unbestimmten Koeffizienten betrachtet werden. Das Modell wird erstellt, wenn die ausgewählten Algorithmen Datensätze verarbeiten, um zu bestimmen, welche Koeffizientenwerte am besten passen, und so ein Modell für Vorhersagen erstellen. Der Begriff „KI-Modelltraining“ bezieht sich auf diesen Prozess: Füttern des Algorithmus mit Daten, Untersuchen der Ergebnisse und Optimieren der Modellausgabe, um die Genauigkeit und Effizienz zu erhöhen. Dazu benötigen Algorithmen riesige Datenmengen, die das gesamte Spektrum der eingehenden Daten erfassen.
Ausreißer, Überraschungen, Unstimmigkeiten, Muster, die auf den ersten Blick keinen Sinn ergeben ... Algorithmen müssen mit all diesen und weiteren Problemen umgehen, und zwar wiederholt, und zwar bei allen eingehenden Datensätzen. Dieser Prozess ist die Grundlage des Lernens – die Fähigkeit, Muster zu erkennen, Zusammenhänge zu verstehen und angemessene Entscheidungen zu treffen. Bei ausreichendem Training des KI-Modells stellen die Algorithmen innerhalb des Modells einen mathematischen Prädiktor für eine bestimmte Situation dar, der Toleranzen für das Unerwartete einbaut und gleichzeitig die Vorhersehbarkeit maximiert.
Wichtige Erkenntnisse
Das Training von KI-Modellen ist ein iterativer Prozess, dessen Erfolg von der Qualität und Tiefe des Inputs sowie von der Fähigkeit der Trainer abhängt, Mängel zu erkennen und auszugleichen. In der Regel kümmern sich Data Scientists um den Trainingsprozess, obwohl in einigen Low-Code-/No-Code-Umgebungen auch Geschäftsnutzer einbezogen werden können. Tatsächlich ähnelt der Zyklus aus Verarbeitung, Beobachtung, Feedback und Verbesserung dem Unterrichten eines Kindes in einer neuen Fähigkeit. Beim Training von KI-Modellen besteht das Ziel darin, ein mathematisches Modell zu erstellen, das präzise Ergebnisse liefert und gleichzeitig die vielen verschiedenen möglichen Variablen, Ausreißer und Komplikationen in den Daten ausgleicht. Wenn man darüber nachdenkt, bietet die Elternschaft eine ähnliche – aber viel chaotischere – Reise.
Denken Sie nur daran, wie Kinder eine Fertigkeit erlernen. Nehmen wir zum Beispiel an, Sie möchten einem Kleinkind beibringen, den Unterschied zwischen Hunden und Katzen zu erkennen. Zunächst einmal mit einfachen Bildern und Zuspruch. Dann werden weitere Variablen eingeführt, mit Details wie durchschnittliche Größe, „Bellen“ oder „Miauen“ und Verhaltensmuster. Je nachdem, womit das Kind Schwierigkeiten hat, können Sie einem bestimmten Bereich mehr Aufmerksamkeit widmen, um das Lernen zu erleichtern. Am Ende dieses Prozesses sollte das Kleinkind in der Lage sein, alle Arten von Hunden und Katzen zu identifizieren, von gewöhnlichen Haustieren bis hin zu Wildtieren.
Beim Training eines KI-Modells ist es ähnlich.
KI: Algorithmen auswählen und ersten Trainingsdatensatz für das Modell festlegen.
Kind: Mit einfachen Fotos die allgemeinen Unterschiede zwischen einem Hund und einer Katze verdeutlichen.
KI: Ausgabegenauigkeit bewerten und das Modell anpassen, um bestimmte Ungenauigkeiten zu reduzieren oder zu beseitigen.
Kind: Je nach Antwort Lob oder Korrekturen aussprechen.
KI: Zusätzliche Datensätze mit spezifischen, unterschiedlichen Eingaben bereitstellen, um das Modell anzupassen und zu optimieren.
Kind: Im Rahmen des Lernprozesses verschiedene Merkmale, Formen und Größen hervorheben.
Wie bei Kindern kann das anfängliche Training des KI-Modells einen großen Einfluss darauf haben, was später passiert – und ob weitere Lektionen erforderlich sind, um schlechte Einflüsse zu verlernen. Das unterstreicht die Bedeutung hochwertiger Datenquellen sowohl für die Erstausbildung als auch für das kontinuierliche iterative Lernen auch nach der Einführung des Modells.
Die meisten Organisationen profitieren bereits von KI in ihren Arbeitsabläufen und Prozessen, dank Anwendungen, die Analysen erstellen, Datenausreißer hervorheben oder Texterkennung und natürliche Sprachverarbeitung nutzen. Denken Sie zum Beispiel an das Übertragen von Papierbelegen und Dokumenten in Datensätze. Viele Organisationen sind jedoch bestrebt, KI-Modelle zu entwickeln, um einem bestimmten, dringenden Bedarf gerecht zu werden. Der Entwicklungsprozess selbst kann tiefere Nutzenebenen erschließen, von kurzfristigem Nutzen wie beschleunigten Prozessen bis hin zu langfristigem Gewinn wie der Aufdeckung zuvor verborgener Erkenntnisse oder vielleicht sogar der Einführung eines neuen Produkts oder einer neuen Dienstleistung.
Ein Hauptgrund für Investitionen in eine Infrastruktur, die KI unterstützt, liegt in der Art und Weise, wie Unternehmen wachsen. Einfach ausgedrückt: Daten sind überall. Da so viele Daten aus allen Richtungen eingehen, können neue Erkenntnisse für nahezu jeden Teil einer Organisation gewonnen werden, einschließlich interner Abläufe und der Leistung von Vertriebs- und Marketingteams. Vor diesem Hintergrund kann KI durch eine angemessene Schulung und durchdachte Anwendung in nahezu jeder Situation einen geschäftlichen Mehrwert bieten.
Um zu überlegen, wie eine Organisation KI für maximalen Nutzen trainieren könnte, ist der erste Schritt, die Eingaben zu identifizieren und zu ermitteln, was in eine solide Entscheidung einfließt. Nehmen wir zum Beispiel eine Fertigungslieferkette. Sobald einem entsprechend geschulten KI-System alle relevanten Daten zur Verfügung stehen, kann es Versandkosten berechnen, Versandzeiten und Qualitäts-/Fehlerquoten vorhersagen, Preisänderungen auf der Grundlage von Marktbedingungen empfehlen und viele weitere Aufgaben ausführen. Die Kombination aus großen eingehenden Datenmengen und der Notwendigkeit datengestützter Entscheidungen macht Lieferketten reif für die Problemlösung durch KI. Im Gegensatz dazu kann KI in Fällen, in denen Soft Skills weiterhin oberste Priorität haben, unterstützende Informationen liefern, wird aber wahrscheinlich keine revolutionäre Veränderung bewirken. Ein Beispiel ist die Beurteilung der Leistung von Mitarbeitern durch einen Vorgesetzten im Rahmen von jährlichen Beurteilungen. In diesem Fall könnte KI die Erfassung von Kennzahlen erleichtern, aber sie kann die auf der Interaktion von Mensch zu Mensch basierenden Bewertungen nicht ersetzen.
Um das Beste aus einer KI-Investition herauszuholen, müssen Organisationen Folgendes berücksichtigen:
Durch die Festlegung dieser Parameter können Organisationen die Geschäftsbereiche identifizieren, die am ehesten von KI profitieren, und dann Schritte unternehmen, um diese in die Tat umzusetzen.
Jedes Projekt bringt zwar seine eigenen Herausforderungen und Anforderungen mit sich, der allgemeine Prozess für die Schulung von KI-Modellen bleibt jedoch derselbe.
Die folgenden fünf Schritte bieten einen Überblick über das Training eines KI-Modells.
Daten vorbereiten: Ein erfolgreiches KI-Modelltraining beginnt mit hochwertigen Daten, die reale und authentische Situationen genau und konsistent darstellen. Ohne sie sind die Ergebnisse bedeutungslos. Um erfolgreich zu sein, müssen Projektteams die richtigen Datenquellen kuratieren, Prozesse und Infrastrukturen für die manuelle und automatisierte Datenerfassung aufbauen und geeignete Bereinigungs-/Transformationsprozesse einführen.
Trainingsmodell auswählen: Wenn die Datenaufbereitung die Grundlage für das Projekt bildet, bildet die Modellauswahl den Mechanismus. Zu den Variablen für diese Entscheidung gehören die Definition von Projektparametern und -zielen, die Wahl der Architektur und die Auswahl von Modellalgorithmen. Da unterschiedliche Schulungsmodelle unterschiedliche Ressourcen erfordern, müssen diese Faktoren gegen praktische Elemente wie Rechenanforderungen, Fristen, Kosten und Komplexität abgewogen werden.
Erstes Training durchführen: Genau wie im obigen Beispiel, in dem einem Kind beigebracht wird, eine Katze von einem Hund zu unterscheiden, beginnt das Training des KI-Modells mit den Grundlagen. Die Verwendung eines zu breiten Datensatzes, eines zu komplexen Algorithmus oder des falschen Modelltypus könnte zu einem System führen, das lediglich Daten verarbeitet, anstatt zu lernen und sich zu verbessern. Während der ersten Schulung sollten sich Data Scientists darauf konzentrieren, Ergebnisse innerhalb der erwarteten Parameter zu erzielen und dabei auf Fehler zu achten, die den Algorithmus außer Kraft setzen. Durch Training im richtigen Umfang können Modelle methodisch in stetigen, sicheren Schritten verbessert werden.
Training validieren: Sobald das Modell die erste Trainingsphase durchlaufen hat, liefert es zuverlässig die erwarteten Ergebnisse in Bezug auf die wichtigsten Kriterien. Die Validierung des Trainings stellt die nächste Phase dar. Hier machen sich Experten daran, das Modell angemessen zu hinterfragen, um Probleme, Überraschungen oder Lücken im Algorithmus aufzudecken. In dieser Phase wird eine separate Gruppe von Datensätzen aus der Anfangsphase verwendet, die im Allgemeinen eine größere Breite und Komplexität im Vergleich zu den Trainingsdatensätzen aufweisen.
Bei der Analyse dieser Datensätze durch Data Scientists wird die Leistung des Modells bewertet. Die Genauigkeit der Ergebnisse ist zwar wichtig, aber der Prozess selbst ist genauso entscheidend. Zu den wichtigsten Prioritäten des Prozesses gehören Variablen wie Präzision, der Prozentsatz genauer Vorhersagen und Recall, der Prozentsatz korrekter Klassenidentifizierung. In manchen Fällen können die Ergebnisse mit einem metrischen Wert beurteilt werden. Ein F1-Score ist beispielsweise eine Metrik, die Klassifizierungsmodellen zugewiesen wird, die die Gewichtung verschiedener Arten von falsch-positiven/falsch-negativen Ergebnissen berücksichtigen und so eine ganzheitlichere Interpretation des Erfolgs des Modells ermöglichen.
Modell testen: Sobald das Modell anhand kuratierter und zweckmäßiger Datensätze validiert wurde, können Live-Daten verwendet werden, um die Leistung und Genauigkeit zu testen. Die Datensätze für diese Phase sollten aus realen Szenarien stammen, ein sprichwörtlicher Schritt, bei dem die Stützräder abgenommen werden, damit das Modell selbstständig fliegen kann. Wenn das Modell mit Testdaten genaue und vor allem erwartete Ergebnisse liefert, kann es live geschaltet werden. Wenn das Modell in irgendeiner Weise Mängel aufweist, wird der Schulungsprozess wiederholt, bis das Modell die Leistungsstandards erfüllt oder übertrifft.
Die Inbetriebnahme ist zwar ein bedeutender Meilenstein, doch bedeutet das Erreichen dieser Phase nicht das Ende der Schulung des Modells. Je nach Modell kann jeder verarbeitete Datensatz eine weitere „Lektion“ für die KI sein, was zu einer weiteren Verbesserung und Verfeinerung des Algorithmus führt. Data Scientists müssen weiterhin die Leistung und Ergebnisse überwachen, insbesondere wenn das Modell mit unerwarteten Ausreißer-Daten arbeitet. Sollten ungenaue Ergebnisse auftreten, und sei es auch nur in seltenen Fällen, muss das Modell möglicherweise weiter angepasst werden, um die zukünftigen Ergebnisse nicht zu verfälschen.
KI-Training gibt es in vielen verschiedenen Formen, die sich in Komplexität, Art der Ergebnisse, Fähigkeiten und Rechenleistung unterscheiden. Eine Methode kann mehr Ressourcen als nötig verbrauchen, während in anderen Fällen eine Methode eine binäre Antwort liefern kann, wie z. B. ein Ja oder Nein für eine Darlehensgenehmigung, wenn die Situation ein qualitativ besseres Ergebnis erfordert, wie z. B. ein bedingtes „Nein“, bis weitere Unterlagen vorgelegt werden.
Bei der Wahl der für ein KI-Modell verwendeten Methode müssen sowohl Ziele als auch Ressourcen berücksichtigt werden. Wenn man ohne sorgfältige Planung voranschreitet, kann es sein, dass die Data-Science-Teams von vorne anfangen müssen, was Zeit und Geld verschwendet.
Während einige KI-Modelle Regeln und Eingaben verwenden, um Entscheidungen zu treffen, bieten tiefe neuronale Netze die Möglichkeit, komplexe Entscheidungen auf der Grundlage unterschiedlicher Datenbeziehungen zu treffen. Tiefe neuronale Netze arbeiten mit zahlreichen Schichten, die Muster und gewichtete Beziehungen zwischen Datenpunkten identifizieren, um Vorhersagen zu treffen oder fundierte Bewertungen abzugeben. Beispiele für tiefe neuronale Netze sind sprachgesteuerte Assistenten wie Apples Siri oder Amazons Alexa.
In der Statistik wird die lineare Regression verwendet, um die Beziehung zwischen Input und Output zu bestimmen. In ihrer einfachsten Form kann dies durch die algebraische Formel y = Ax + B dargestellt werden. Dieses Modell verwendet einen Datensatz, um diese Formel basierend auf Eingabe, Ausgabe und möglichen variablen Koeffizienten zu erstellen. Das endgültige Modell, das für die Vorhersage verwendet wird, geht von einer linearen Beziehung zwischen Eingabe und Ausgabe aus. Ein Beispiel für die Anwendung der linearen Regression ist eine Umsatzprognose auf der Grundlage früherer Umsatzdaten.
Die logistische Regression stammt aus dem Bereich der Statistik und ist ein effektives Modell für binäre Situationen. Die logistische Regression basiert auf der logistischen Funktion, einer S-Kurven-Gleichung, die häufig zur Berechnung von Wahrscheinlichkeiten verwendet wird. Bei der KI-Modellierung bestimmt die logistische Regression die Wahrscheinlichkeit und liefert ein binäres Ergebnis, um letztendlich Vorhersagen zu treffen oder zu entscheiden, ob beispielsweise ein Antragsteller für einen Kredit zugelassen werden sollte. Ein Beispiel für die Anwendung der logistischen Regression ist eine Finanzanwendung zur Betrugserkennung.
Die meisten Menschen haben Erfahrung mit Entscheidungsbäumen, auch außerhalb der KI. Entscheidungsbäume funktionieren ähnlich wie Knoten in Flussdiagrammen. Beim maschinellen Lernen füttern die Trainingsprozesse den Baum mit iterativen Daten, um zu ermitteln, wann Knoten hinzugefügt werden müssen und wohin die verschiedenen Knotenpfade gesendet werden müssen. Ein Beispiel für die Verwendung von Entscheidungsbäumen ist die Genehmigung eines Finanzkredits.
Entscheidungsbäume können durch eine zu große Tiefe für ihre Trainingssätze überanstrengt werden. Die Random-Forest-Technik gleicht dies aus, indem sie eine Gruppe von Entscheidungsbäumen – daher der Begriff „Forest“ – kombiniert und den größten Konsens oder einen gewichteten Durchschnitt der Ergebnisse ermittelt. Ein Beispiel für die Anwendung eines Random Forest ist die Vorhersage des Kundenverhaltens auf der Grundlage einer Vielzahl von Entscheidungsbäumen über verschiedene Elemente des Kundenprofils hinweg.
In Bezug auf die Kindererziehung entspricht das überwachte Lernen dem Durchlaufen eines festgelegten Lehrplans mit methodischen Lektionen. Für die KI-Modellierung bedeutet dies, dass etablierte Trainingsdatensätze und definierte Parameter verwendet werden, um das Modell zu trainieren, wobei Data Scientists als die sprichwörtlichen Lehrer fungieren, indem sie Trainingsdatensätze kuratieren, Testdatensätze ausführen und Modellfeedback geben. Ein Anwendungsfall für überwachtes Lernen ist das Auffinden abnormaler Zellen in Lungenröntgenaufnahmen. Der Trainingsdatensatz besteht aus Röntgenbildern mit und ohne Auffälligkeiten, wobei dem Modell mitgeteilt wird, welches Bild welches ist.
Um bei der Analogie zur Kindererziehung zu bleiben: Unüberwachtes Lernen ähnelt der Montessori-Philosophie, bei der Kindern eine Reihe von Möglichkeiten und die Freiheit zur Selbstbestimmung auf der Grundlage ihrer Neugier geboten wird. Für die KI-Modellierung bedeutet das, dass ein unmarkierter Datensatz ohne Parameter oder Ziele aufgenommen wird – es ist Aufgabe der KI, Muster in den Daten zu erkennen. Ein Beispiel für einen Anwendungsfall für unüberwachtes Lernen ist ein Einzelhändler, der ein KI-Modell mit vierteljährlichen Verkaufsdaten füttert, um Korrelationen im Kundenverhalten zu finden.
Wenn Sie jemals gewünschtes Verhalten mit Belohnungen verstärkt haben, haben Sie bereits Erfahrung mit bestärkendem Lernen. Auf der Ebene der künstlichen Intelligenz beginnt das bestärkende Lernen mit experimentellen Entscheidungen, die zu positiver oder negativer Verstärkung führen. Mit der Zeit lernt die KI die besten Entscheidungen, d. h. die genauesten oder erfolgreichsten, um eine Situation zu bewältigen und die positive Verstärkung zu maximieren. Ein Beispiel für den Einsatz von bestärkendem Lernen ist die Liste mit Vorschlägen, die YouTube basierend auf dem Wiedergabeverlauf anzeigt und die mit „Das könnte dir auch gefallen“ überschrieben ist.
Ein KI-Modell kann erfolgreich sein, wenn es auf eine andere Situation angewendet wird. Transferlernen bezieht sich auf die Methode, ein bestehendes KI-Modell als Ausgangspunkt für ein neues Modell zu verwenden. Diese Umnutzung funktioniert am besten, wenn das vorhandene Modell ein allgemeines Szenario abdeckt. Alles, was zu spezifisch ist, kann sich als zu schwierig für eine Umschulung erweisen. Ein Beispiel für die Anwendung von Transferlernen ist ein neues KI-Modell für eine bestimmte Art der Bildklassifizierung, das auf Parametern eines bestehenden Bildklassifizierungsmodells basiert.
Das halbüberwachte Lernen, das sowohl auf den Prinzipien des überwachten als auch des unüberwachten Lernens basiert, beginnt mit dem Training des Modells anhand einer kleinen Gruppe gekennzeichneter Datensätze. Von dort aus verwendet das Modell unbeschriftete und unkuratierte Datensätze, um Muster zu verfeinern und unerwartete Erkenntnisse zu gewinnen. Im Allgemeinen werden beim halbüberwachten Lernen in den ersten Schritten nur gekennzeichnete Datensätze verwendet, wie Stützräder. Danach stützt sich der Prozess stark auf nicht gekennzeichnete Daten. Ein Beispiel für einen Anwendungsfall für halbüberwachtes Lernen ist ein Modell zur Textklassifizierung, das einen kuratierten Satz verwendet, um grundlegende Parameter festzulegen, bevor große Mengen unüberwachter Textdokumente eingespeist werden.
Generative Modelle sind eine unüberwachte KI-Methode, die sehr große Beispieldatensätze verwendet, um eine angeforderte Ausgabe zu erstellen. Beispiele hierfür sind KI-generierte Bilder, die auf den Metadaten eines Bildarchivs basieren, oder die automatische Worterkennung, die auf einer Datenbank mit getippten Sätzen basiert. Anstatt Daten in ihrer Ausgabe einfach zu klassifizieren, können Ergebnisse aus generativen Modellen Tausende, möglicherweise Millionen von Beispieldaten verwenden, um daraus zu lernen und eine Originalausgabe zu erstellen. Ein Beispiel für die Anwendung eines generativen Modells ist ein Chatbot wie ChatGPT.
Damit ein KI-Modell richtig trainiert werden kann, benötigt es Daten – und zwar viele Daten. Daten sind das wichtigste Element beim Training von KI-Modellen. Ohne sie kann das Modell einfach nicht lernen. Und ohne hochwertige Daten lernt das Modell die falschen Dinge. Daher wählen Data Scientists Datensätze für ihre Projekte mit Bedacht und Sorgfalt aus.
Die Kuratierung von Datensätzen muss die folgenden Faktoren für ein optimales Training des KI-Modells beinhalten:
Das KI-Modelltraining umfasst seine eigenen einzigartigen Herausforderungen. Einige davon sind logistischer Natur – Infrastruktur, Rechenleistung und andere praktische Überlegungen, um ans Ziel zu gelangen. Andere Herausforderungen erfordern eine Selbstreflexion seitens der Data Scientists, wie z. B. die Entwicklung eines Verständnisses dafür, wie Vorurteile abgebaut und das resultierende System objektiv gehalten werden kann.
Die folgenden Herausforderungen sollten bei jeder Initiative zum Training von KI-Modellen berücksichtigt werden:
Datenverzerrung: Um genaue Ergebnisse von einem KI-Modell zu erhalten, sind für das Training hochwertige Daten erforderlich. Um Datenverzerrungen zu minimieren, müssen Data Scientists die Datenquellen gründlich prüfen, bevor sie Trainingsdatensätze erstellen.
Die richtigen Daten: Für die Erstellung von Trainingsdatensätzen sind große Datenmengen erforderlich, die eine angemessene Vielfalt und Granularität aufweisen. Dabei sollten die Teams nicht nur große Mengen hochwertiger Daten kuratieren, sondern es kommen auch viele praktische Überlegungen ins Spiel. Die Speicherung, Bereinigung/Umwandlung, Verarbeitung und allgemeine Qualitätskontrolle werden mit zunehmender Größe eines Datensatzes immer schwieriger.
Anforderungen an Rechenleistung und Infrastruktur: Je komplexer das KI-Modell, desto mehr Rechenleistung und Infrastrukturunterstützung sind erforderlich. Bei der Auswahl der Modellmethode muss die praktische Anwendbarkeit des Modells von der Schulung bis zur Inbetriebnahme berücksichtigt werden. Wenn ein Modelltyp mehr Ressourcen erfordert, als realistischerweise bereitgestellt werden können, scheitert das gesamte Projekt.
Überanpassung: Wenn ein KI-Modell zu stark auf die Trainingsdatensätze abgestimmt wird, kann es sich auf diese Besonderheiten fixieren, anstatt in der Lage zu sein, mit Vielfalt und Überraschungen umzugehen. Dieses Phänomen ist als „Überanpassung“ bekannt und verhindert genaue Vorhersagen in der Zukunft. Ein Beispiel für eine Überanpassung ist, wenn der Trainingsdatensatz eine Genauigkeit von 99 % aufweist, ein realer Datensatz jedoch nur eine Genauigkeit von 75 % bis 85 %. Beachten Sie, dass sich die wahrgenommene Genauigkeit bei KI darauf bezieht, wie gut ein System in Bezug auf die Genauigkeit auf der Grundlage seiner aktuellen Fähigkeiten zu funktionieren scheint. Es ist die Genauigkeit, die von Benutzern oder Interessengruppen beobachtet oder erfahren wird. Andererseits bezieht sich die potenzielle Genauigkeit der KI auf das maximale Genauigkeitsniveau, das ein System unter idealen Bedingungen und mit optimalen Ressourcen erreichen könnte. Es ist wichtig, den Unterschied zwischen wahrgenommener und potenzieller Genauigkeit zu verstehen, um die Leistung eines KI-Systems zu bewerten und Bereiche für Verbesserungen oder zukünftige Entwicklungen zu identifizieren.
Die Begriffe „Überanpassung“ und „Übertraining“ werden oft synonym verwendet, haben aber unterschiedliche Bedeutungen. Von einer Überanpassung spricht man, wenn die KI mit ihren Trainingsdaten extrem gut abschneidet, aber nicht in der Lage ist, neue Daten gut zu verallgemeinern. Von Übertraining spricht man, wenn ein Modell übermäßig trainiert wurde, was zu einer schlechten Leistung sowohl bei den Trainingsdaten als auch bei den neuen Daten führt. Übertraining kann auftreten, wenn ein Modell zu lange oder mit zu hoher Komplexität trainiert wird, was dazu führt, dass es Schwierigkeiten hat, zu verallgemeinern. Beide Probleme müssen im Modell-Trainingsprozess vermieden werden.
Nachvollziehbarkeit: Ein großes Problem bei der KI-Modellierung ist die mangelnde Nachvollziehbarkeit der Entscheidungsfindung. Benutzer können auf der Grundlage der Ergebnisse Schlussfolgerungen ziehen, aber die Gründe des Modells bleiben möglicherweise unklar. Einige Entwickler haben Tools erstellt, um diese Lücke zu schließen, darunter Modelle, die für eine transparentere Erklärbarkeit entwickelt wurden. Die Umsetzung, Benutzerfreundlichkeit, Detailgenauigkeit und Zugänglichkeit variieren jedoch sowohl bei der Eingabe als auch bei der Ausgabe.
Obwohl es KI in irgendeiner Form schon seit den Anfängen der Datenverarbeitung gibt, haben Fortschritte bei Algorithmen, CPU-Leistung und GPU-Leistung (Grafikprozessor) sowie der cloudbasierte Austausch von Ressourcen die KI in den letzten zwei Jahrzehnten erheblich vorangebracht. KI ist in so viele Anwendungen eingebettet, dass viele Benutzer sie verwenden, ohne es zu merken. Wenn Sie Musik streamen, werden benutzerdefinierte Wiedergabelisten von einer KI erstellt, die Ihre Lieblingssongs und -künstler analysiert. Wenn Sie eine Textnachricht schreiben, bietet eine KI auf der Grundlage Ihrer häufig verwendeten Wörter Vorschläge an. Wenn Sie dank einer automatischen Empfehlung eine neue Fernsehsendung gefunden haben, die Ihnen gefällt, dann bedanken Sie sich bei der KI.
Das ist der aktuelle Stand der KI, aber was liegt hinter dem Horizont?
Das Potenzial von KI hängt von den sich weiterentwickelnden Fähigkeiten des Modelltrainings ab. Werfen wir einen Blick auf zukünftige Möglichkeiten im KI-Modelltraining.
Wenn es so aussieht, als hätten sich die Innovationen der KI exponentiell entwickelt, gibt es dafür einen guten Grund: Die explosionsartige Zunahme von Daten und Konnektivität in den letzten zehn Jahren hat das Training von KI-Systemen erheblich vereinfacht und die Realisierung komplexer Modelle ermöglicht. Neue und verbesserte Algorithmen tragen ebenfalls zum Erfolg bei. Aus diesem Grund scheinen einige hochgesteckte Ziele innerhalb des nächsten Jahrzehnts realisierbar zu sein, darunter tiefgreifende Argumentation, bei der KI die Fähigkeit erlangt, das Wie und Warum hinter Situationen zu verstehen, eine höhere Trainingseffizienz durch kleinere Datensätze und effizientere und genauere Modelle, die aus unüberwachtem Lernen hervorgehen.
Für Menschen erhöhen übertragbare Fähigkeiten die Beschäftigungsfähigkeit und Produktivität, da sie den Einstieg in eine neue Aufgabe erheblich erleichtern. Das Gleiche gilt für das Transferlernen in der KI. Allerdings steht effektives Transferlernen noch vor einer Reihe von Herausforderungen. Derzeit funktioniert Transferlernen am besten in unmittelbar ähnlichen Bereichen des Originalmodells, was seine Verwendung einschränkt. Um die Möglichkeiten des Transferlernens zu erweitern, werden deutlich mehr Rechenleistung und Ressourcen benötigt, um die größere Komplexität der Umschulung zu unterstützen. Ohne Innovationen in Effizienz und Verarbeitung wäre es vielleicht einfacher, ein Modell von Grund auf neu zu bauen.
Die vielleicht stärkste Eigenschaft der KI ist ihre Fähigkeit, Aufgaben schneller und genauer als Menschen auszuführen und so Versandmitarbeiter, Buchhalter und andere von repetitiven Aufgaben zu entlasten. Natürlich erfordert es Zeit und Mühe, Datensätze zu kuratieren, Ergebnisse zu beobachten und das Modell zu optimieren, um an diesen Punkt zu gelangen.
Eine Vielzahl von KI-Modell-Trainingstools kann den Entwicklungs- und Trainingsprozess beschleunigen. Zu diesen Tools gehören vorgefertigte Modellbibliotheken, Open-Source-Frameworks, Codierungs- und Umgebungshilfen sowie Gradientenverstärkung. Einige verlassen sich auf die Art des verwendeten Modells, während andere bestimmte Standards für Rechenressourcen erfordern.
Um herauszufinden, welches Tool bzw. welche Tools am besten für Ihr Projekt geeignet sind, beantworten Sie zunächst die folgenden Fragen:
Diese Antworten können dabei helfen, eine kurze Liste effektiver Tools zu erstellen, die Ihren KI-Modellierungsprozess unterstützen.
Das Trainieren komplexer KI-Modelle kann eine ressourcenintensive Initiative sein, da Hunderte, möglicherweise Tausende unabhängiger Dienste Informationen koordinieren und austauschen. Oracle Cloud Infrastructure (OCI) stellt GPUs bereit, die über ein Hochleistungs-Ethernet-Netzwerk verbunden sind, um Kunden Zeit und Geld zu sparen und gleichzeitig die Verfügbarkeit und Stabilität zu maximieren. Mit OCI erhalten Kunden einfache, schnelle Verbindungen, um das Training und den Einsatz hochkomplexer Modelle in großem Maßstab zu unterstützen.
Die Vorläufer des maschinellen Lernens für KI basierten auf intensiven Regeln und Wahrscheinlichkeiten, die durch leistungsstarke Berechnungen angetrieben wurden. Der Supercomputer Deep Blue nahm auf diese Weise an Weltklasse-Schachturnieren teil. KI hat sich jedoch über die Verwendung von Regeln, die auf externen Daten basieren, hinaus weiterentwickelt; stattdessen konzentrieren sich KI-Modelle nun auf die Generierung interner Erkenntnisse durch Training mit großen Mengen von Datensätzen. Während einige KI-Modelle noch regelbasierte Entscheidungsbäume verwenden, unterstützen andere dank neuronaler Netze komplexe Prozesse und Vorhersagen.
Fortschritte in der KI sind zwar spannend, aber die Zukunft dieser Technologie hängt von qualitativ hochwertigen Trainingsverfahren ab.
Unternehmen, die Modelltraining auf jeder Ebene durchführen, sollten sicherstellen, dass relevante Datensätze und institutionelles Wissen gut dokumentiert sind. Eine hervorragende Möglichkeit, das zu erreichen, ist ein KI-Center of Excellence, das über die Unterstützung bei der Ausbildung hinaus unzählige Vorteile bietet.
Was ist KI-Modelltraining?
Beim Training eines KI-Modells werden einem KI-Modell kuratierte Datensätze zugeführt, um die Genauigkeit seiner Ergebnisse zu verbessern. Der Prozess kann je nach Komplexität des KI-Modells, der Qualität der Trainingsdatensätze und der Menge der Trainingsdaten langwierig sein. Sobald der Trainingsprozess einen Benchmark für erwartete Erfolge überschreitet, überwachen Data Scientists die Ergebnisse weiter. Wenn die Genauigkeit nachlässt oder das Modell Schwierigkeiten hat, bestimmte Situationen zu bewältigen, muss das Modell möglicherweise weiter trainiert werden.
Wo kann ich ein KI-Modell trainieren?
Jeder, der Zugang zu den richtigen Tools hat, kann ein KI-Modell mit jedem PC trainieren, vorausgesetzt, er hat auch Zugang zu den erforderlichen Daten. Zu diesen Schritten gehören die Identifizierung des Problems, die Auswahl des Trainingsmodells, die Suche nach Trainingsdatensätzen und die Durchführung der Trainingsprozesse. Das kann auf kleiner, lokaler Ebene oder auf Ebene eines Großunternehmens erfolgen, je nach Umfang des Projekts und den verfügbaren Ressourcen. Neue oder unabhängige Entwickler können Cloud-Dienste nutzen, die CPU-Ressourcen für eine Vielzahl von Programmiersprachen bereitstellen und die geografische Lage aus der Gleichung entfernen.
Wie hoch sind die Kosten für das Training von KI-Modellen?
Die Kosten für das Training eines KI-Modells hängen vom Umfang des Projekts ab. In der gesamten Branche gehen die Kosten derzeit immer mehr zurück, da CPU-/GPU-Leistung und Cloud-Zugang mehr Ressourcen bieten. Die durchschnittlichen Trainingskosten für ein kleines Projekt, wie z. B. die Bildklassifizierung, lagen im Jahr 2017 bei 1.000 US-Dollar, im Jahr 2022 jedoch nur noch bei 5 US-Dollar, wie aus dem AI Index des Stanford Institute for Human-Centered Artificial Intelligence hervorgeht.
Im Vergleich dazu steigen die Kosten für KI-Projekte großer Unternehmen sogar an. Zum Beispiel kann für das ChatGPT-Training ein geschätztes Budget von 3 bis 5 Millionen US-Dollar erforderlich sein. Diese Diskrepanz ist auf die Komplexität von Projekten und die Tatsache zurückzuführen, dass wachsende Ressourcen immer komplexere und bahnbrechendere Projekte ermöglichen – sofern man sie sich leisten kann.
KI-Modellierung erlernen
Um zu lernen, wie man ein KI-Modell trainiert, ist entweder eine formale Ausbildung oder eine praktische Ausbildung direkt am Arbeitsplatz erforderlich. Sobald Sie über das Fachwissen verfügen, beginnen Sie mit den vier Schritten zur Erstellung eines KI-Modells.
Welche vier Arten von KI-Modellen gibt es?
Im Allgemeinen gibt es die folgenden vier Arten von KI-Modellen:
Einige Data Scientists verwenden auch Transferlernen, bei dem ein bestehendes KI-Modell als Ausgangspunkt für ein neues Modell dient, und halbüberwachtes Lernen, das überwachtes und unüberwachtes Lernen miteinander verbindet.