Menu Nous contacter Se connecter à Oracle Cloud

Qu'est-ce que l'entraînement des modèles d'IA et pourquoi est-il important ?

Michael Chen | Responsable de la stratégie du contenu | 6 décembre 2023

Contenu de l'article

Dans la culture populaire, l'IA a parfois mauvaise presse. Les films la présentent comme la première étape vers une apocalypse menée par les robots et les informations sont remplies d'histoires sur la façon dont l'IA prendra tous nos emplois. La vérité est que l'IA existe depuis un certain temps, et aucun de ces pires scénarios n'est probablement imminent.

Fondamentalement, l'IA utilise les données pour faire des prédictions. Cette fonctionnalité peut alimenter les conseils tels que « Vous aimerez peut-être aussi » sur les services de streaming, mais alimente également les chatbots capables de comprendre les requêtes en langage naturel et de prédire la réponse correcte et les applications qui regardent une photo et utilisent la reconnaissance faciale pour suggérer qui est dans l'image. Pour atteindre ces prédictions, cependant, il faut un entraînement efficace des modèles d'IA, et les nouvelles applications qui dépendent de l'IA peuvent nécessiter des approches légèrement différentes de l'apprentissage.

Présentation de l'entraînement des modèles d'IA

À la base, un modèle d'IA est à la fois un ensemble d'algorithmes sélectionnés plus les données utilisées pour entraîner ces algorithmes afin qu'ils puissent effectuer les prédictions les plus précises. Dans certains cas, un modèle simple utilise un seul algorithme, de sorte que les deux termes peuvent se chevaucher, mais le modèle lui-même est la sortie après l'entraînement.

Dans un sens mathématique, un algorithme peut être considéré comme une équation avec des coefficients non définis. Le modèle se réunit lorsque les algorithmes sélectionnés digèrent des jeux de données pour déterminer les valeurs de coefficient qui conviennent le mieux, créant ainsi un modèle pour les prédictions. Le terme « entraînement de modèles d'IA » fait référence à ce processus : alimenter les données de l'algorithme, examiner les résultats et ajuster la sortie du modèle pour augmenter la précision et l'efficacité. Pour ce faire, les algorithmes ont besoin de quantités massives de données qui capturent toute la gamme des données entrantes.

Les anomalies, les surprises, les incohérences et les modèles qui n'ont pas de sens à première vue... Les algorithmes doivent traiter tous ces éléments et plus encore, continuellement, dans tous les jeux de données entrants. Ce processus est le fondement de l'apprentissage : la capacité à reconnaître les modèles, à comprendre le contexte et à prendre les décisions appropriées. Avec suffisamment d'entraînement de modèles d'IA, l'ensemble d'algorithmes au sein du modèle représentera un prédicteur mathématique pour une situation donnée qui construit des tolérances pour l'inattendu tout en maximisant la prévisibilité.

Points à retenir

L'entraînement de modèles d'IA est le processus d'alimentation de données organisées à des algorithmes sélectionnés pour aider le système à s'affiner pour produire des réponses précises aux requêtes.
De nombreux types d'algorithmes d'IA sont disponibles ; le bon algorithme pour un projet donné dépend de sa portée, du budget, des ressources et des objectifs.
Un entraînement efficace des modèles d'IA nécessite un volume élevé de données d'entraînement organisées et de qualité.
L'entraînement et le test des modèles d'IA est un processus itératif basé sur les retours et les résultats.
Lorsque des modèles d'IA entraînés fournissent des résultats cohérents avec des jeux de données d'entraînement et de test, le processus passe aux tests avec des données du monde réel avant la mise en service.

Explication de l'entraînement de modèles d'IA

L'entraînement des modèles d'IA est un processus itératif dont le succès dépend de la qualité et de la profondeur de l'entrée ainsi que de la capacité des formateurs à identifier et à compenser les lacunes. Les data scientists gèrent généralement le processus d'entraînement, bien que même les utilisateurs professionnels puissent être impliqués dans certains environnements low code/no code. En fait, le cycle de traitement, d'observation, de rétroaction et d'amélioration s'apparente à l'enseignement d'une nouvelle compétence à un enfant. Avec l'entraînement du modèle d'IA, l'objectif est de créer un modèle mathématique qui crée avec précision une sortie tout en équilibrant les nombreuses variables, anomalies et complications possibles dans les données. Lorsque vous y pensez, la parentalité offre un parcours similaire, mais beaucoup plus désordonné.

Pensez à la façon dont les enfants apprennent une compétence. Par exemple, disons que vous voulez apprendre à un enfant en bas âge à identifier la différence entre les chiens et les chats. Cela commence par des images de base et des encouragements. Ensuite, d'autres variables sont introduites avec des détails tels que les tailles moyennes, des aboiements opposés aux miaulements, et les modèles de comportements. En fonction de ce avec quoi l'enfant pourrait avoir du mal, vous pouvez mettre davantage l'accent sur un certain domaine pour faciliter son apprentissage. À la fin de ce processus, l'enfant devrait être en mesure d'identifier toutes sortes de chiens et de chats, des animaux domestiques communs aux espèces sauvages.

L'entraînement d'un modèle d'IA est similaire.

IA : Sélectionnez des algorithmes et un jeu de données d'entraînement initial pour le modèle.

Enfant : utilisez des photos simples pour établir les différences générales entre un chien et un chat.
IA : évaluez la précision du résultat et réglez le modèle pour réduire ou éliminer certaines inexactitudes.

Enfant : félicitez-le ou corrigez-le en fonction de ses réponses.
IA : fournissez des jeux de données supplémentaires avec diverses entrées spécifiques pour personnaliser et affiner le modèle.

Enfant : mettez en évidence différentes caractéristiques, formes et tailles dans le cadre du processus d'apprentissage.

Comme pour les enfants, l'entraînement initial du modèle d'IA peut fortement influencer ce qui se passe en cours de route ou apprendre si d'autres leçons sont nécessaires pour désapprendre les mauvaises influences. Cela souligne l'importance des sources de données de qualité à la fois pour l'entraînement initial et l'apprentissage itératif continu, même après le lancement du modèle.

La valeur des modèles d'IA dans l'entreprise

La plupart des entreprises bénéficient déjà de l'IA dans leurs workflows et processus grâce à des applications qui génèrent des analyses, mettent en évidence les anomalies des données ou utilisent la reconnaissance de texte et le traitement du langage naturel. Pensez par exemple à transcrire des reçus et des documents papier dans des enregistrements de données. Cependant, de nombreuses organisations cherchent à développer des modèles d'IA afin de répondre à un besoin spécifique et urgent. Le processus de développement lui-même peut débloquer des niveaux plus profonds d'avantages, allant de la valeur à court terme, tels que des processus accélérés, à des gains à long terme, tels que la découverte d'informations précédemment cachées ou peut-être même le lancement d'un nouveau produit ou service.

L'une des principales raisons d'investir dans une infrastructure capable de prendre en charge l'IA découle de la croissance des entreprises. En d'autres termes, les données sont partout. Avec autant de données provenant de toutes les directions, de nouvelles informations peuvent être générées pour presque toutes les parties d'une entreprise, y compris les opérations internes et les performances des équipes de vente et de marketing. Dans cette optique, un entraînement approprié et une application réfléchie permettent à l'IA de fournir de la valeur commerciale dans presque toutes les circonstances.

Pour réfléchir à la façon dont une entreprise pourrait entraîner l'IA pour en tirer le meilleur parti, la première étape consiste à identifier les données entrantes et ce qui contribue à une décision solide. Prenons l'exemple d'une supply chain de fabrication. Une fois que toutes les données pertinentes sont disponibles pour un système d'IA correctement formé, il peut calculer les coûts d'expédition, prévoir les délais d'expédition et les taux de qualité / défaut, recommander des changements de prix en fonction des conditions du marché et effectuer de nombreuses autres tâches. La combinaison de volumes de données entrants importants et d'un besoin de décisions basées sur les données rend les supply chains mûres pour la résolution de problèmes par l'IA. En revanche, pour les cas où les soft skills restent une priorité absolue, l'IA peut fournir des informations complémentaires mais il est peu probable qu'elle apporte un changement révolutionnaire. Par exemple, l'évaluation de la performance des collaborateurs par le manager au cours des évaluations annuelles. Dans ce cas, l'IA peut faciliter la collecte de mesures mais elle ne peut pas remplacer les évaluations basées sur l'interaction humain-humain.

Pour tirer le meilleur parti d'un investissement dans l'IA, les entreprises doivent tenir compte des éléments suivants :

Quels problèmes devons-nous résoudre ?
Existe-t-il des sources de données de qualité qui peuvent fournir des informations pour résoudre ces problèmes ?
Avons-nous l'infrastructure nécessaire pour prendre en charge le traitement nécessaire et connecter les sources de données pertinentes ?

En établissant ces paramètres, les organisations peuvent identifier les domaines d'activité les plus susceptibles de bénéficier de l'IA, puis commencer à prendre des mesures pour en faire une réalité.

Processus d'entraînement d'un modèle d'IA

Bien que chaque projet comporte ses propres défis et exigences, le processus général d'entraînement des modèles d'IA reste le même.

Ces cinq étapes comprennent une présentation pour l'entraînement d'un modèle d'IA.

Préparez vos données : l'entraînement réussi du modèle d'IA commence par des données de qualité qui représentent avec précision et cohérence des situations réelles et authentiques. Sans cela, les résultats qui en découlent sont dénués de sens. Pour réussir, les équipes de projet doivent organiser les bonnes sources de données, créer des processus et une infrastructure pour la collecte manuelle et automatisée de données,et mettre en place des processus de nettoyage/transformation appropriés.
Sélectionner un modèle d'entraînement : si les données d'organisation fournissent les bases du projet, la sélection de modèle crée le mécanisme. Les variables de cette décision incluent la définition des paramètres et des objectifs du projet, le choix de l'architecture et la sélection des algorithmes de modèle. Étant donné que les différents modèles d'entraînement nécessitent différentes quantités de ressources, ces facteurs doivent être comparés à des éléments pratiques tels que les exigences de calcul, les délais, les coûts et la complexité.
Effectuer l'entraînement initial : comme dans l'exemple ci-dessus ou l'on apprend à un enfant à différencier un chat d'un chien, l'entraînement du modèle d'IA commence par les bases. L'utilisation d'un jeu de données trop grand, d'un algorithme trop complexe ou d'un type de modèle incorrect peut conduire à un système qui traite simplement les données plutôt que d'apprendre et de s'améliorer. Au cours de l'entraînement initial, les data scientists doivent se concentrer sur l'obtention de résultats dans les paramètres attendus tout en surveillant les erreurs de rupture d'algorithme. En s'entraînant sans se surpasser, les modèles peuvent s'améliorer méthodiquement par étapes stables et assurées.
Valider l'entraînement : une fois que le modèle a réussi la phase d'entraînement initiale, il crée de manière fiable les résultats attendus sur des critères clés. La validation de l'entraînement représente la phase suivante. Ici, les experts ont entrepris de défier le modèle de manière appropriée dans le but de révéler des problèmes, des surprises ou des lacunes dans l'algorithme. Cette étape utilise un groupe de jeux de données distinct de la phase initiale, généralement avec une largeur et une complexité accrues par rapport aux jeux de données d'entraînement.

Au fur et à mesure que les data scientists exécutent ces jeux de données, ils évaluent les performances du modèle. Bien que la précision de sortie soit importante, le processus lui-même est tout aussi critique. Les principales priorités du processus comprennent des variables telles que la précision, le pourcentage de prédictions précises et le rappel, le pourcentage d'identification de classe correcte. Dans certains cas, les résultats peuvent être évalués avec une valeur métrique. Par exemple, un score F1 est une métrique affectée aux modèles de classification qui intègre les pondérations de différents types de faux positifs/négatifs, ce qui permet une interprétation plus holistique du succès du modèle.
Tester le modèle : une fois le modèle validé à l'aide de jeux de données organisés et adaptés à l'usage, les données actives peuvent être utilisées pour tester les performances et l'exactitude. Les jeux de données pour cette étape doivent être tirés de scénarios du monde réel, vivre l'étape « retirer les petites roues » pour laisser le modèle rouler seul. Si le modèle fournit des résultats précis (et, plus important encore, attendus) avec des données de test, il est prêt à être mis en service. Si le modèle présente des lacunes de quelque manière que ce soit, le processus d'entraînement se répète jusqu'à ce que le modèle respecte ou dépasse les normes de performance.

Bien que la mise en service soit une étape importante, la réalisation de cette étape ne signifie pas la fin de l'entraînement du modèle. Selon le modèle, chaque jeu de données traité peut être une autre « leçon » pour l'IA, conduisant à une amélioration et un affinement supplémentaires de l'algorithme. Les data scientists doivent continuer à surveiller les performances et les résultats, en particulier lorsque le modèle traite des données aberrantes et inattendues. Si des résultats inexacts surviennent, même en de rares occasions seulement, le modèle peut avoir besoin d'un ajustement supplémentaire afin de ne pas altérer le résultat futur.

Types de méthodes d'entraînement de modèles d'IA

L'entraînement à l'IA se présente sous de nombreuses formes différentes qui varient en complexité, en types de résultats, en capacités et en puissance de calcul. Une méthode peut utiliser plus de ressources que nécessaire alors que dans d'autres cas, une méthode peut fournir une réponse binaire, comme avec un oui ou un non pour une approbation de prêt, lorsque la situation nécessite un résultat plus qualitatif qu'un simple « non » conditionnel en attendant plus de documents.

Le choix de la méthode utilisée pour un modèle d'IA doit tenir compte à la fois des objectifs et des ressources, s'aventurer sans planification minutieuse peut nécessiter que les équipes de science des données redémarrent de zéro, gaspillant ainsi du temps et de l'argent.

Réseaux neuronaux profonds

Alors que certains modèles d'IA utilisent certaines règles et informations pour prendre des décisions, les réseaux neuronaux profonds offrent la possibilité de gérer des décisions complexes basées sur diverses relations de données. Les réseaux neuronaux profonds fonctionnent avec de nombreuses couches qui identifient des modèles et des relations pondérées entre les points de données pour effectuer des sorties prédictives ou des évaluations éclairées. Des exemples de réseaux neuronaux profonds incluent des assistants activés par la voix tels que Siri d'Apple ou Alexa d'Amazon.

Régression linéaire

Dans les statistiques, la régression linéaire est utilisée pour déterminer la relation entre l'information entrante et le résultat. Dans sa forme la plus simple, cela peut être représenté par la formule algébrique y = Ax + B. Ce modèle utilise un jeu de données pour créer cette formule en fonction des coefficients d'entrée, de sortie et de variables possibles. Le modèle final utilisé pour la prédiction suppose une relation linéaire entre l'information entrante et le résultat. Un exemple de cas d'utilisation de régression linéaire est une prévision de ventes basée sur des données de ventes précédentes.

Régression logistique

Tirée du domaine des statistiques, la régression logistique est un modèle efficace pour les situations binaires. La régression logistique est basée sur la fonction logistique, qui est une équation de courbe en S souvent utilisée pour calculer la probabilité. Dans le cas de la modélisation de l'IA, la régression logistique détermine la probabilité et fournit un résultat binaire pour finalement faire des prédictions ou décider, par exemple, si l'on accordera un prêt à un client. Un exemple de cas d'utilisation pour la régression logistique est une application financière qui effectue la détection des fraudes.

Arbre décisionnel

La plupart des gens ont de l'expérience avec les arbres décisionnels, même en dehors de l'IA. Les arbres décisionnels fonctionnent de la même manière que les nœuds dans les diagrammes de flux. Dans le machine learning, les processus d'entraînement alimentent l'arborescence via des données itératives pour identifier quand ajouter des nœuds et où envoyer les différents chemins de nœud. Un exemple de cas d'utilisation pour les arbres décisionnels est une approbation de prêt financier.

Forêts aléatoires

Les arbres décisionnels peuvent devenir suradaptés à leurs ensembles d'entraînement en établissant trop de profondeur. La technique forestière aléatoire compense cela en combinant un groupe d'arbres décisionnels – d'où le terme de « forêt », et en trouvant le plus grand consensus ou une moyenne pondérée des résultats. Un exemple de cas d'utilisation pour une forêt aléatoire est de prédire le comportement des clients en fonction d'une variété d'arbres de décision sur différents éléments du profil d'un client.

Entraînement supervisé

En termes d'éducation des enfants, l'apprentissage supervisé équivaut à faire passer votre enfant par un programme d'études avec des leçons méthodiques. Pour la modélisation de l'IA, cela signifie utiliser des jeux de données d'entraînement établis et des paramètres définis pour entraîner le modèle, les data scientists agissant en tant qu'enseignants proverbiaux dans la gestion des jeux de données d'entraînement, l'exécution des jeux de données de tests et la fourniture de commentaires sur le modèle. Un exemple de cas d'utilisation pour l'apprentissage supervisé est de trouver des cellules anormales dans les radiographies des poumons. Le jeu de données d'entraînement est constitué de rayons X avec et sans anomalies et indiquant au modèle qui est qui.

Entraînement non supervisé

Poursuivant l'analogie de l'éducation des enfants, l'apprentissage non supervisé est similaire à la philosophie Montessori dans laquelle on présente aux enfants un éventail de possibilités et la liberté de s'auto-gérer en fonction de leur curiosité. Pour la modélisation de l'IA, cela signifie l'ingestion d'un jeu de données sans libellé sans paramètres ni objectifs. C'est à l'IA de déterminer les modèles dans les données. Un exemple de cas d'utilisation pour l'apprentissage non supervisé est un détaillant alimentant un modèle d'IA de données de ventes trimestrielles dans le but de trouver des corrélations dans le comportement des clients.

Apprentissage par renforcement

Si vous avez déjà renforcé le comportement désiré avec des récompenses, vous avez participé à l'apprentissage par renforcement. Au niveau de l'IA, l'apprentissage par renforcement commence par des décisions expérimentales qui conduisent à un renforcement positif ou négatif. Passé un certain temps, l'IA prend les meilleures décisions, plus précises et plus réussies, pour gérer une situation et maximiser le renforcement positif. Un exemple de cas d'utilisation pour l'apprentissage par renforcement est la liste des suggestions « Vous pourriez aussi aimer » présentée par YouTube en fonction de votre historique de visualisation.

Transférez l'entraînement

Un modèle d'IA peut réussir lorsqu'il est appliqué à une situation différente. L'apprentissage par transfert fait référence à la méthode d'utilisation d'un modèle d'IA existant comme point de départ pour un nouveau modèle. Cette réaffectation fonctionne mieux lorsque le modèle existant gère un scénario général ; tout élément trop spécifique peut s'avérer trop difficile à réentraîner. Un exemple de cas d'utilisation pour le transfert d'apprentissage est un nouveau modèle d'IA pour un type spécifique de classification d'image basée sur des paramètres d'un modèle de classification d'image existant.

Entraînement semi-supervisé

En utilisant les principes de l'apprentissage supervisé et non supervisé, l'apprentissage semi-supervisé commence par l'entraînement du modèle sur un petit groupe de jeux de données étiquetés. À partir de là, le modèle utilise des jeux de données non étiquetés et non filtrés pour affiner les modèles et créer des informations inattendues. En général, l'apprentissage semi-supervisé utilise uniquement des jeux de données étiquetés pour les premières étapes, comme les roues d'entraînement. Après cela, le processus s'appuie fortement sur des données non étiquetées. Un exemple de cas d'utilisation pour l'apprentissage semi-supervisé est un modèle de classification de texte, qui utilise un ensemble organisé pour établir des paramètres de base avant d'être alimenté en grands volumes de documents texte non supervisés.

Modèles générés

Les modèles génératifs sont une méthode d'IA non supervisée qui utilise de très grands exemples de jeux de données pour créer un prompt de résultat. Par exemple, des images générées par l'IA basées sur les métadonnées d'une archive d'images ou du texte prédictif basé sur une base de données de phrases typées. Plutôt que de simplement classer les données en fonction de leurs résultats, les résultats des modèles génératifs peuvent prendre des milliers, voire des millions, d'exemples de données pour apprendre et créer un résultat sortant original. Un exemple de cas d'utilisation d'un modèle génératif est un chatbot, tel que ChatGPT.

Rôle des données dans l'entraînement de modèles d'IA

Pour qu'un modèle d'IA soit correctement entraîné, il a besoin de beaucoup de données. En réalité, les données sont l'élément le plus crucial dans l'entraînement des modèles d'IA. Sans elle, le modèle ne peut tout simplement pas apprendre. Et sans données de qualité, le modèle apprendra les mauvaises choses. Ainsi, les data scientists sélectionnent des jeux de données pour leurs projets avec intention et soin.

La curation des jeux de données doit impliquer les facteurs suivants pour un entraînement optimal du modèle d'IA :

Qualité des sources de données : si un modèle d'IA est alimenté par un grand volume de jeux de données non validés, non homogènes ou de mauvaise qualité, les résultats suivants seront inférieurs. Ce qui constitue de « bonnes données » peut différer selon le modèle en question. Lorsqu'il y a des niveaux inacceptables d'inexactitude, il peut être possible de revenir en arrière et de réentraîner l'IA. Cependant, il n'est pas rare que les data scientists redémarrent un projet à partir de zéro après que de mauvaises données ont entaché le modèle.
Volume de données : l'exercice est parfait pour l'entraînement des modèles d'IA. Bien qu'un jeu de données puisse être une bonne première étape, le processus d'entraînement nécessite une grande quantité de données ainsi qu'un niveau approprié de diversité et de finesse pour peaufiner le modèle, augmenter la précision et identifier les données aberrantes.
Diversité des données : une plus grande diversité des jeux de données conduit souvent à une plus grande précision dans l'entraînement des modèles d'IA. Tout comme dans le monde réel, diverses expériences élargissent les capacités et permettent une prise de décision efficace grâce à une plus grande profondeur de connaissances.

Défis liés à l'entraînement de modèles d'IA

L'entraînement des modèles d'IA comporte ses propres défis. Certains d'entre eux sont logistiques : infrastructure, puissance de calcul et autres considérations pratiques pour aller du début à la fin. D'autres défis nécessitent une introspection de la part des data scientists, comme le développement d'une compréhension de la façon d'atténuer les biais et de maintenir l'objectif du système résultant.

Les défis suivants doivent être pris en compte pour toute initiative d'entraînement de modèles d'IA :

Données biaisées : pour obtenir des résultats précis à partir d'un modèle d'IA, l'entraînement nécessite des données de qualité. Pour atténuer les biais liés aux données, les data scientists doivent examiner minutieusement les sources de données avant d'organiser les jeux de données d'entraînement.
Données correctes : les jeux de données d'entraînement nécessitent de gros volumes de données qui représentent une diversité et une précision appropriées. Non seulement cela appelle les équipes à organiser de grandes quantités de données de qualité, mais cela apporte de nombreuses considérations pratiques. Le stockage, le nettoyage/la transformation, le traitement et le contrôle qualité général deviennent de plus en plus difficiles à mesure qu'un jeu de données s'agrandit.
Exigences en matière d'infrastructure et de puissance de calcul : plus le modèle d'IA est complexe, plus la puissance de calcul et la prise en charge de l'infrastructure sont nécessaires. La praticité de l'exécution du modèle, de l'entraînement à la mise en service, doit être prise en compte lors de la sélection de la méthode du modèle. Si un type de modèle nécessite plus de ressources que ce qui est possible, l'ensemble du projet s'effondrera.
Surajustement : lorsqu'un modèle d'IA est trop ajusté dans les jeux de données d'entraînement, il peut se verrouiller dans ces détails plutôt que d'être capable de gérer la diversité et les surprises. Ce phénomène est connu sous le nom de « surajustement » et il empêche des prédictions précises à l'avenir. Un exemple de surajustement a lieu lorsque le jeu de données d'entraînement produit une précision de 99 %, mais qu'un jeu de données réel produit seulement une précision de 75 % à 85 %. Notez que la précision perçue dans l'IA fait référence à la façon dont un système semble fonctionner en termes de précision en fonction de ses capacités actuelles. C'est la précision observée ou expérimentée par les utilisateurs ou les parties prenantes. D'autre part, la précision potentielle dans l'IA fait référence au niveau maximal de précision qu'un système pourrait atteindre dans des conditions idéales avec des ressources optimales. Il est important de comprendre la différence entre la précision perçue et la précision potentielle pour évaluer les performances d'un système d'IA et identifier les domaines à améliorer ou à développer à l'avenir.

Les termes « overfitting » et « overtraining » sont souvent utilisés de manière interchangeable mais ils ont une signification distincte. Comme nous l'avons vu précédemment, l'IA fonctionne très bien sur ses données d'entraînement, mais ne se généralise pas bien sur les nouvelles données. Le surentraînement se produit lorsqu'un modèle a été entraîné de manière excessive, ce qui donne lieu à des performances médiocres à la fois sur les données d'entraînement et sur les nouvelles données. Le surentraînement peut se produire lorsqu'un modèle est entraîné trop longtemps ou avec trop de complexité, ce qui le rend difficile à généraliser. Les deux questions doivent être évitées dans le processus d'entraînement de modèles.
Explicabilité : l'un des problèmes en suspens dans la modélisation de l'IA est le manque d'explicabilité de la façon dont les décisions sont prises. Les utilisateurs peuvent faire des inférences en fonction des sorties, mais les raisons du modèle peuvent rester nébuleuses. Certains développeurs ont créé des outils pour combler cet écart, y compris des modèles conçus pour avoir une explication plus transparente. Cependant, l'implémentation, la convivialité, les détails et l'accessibilité varient tous, à la fois pour l'entrée et la sortie.

L'avenir de l'entraînement de modèles d'IA

Alors que l'IA existe d'une forme ou une autre depuis les prémices de l'informatique, les progrès des algorithmes, de la puissance CPU, de la puissance de l'unité de traitement graphique (GPU) et du partage des ressources basé sur le cloud ont considérablement fait progresser l'IA au cours des deux dernières décennies. L'IA est intégrée à tellement d'applications que de nombreux utilisateurs l'utilisent sans même s'en rendre compte. Lorsque vous diffusez de la musique, des listes de lecture personnalisées proviennent d'une IA qui analyse vos chansons et artistes préférés. Lorsque vous tapez un SMS, une IA propose des suggestions prédictives basées sur les mots que vous utilisez couramment. Si vous avez trouvé une nouvelle émission de télévision que vous aimez grâce à une recommandation automatisée, remerciez l'IA.

C'est l'IA d'aujourd'hui mais que réserve l'avenir ?

Le potentiel de l'IA dépend de l'évolution des capacités de l'entraînement des modèles. Examinons les possibilités futures de l'entraînement des modèles d'IA.

Avancées des techniques d'entraînement de modèles d'IA

S'il semble que les innovations de l'IA aient connu une croissance exponentielle, il y a une bonne raison à cela : l'explosion des données et de la connectivité au cours de la dernière décennie a facilité l'entraînement des systèmes d'IA et a permis la réalisation de modèles complexes. Par ailleurs, de nouveaux algorithmes et l'amélioration des algorithmes existants contribuent au succès. Pour cette raison, un certain nombre d'objectifs élevés semblent réalisables au cours de la prochaine décennie, y compris un raisonnement approfondi, où l'IA acquiert la capacité de comprendre les arcanes de chaque situation, une efficacité accrue de l'entraînement à l'aide de jeux de données plus petits et des modèles plus efficaces et plus précis issus de l'apprentissage non supervisé.

Le potentiel du transfert d'apprentissage

Pour les utilisateurs, les compétences transférables augmentent l'employabilité et la productivité en facilitant la mise en route d'une nouvelle tâche. Il en va de même pour le transfert de l'apprentissage en IA. Cependant, l'apprentissage par transfert efficace reste confronté à un certain nombre de défis. Actuellement, l'apprentissage par transfert fonctionne mieux dans des domaines immédiatement similaires pour le modèle original, limitant son utilisation. L'élargissement des capacités d'apprentissage par transfert nécessitera beaucoup plus de puissance de calcul et de ressources pour prendre en charge la plus grande complexité du réentraînement. Sans innovations en matière d'efficacité et de traitement, il peut être plus facile de simplement construire un modèle à partir de zéro.

Le rôle de la surveillance humaine dans l'entraînement des modèles d'IA

Le trait le plus puissant de l'IA est peut-être sa capacité à effectuer des tâches plus rapidement et plus précisément que les humains, ce qui libère les chargés d'expédition, les comptables et autres personnes de l'exécution de tâches répétitives. Bien sûr, pour y arriver, il faut du temps et des efforts pour organiser les jeux de données, observer les résultats et peaufiner le modèle.

Comment choisir le bon outil d'entraînement de modèles d'IA

Divers outils d'entraînement de modèles d'IA peuvent accélérer le processus de développement et d'entraînement. Ces outils comprennent des bibliothèques de modèles prédéfinis, des frameworks open source, des aides au codage et à l'environnement, ainsi que des améliorations de gradient. Certains dépendent du type de modèle utilisé, tandis que d'autres nécessitent certaines normes pour les ressources de calcul.

Pour déterminer quel outil, ou quels outils, conviennent le mieux à votre projet, compilez les réponses aux questions suivantes :

Quel type de résultat voulez-vous de votre modèle d'IA ?
Quelles sont vos ressources de calcul sous-jacentes ?
Quelle est la portée et le budget de votre projet ?
Où en êtes-vous dans votre processus de développement ?
Quelles sont les compétences de votre équipe ?
Existe-t-il des restrictions de gouvernance ou de conformité pour votre secteur d'activité ou votre projet ?
Quels domaines de votre projet ont le plus besoin d'aide ?

Ces réponses peuvent aider à créer une courte liste d'outils efficaces pour aider votre processus d'entraînement de modèles d'IA.

OCI prend en charge l'entraînement de modèles et les applications parallèles

L'entraînement de modèles d'IA complexes peut être une initiative gourmande en ressources car des centaines voire des milliers de services indépendants coordonnent et partagent des informations. Oracle Cloud Infrastructure (OCI) fournit des GPU connectés via un réseau Ethernet hautes performances pour faire gagner du temps et de l'argent aux clients tout en optimisant la disponibilité et la stabilité. Avec OCI, les clients bénéficient d'interconnexions simples et rapides pour prendre en charge l'entraînement et le déploiement de modèles hautement complexes à grande échelle.

Les précurseurs du machine learning de l'IA ont été basés sur des règles et des probabilités intensives basées sur des calculs à haute puissance. Le superordinateur Deep Blue a participé à des tournois d'échecs de classe mondiale de cette façon. Cependant, l'IA a évolué au-delà de l'utilisation de règles alimentées par des données externes. Au lieu de cela, les modèles d'IA se concentrent désormais sur la génération d'informations internes en s'entraînant via de lourds volumes de jeux de données. Alors que certains modèles d'IA utilisent encore des arbres décisionnels basés sur des règles, d'autres prennent en charge des processus et des prédictions complexes grâce aux réseaux neuronaux.

Les progrès de l'IA sont passionnants mais l'avenir de cette technologie dépend d'une formation de haute qualité.

E-book sur les cas d'utilisation de l'IA

Les entreprises qui démarrent une formation sur les modèles, à quelque niveau que ce soit, voudront s'assurer que les jeux de données pertinents et les connaissances institutionnelles soient bien documentés. Un excellent moyen d'y parvenir est un centre d'excellence en IA qui offre de nombreux avantages au-delà du support de formation.

Consulter l'e-book

FAQ sur les défis liés à l'entraînement des modèles d'IA

Qu'est-ce que l'entraînement de modèles d'IA ?

L'entraînement de modèles d'IA est le processus d'alimentation d'un modèle d'IA organisé des jeux de données pour faire évoluer la précision de ses résultats. Le processus peut être long, en fonction de la complexité du modèle d'IA, de la qualité des jeux de données d'entraînement et du volume de données d'entraînement. Une fois que le processus d'entraînement a réussi un test de référence pour les succès attendus, les data scientists continuent de surveiller les résultats. Si la précision diminue ou si le modèle a des difficultés à gérer certains types de situations, le modèle peut nécessiter une formation supplémentaire.

Où puis-je entraîner un modèle d'IA ?

Toute personne ayant accès aux outils appropriés peut entraîner un modèle d'IA à l'aide de n'importe quel PC, en supposant qu'elle ait accès aux données nécessaires. Les étapes comprennent l'identification du problème, la sélection du modèle d'entraînement, la recherche de jeux de données d'entraînement et l'exécution des traitements d'entraînement. Cela peut être à petite échelle, à l'échelle locale ou à grande échelle en fonction de la portée du projet et des ressources disponibles. Les développeurs, nouveaux ou indépendants, peuvent tirer parti des services cloud qui fournissent des ressources CPU dans divers langages de programmation et suppriment la zone géographique de l'équation.

Combien coûte l'entraînement des modèles d'IA ?

Le coût de l'entraînement d'un modèle d'IA dépend de la portée du projet. Dans l'ensemble du secteur, les coûts continuent à baisser car la puissance CPU/GPU et l'accès au cloud fournissent plus de ressources. En fait, le coût moyen de formation pour un petit projet, tel que la classification des images, était de 1 000 $ en 2017, contre seulement de 5 $ en 2022, selon l'indice d'IA de l'Institute for Human-Centered Artificial Intelligence de Stanford.

En comparaison, le coût des grands projets d'IA d'entreprise augmente. Par exemple, l'entraînement de ChatGPT peut nécessiter un budget estimé entre 3 et 5 millions de dollars. Cette disparité tient à la complexité des projets et au fait que l'augmentation des ressources rend les projets de plus en plus complexes et porteurs de limites disponibles, si vous pouvez vous les permettre.

Comment apprendre la modélisation de l'IA ?

Pour apprendre à entraîner des modèles d'IA, une formation officielle ou une formation continue est nécessaire. Une fois que vous avez cette expertise, commencez par les quatre étapes composant la création d'un modèle d'IA.

Identifiez le problème : qu'il s'agisse d'un projet professionnel, universitaire ou personnel, tout modèle d'IA commence par savoir quel est le problème que vous souhaitez résoudre. Cela crée une orientation pratique pour le projet et identifie divers éléments clés, tels que la portée, le budget et les besoins en ressources.
Données d'entraînement précises : les modèles d'IA ne fonctionnent que lorsqu'ils ont des données à exploiter. Cela signifie que les jeux de données d'entraînement doivent être organisés à partir de sources de qualité, puis préparés (nettoyés/transformés) pour être utilisés dans un algorithme.
Développement de modèles : les développeurs peuvent choisir parmi un certain nombre de types d'IA pour leur modèle d'IA en fonction du type de résultat nécessaire et du type de données disponibles. Une fois cela établi, le processus d'entraînement peut commencer. Lorsque le modèle atteint des niveaux élevés de précision avec les données d'entraînement, les équipes de développement peuvent passer à des données réelles pour tester les performances.
Déploiement : après avoir confirmé les résultats réels, le modèle peut être mis en service. À ce stade, les développeurs doivent continuer à surveiller les résultats de toute anomalie nécessitant un affinement supplémentaire. Un modèle d'IA doit être traité comme un projet continu susceptible de continuer à évoluer.

Quels sont les quatre types de modèles d'IA ?

En général, les quatre types de modèles d'IA sont les suivants :

L'entraînement supervisé utilise des jeux de données d'entraînement établis et des paramètres définis pour entraîner le modèle.
L'apprentissage non supervisé implique qu'un système d'IA ingère un jeu de données sans étiquette, sans paramètres ni objectifs et détermine des modèles dans les données.
Les modèles d'apprentissage par renforcement commencent par des décisions expérimentales qui conduisent à un renforcement positif ou négatif. Avec le temps, l'IA apprend le « meilleur » plan d'action.
L'apprentissage génératif est une méthode d'IA non supervisée qui utilise une grande quantité d'exemples de données pour créer un prompt de résultat.

Certains data scientists utilisent également l'apprentissage par transfert, où un modèle d'IA existant est le point de départ d'un nouveau modèle, et l'apprentissage semi-supervisé, qui fusionne l'apprentissage supervisé et non supervisé.