Revenir au contenu principal

L'IA générative

Qu'est-ce que l'IA générative ?

L'IA générative, souvent abrégée en GenAI, est tout type d'intelligence artificielle capable de créer du nouveau contenu par elle-même. Le contenu de l'IA générative comprend du texte, des images, des vidéos, de la musique, des traductions, des résumés et du code. Elle peut également accomplir certaines tâches, comme répondre à des questions ouvertes, exécuter des instructions presque arbitraires et participer à des chats.

Le grand public a été initié à la signification de GenAI par des services comme ChatGPT et DALL-E, qui ont également grandement augmenté la popularité de la technologie.

Comment fonctionne l'IA générative ?

Les modèles GenAI utilisent l'apprentissage profond pour identifier et analyser les modèles dans les ensembles de données existants. Semblables au comportement du cerveau humain, ils utilisent des transformateurs et d'autres architectures d'apprentissage profond pour traiter et "apprendre" à partir des ensembles de données. Ces modèles d'IA sont formés sur d'énormes quantités de données pour créer du contenu nouveau et original.

Vous pouvez donner à l'IA un "prompt" une fois qu'elle est formée en entrant quelque chose comme du texte, une image ou une séquence de notes musicales. Les algorithmes génèrent ensuite un nouveau contenu en retour. Ils peuvent même travailler sur différents médias, par exemple, en utilisant une image pour créer une légende de texte ou en générant une image à partir d'une description de texte.

Un type courant de modèle d'IA générative est les grands modèles de langage (LLM), qui sont formés sur du texte. Ces modèles apprennent à reconnaître les mots qui sont utilisés séquentiellement. Ils peuvent alors former une phrase en prédisant quel mot est le plus susceptible de venir ensuite dans une séquence, ce qui donne un rendu naturel.

Gen AI diagram

Exemples de modèles d'IA générative

Il existe plusieurs types de modèles d'IA génératifs actuellement en usage. Leurs méthodes et cas d'utilisation diffèrent, mais ils combinent tous divers algorithmes pour traiter et créer du contenu.

Réseaux antagonistes génératifs (GANs)

Un modèle GAN contient deux réseaux neuronaux, qui sont formés en même temps. Ces réseaux sont appelés le générateur et le discriminateur, et ils s'affrontent dans un scénario de type jeu. 

Le générateur crée de nouvelles sorties, comme une image basée sur une invite. Le discriminateur évalue ensuite ce nouveau contenu pour son authenticité et fournit des commentaires au générateur pour aider à améliorer sa sortie. Le générateur essaie toujours de tromper le discriminateur en acceptant le contenu généré comme étant "réel", tandis que le discriminateur s'efforce toujours de s'améliorer pour faire la différence.

Un exemple bien connu d'un modèle GAN est Midjourney (un outil GenAI de texte à image). Cependant, les GAN ne sont pas limités à la création d'images ; ils ont également produit du texte et du contenu vidéo. 

La compétition continue entre le générateur GAN et le discriminateur signifie qu'ils peuvent rapidement générer des sorties de haute qualité. Cependant, il est important de veiller à ce que les deux réseaux soient équilibrés pour éviter des problèmes comme le surapprentissage, l'effondrement du mode et les gradients diminués.

Auto-encodeurs variationnels (VAEs)

Les modèles d'auto-encodeur utilisent également deux réseaux pour interpréter et générer des données. Dans ce modèle, les réseaux sont appelés l'encodeur et le décodeur. Le réseau encodeur est formé pour compresser les données dans un format simplifié, ou latent, qui capture les caractéristiques clés. Pendant ce temps, le modèle de décodeur est formé pour reconstruire le contenu à partir de données latentes. 

Les VAE utilisent des espaces latents continus pour permettre une variation locale entre les points de données d'entraînement. En décodant les informations compressées légèrement modifiées, le modèle VAE produit un contenu similaire, mais finalement original.

Ce modèle est souvent utilisé pour la génération d'images et la détection d'anomalies, mais peut également créer du texte et de l'audio. Les VAEs sont rapides pour générer des sorties comme des images, mais ils peuvent manquer de détails par rapport à certains autres modèles.

Autoregressive

Les modèles d'IA génératifs autorégressifs créent de nouveaux échantillons en tenant compte du contexte des éléments qui ont été générés précédemment. Ils modélisent la distribution de probabilité conditionnelle de chaque point de données et génèrent de nouvelles données en prédisant l'élément suivant de la séquence.

Ces modèles génèrent des données séquentiellement, un élément à la fois, permettant la génération de séquences complexes. L'IA autorégressive est généralement utilisée dans la génération de texte (comme ChatGPT), la modélisation du langage et la composition musicale.

Modèles de diffusion

Les modèles de diffusion sont parfois également appelés modèles probabilistes de débruitage par diffusion (DDPMs). Ils sont formés avec un processus en deux étapes qui implique une diffusion avant et une diffusion arrière. 

Pendant la diffusion avant, un bruit gaussien aléatoire est progressivement ajouté aux données d'entraînement, les détruisant efficacement. L'IA apprend ensuite à reconstruire les échantillons par diffusion inverse. Une fois qu'ils sont entièrement formés, les modèles de diffusion peuvent créer de nouvelles données à partir d'un bruit totalement aléatoire.

Transformateurs

Les transformateurs utilisent un type spécifique d'apprentissage automatique qui les aide à traiter les relations à long terme entre les données d'entrée séquentielles. Cela nécessite que les modèles soient formés sur des ensembles de données plus importants.

Ce concept, connu sous le nom d'"attention", permet aux transformateurs de déterminer quelles parties de l'entrée influencent d'autres parties, c'est-à-dire de comprendre le contexte. Cela les rend idéales pour les tâches de génération de texte impliquant le traitement du langage naturel (NLP), qui nécessite une compréhension du contexte. La majorité des programmes d'IA générative bien connus sont des exemples de modèles basés sur des transformateurs.

Les transformateurs se sont avérés être de très puissants générateurs de texte. C'est parce qu'ils n'ont besoin que de texte comme entrée de formation, et il y a des milliards de pages disponibles à utiliser. En plus du NLP, d'autres utilisations des modèles d'IA de transformateurs incluent le suivi des connexions et l'identification des relations dans le code, les protéines, les produits chimiques et l'ADN.

Quel est le rôle de l'apprentissage profond dans l'IA générative ?

La transition vers l'apprentissage profond a rendu les modèles d'IA plus sophistiqués, leur permettant de modéliser des données de plus en plus complexes, comme le langage naturel. La majorité des modèles d'IA générative utiliseront tous l'apprentissage profond sous le capot.

Le nom d'apprentissage profond vient du grand nombre de couches de traitement utilisées pour ces modèles. La première couche de nœuds interconnectés est fournie avec des données d'entraînement. La sortie de cette couche est ensuite utilisée comme entrée pour la couche suivante. Comme chaque couche se base sur les connaissances acquises de la couche précédente, la complexité et l'abstraction augmentent et les détails fins des ensembles de données peuvent contribuer à comprendre les modèles à grande échelle.

Alors que les programmeurs doivent effectuer une extraction de caractéristiques lors de l'apprentissage machine traditionnel, les programmes de deep learning peuvent construire des représentations utiles des données en interne avec moins de supervision.

De plus, les techniques de deep learning permettent aux modèles d'IA de gérer des concepts complexes et abstraits, tels que la compréhension du langage naturel et la reconnaissance d'images.

Il existe plusieurs façons d'améliorer les performances de l'IA, comme l'augmentation des données, l'apprentissage par transfert et le réglage fin. L'augmentation des données utilise des modèles génératifs pour créer de nouveaux points de données synthétiques pour les données d'entraînement. Ceci est ensuite ajouté aux données existantes pour augmenter la taille et la diversité des ensembles de données et, par conséquent, la précision du modèle.

L'apprentissage par transfert implique l'utilisation d'un modèle pré-entraîné pour une deuxième tâche connexe. En utilisant la sortie du modèle existant comme entrée pour un autre problème d'apprentissage, le modèle peut appliquer les connaissances acquises lors de la première instance de formation. Un exemple d'apprentissage par transfert serait d'utiliser un modèle formé pour identifier les voitures pour former un modèle pour identifier d'autres véhicules. L'apprentissage par transfert est utile car il réduit la quantité de données nécessaires pour entraîner un nouveau modèle.

Enfin, l'ajustement fin est une technique pour personnaliser un modèle d'IA en le formant avec des données plus spécifiques. Cela permet d'affiner les modèles pré-entraînés pour une utilisation sur des domaines ou des tâches spécifiques. Des ensembles de données de haute qualité qui sont représentatifs de la tâche finale sont nécessaires pour l'ajustement fin.

Cas d'utilisation réels de l'IA générative

La technologie de l'IA générative a une vaste gamme d'applications dans le monde réel, de la génération de texte et d'images au développement de logiciels. Jetons un coup d'œil à certains des cas d'utilisation courants actuels.

Génération d'images

Des outils comme DALL-E permettent aux utilisateurs de créer de nouvelles images (photos, illustrations et même vidéos) en entrant des instructions visuelles ou écrites. Les modèles multimodaux peuvent créer des images à partir d'instructions textuelles, les utilisateurs peuvent donc être aussi vagues ou spécifiques qu'ils le souhaitent.

Par exemple, vous pourriez simplement demander un dessin basé sur "animaux" et "arcs-en-ciel", et voir ce qu'il propose. Ou vous pourriez donner des instructions détaillées, comme "un bébé rhinocéros portant des lunettes de soleil, regardant un arc-en-ciel à travers une fenêtre avec des rideaux violets."

Une autre option est le transfert de style, où le contenu d'une image est combiné avec le style visuel d'une autre. Vous entrez une image de contenu (une photo d'un rhinocéros) et une image de référence de style (une peinture de Picasso), et l'IA est capable de les mélanger pour créer une nouvelle image de rhinocéros de style Picasso.

Génération de texte

Alors que l'un des cas d'utilisation de GenAI basé sur le texte les plus connus est les chatbots, la technologie peut maintenant être appliquée à de nombreuses autres tâches. Par exemple, des outils comme GrammarlyGo peuvent aider à rédiger et à répondre aux emails dans un style professionnel.

Disons que vous deviez produire une brochure publicitaire pour un produit technique. En tant qu'humain, vous prendriez le temps de lire les caractéristiques et les spécifications, de prendre des notes détaillées et de rédiger un brouillon de récit. Un programme d'IA générative peut faire tout cela en quelques secondes après que vous ayez fourni les informations, créant rapidement du contenu prêt à l'emploi. La génération de texte est également utile pour doubler des films, fournir des sous-titres pour du contenu vidéo ou traduire du contenu dans diverses langues.

Composition musicale

GenAI est capable de composer de la musique dans un genre spécifique ou d'émuler le style de compositeurs spécifiques. Comme avec les générateurs d'images, vous pouvez fournir des détails ou laisser une totale liberté créative, par exemple, "Une chanson sur les arcs-en-ciel" ou "une chanson pour enfants en trois vers sur les arcs-en-ciel en temps de valse, accompagnée d'un ukulélé et d'un kazoo."

Vous pouvez également demander à l'IA de fusionner deux pièces différentes avec un transfert de style, par exemple, la chanson Joyeux Anniversaire dans le style de Gershwin, ou créer un remix. Amper Music crée des pistes musicales à partir d'échantillons préenregistrés, tandis que d'autres outils peuvent créer une bande sonore en reconnaissant des objets dans des séquences vidéo.

Quelles sont les applications industrielles de l'IA générative ?

Avec tant de façons d'utiliser cette technologie, il n'est pas étonnant que l'IA générative pour le commerce de détail, les services financiers, les soins de santé et plus encore deviennent la norme plutôt que l'exception.

Vente au détail

De nombreuses entreprises de vente au détail utilisent déjà des chatbots pour automatiser le service à la clientèle et, à mesure que l'IA générative progresse, ces chatbots deviendront plus sophistiqués. À l'avenir, l'IA pourrait offrir une personnalisation supplémentaire aux clients avec des cabines d'essayage virtuelles, le développement de produits et le marketing proactif. Les entreprises de vente au détail pourraient également bénéficier de l'utilisation de GenAI pour la planification des stocks et de la demande ainsi que pour l'identification de la pêche à la ligne ou de la fraude pour une sécurité renforcée.

Services financiers

Les entreprises du secteur des services financiers (FSI) investissent déjà dans GenAI pour analyser de grandes quantités de données. Un exemple de cela est le BloombergGPT LLM, qui a été annoncé plus tôt cette année. L'IA à 50 milliards de paramètres est spécialement conçue pour les rapports et les prévisions du FSI.

D'autres utilisations de l'IA générative dans le secteur financier, actuellement et à l'avenir, incluent la gestion des risques et la détection de la fraude, l'amélioration de l'efficacité opérationnelle et l'augmentation de la personnalisation des clients.

Production industrielle

Depuis la Révolution industrielle, l'industrie manufacturière vise à optimiser l'efficacité par l'automatisation. L'IA générative fournit un nouvel outil qui poussera cette industrie vers le futur une fois de plus.

L'IA peut fournir des rapports automatisés sur les opérations de fabrication continues, identifier les lacunes de performance ou les goulets d'étranglement et utiliser la priorisation basée sur les données pour augmenter l'efficacité. En plus de surveiller les opérations, l'IA peut également surveiller l'équipement et réduire les temps d'arrêt avec la maintenance prédictive et le dépannage.

Enfin, les LLMs en fabrication peuvent personnaliser l'expérience client, à la fois pendant le service client et dans certains produits, tels que les véhicules ou la technologie intelligente.

Média

Comment l'industrie du divertissement utilisera l'IA a fait l'objet de nombreux débats récents. Cependant, il existe de nombreuses façons d'utiliser l'IA générative sans affecter les emplois de l'industrie.

L'analyse des préférences des utilisateurs, des modèles de consommation et des signaux des médias sociaux par les modèles d'IA peut être utilisée pour optimiser les recommandations de médias des services de divertissement. Les modèles GenAI pourraient également améliorer les publicités ciblées. Cependant, le développement le plus excitant concernant les LLMs dans le divertissement est le potentiel de narration immersive et interactive où les décisions du spectateur façonneraient le récit.

Santé

Dans le domaine de la santé, les modèles d'IA générative peuvent aider à la découverte de nouveaux médicaments en créant des graphiques pour montrer de nouveaux composés chimiques et molécules. AstraZeneca utilise déjà l'IA pour la découverte de médicaments et, d'ici 2025, on estime que plus de 30% des nouveaux médicaments et matériaux seront découverts en utilisant la technologie GenAI.

Ces modèles peuvent également suggérer de nouveaux composés à tester, identifier des candidats appropriés pour les essais et affiner les applications d'analyse d'images médicales avec des images synthétiques. De plus, l'IA peut être utilisée pour générer des plans de traitement personnalisés ou pour transcrire des consultations pour les télécharger dans des dossiers de santé électroniques.

Comment le paysage des applications d'IA générative peut bénéficier aux entreprises

Nous avons vu certaines des applications réelles, mais que signifie l'IA générative pour les entreprises ? Voici quelques-uns des principaux avantages.

Sources de revenus

Cette technologie permet aux entreprises de créer et de lancer rapidement de nouveaux produits en proposant de nouveaux designs frais et en accélérant le processus de R&D. Il peut analyser les tendances et le comportement des clients afin de présenter de nouvelles idées pour des sources de revenus supplémentaires.

En plus de l'innovation produit, l'IA peut vous aider à produire de nouveaux plans marketing et à créer des matériaux promotionnels. L'analyse des préférences des clients lui permet de générer des publicités ciblées, de personnaliser les recommandations et de personnaliser les produits et services. L'analyse des données par l'IA aide également les entreprises à repérer des opportunités qui les maintiennent en avance sur leurs concurrents et à conserver un avantage concurrentiel. 

Enfin, l'utilisation de GenAI améliore les performances des chatbots d'entreprise, ce qui augmente la satisfaction des clients, les ventes et la fidélisation.

Productivité

Un autre avantage majeur est la productivité, car GenAI peut être utilisé pour automatiser des tâches manuelles chronophages, telles que la saisie de données, les courriels de routine et les transcriptions de réunions ou d'appels.

Les modèles d'IA sont excellents pour résumer des informations complexes, ce qui facilite leur compréhension et leur interprétation par les humains. Elle peut également analyser vos données et suggérer des moyens d'améliorer les flux de travail existants pour une efficacité maximale.

Dans le support client, les entreprises peuvent déployer des chatbots et des assistants virtuels alimentés par l'IA pour réduire la charge de travail des agents de support. Les avantages comprennent des temps de réponse et de résolution plus courts, ainsi que la possibilité pour les agents de gérer d'autres tâches pendant que l'IA s'occupe des requêtes courantes.

Atténuation des risques

Les plateformes d'IA générative peuvent vous donner une visibilité plus profonde sur vos données ainsi que identifier rapidement les vulnérabilités financières ou de sécurité. Les programmes IA avancés peuvent même simuler des risques commerciaux potentiels, vous permettant d'évaluer la conformité et de mettre en œuvre des protocoles pour éviter ou atténuer les problèmes.

Pendant ce temps, la compression des données signifie que les organisations n'ont besoin de conserver que les données essentielles, ce qui réduit les risques de détention de beaucoup d'informations personnelles.

Quelles sont les différences entre les LLMs les plus courants ?

Les LLMs forment un domaine encombré, et le nombre d'options à choisir ne cessera d'augmenter. Cependant, vous pouvez généralement regrouper les LLM en deux catégories : les services propriétaires et les modèles open source. Examinons cela de plus près.

Services propriétaires

Le service LLM le plus connu est ChatGPT, qui a été lancé par OpenAI vers la fin de 2022. ChatGPT offre une interface de recherche conviviale qui accepte les invites et fournit généralement des réponses rapides et pertinentes. L'API ChatGPT est également accessible aux développeurs, leur permettant d'intégrer le LLM dans leurs propres applications, produits ou services. 

D'autres exemples de services propriétaires d'IA générative sont Google Bard et Claude d'Anthropic.

Modèles open source

L'autre type de LLM est open source et disponible pour un usage commercial. La communauté open source a rapidement rattrapé les performances des modèles propriétaires et leurs modèles, qui peuvent être auto-hébergés ou fournis via des APIs de service cloud, peuvent être personnalisés par fine-tuning.

Les LLMs open source populaires incluent Llama 2 de Meta et MPT de MosaicML, qui a été acquis par Databricks.

Choisir le meilleur LLM d'IA générative

Comprendre les différences entre les LLM propriétaires et open source est la première étape, mais il y a encore beaucoup à considérer lors de la sélection d'un LLM pour les applications GenAI. La pérennité, le coût et l'exploitation des données comme avantage concurrentiel doivent tous être pris en compte lors du choix entre une API de fournisseur tiers fermée ou un LLM open source (ou affiné).

Bien que les services propriétaires LLM soient souvent très puissants, ils peuvent également soulever des préoccupations de gouvernance en raison de leur style "boîte noire", qui permet moins de supervision de leurs processus de formation et de leurs poids. Un autre risque est que les modèles propriétaires peuvent être dépréciés ou supprimés, ce qui rompra tous les pipelines ou index de vecteurs existants.

D'autre part, les modèles open source sont accessibles à l'acheteur indéfiniment. Ces modèles offrent également plus de personnalisation et de supervision, ce qui peut entraîner de meilleurs compromis performance-coût. Enfin, avec l'affinage futur des modèles open source, les organisations peuvent utiliser leurs données comme un avantage concurrentiel pour construire de meilleurs modèles que ceux disponibles publiquement.

Pourquoi y a-t-il des préoccupations concernant l'éthique de l'IA générative ?

Toute forme d'IA a tendance à soulever des préoccupations éthiques, alors que les humains luttent avec les implications des machines intelligentes. Alors, quels sont les enjeux éthiques de l'IA générative ? Pour commencer, cette technologie est relativement nouvelle et évolue également très rapidement. Même les développeurs dans ce domaine ne sont pas tout à fait sûrs de l'endroit où cela finira, mais à mesure que les modèles apprennent à produire des réponses plus humaines, il devient plus difficile de détecter les inexactitudes. 

Un problème qui a été identifié dans les modèles GenAI est les "hallucinations". C'est quand les chatbots inventent essentiellement des choses. Cela peut avoir de graves conséquences si un modèle est utilisé pour des choses comme des conseils médicaux ou des rapports précis.

De plus, si des biais inconscients ou délibérés, tels que le racisme ou l'homophobie, sont contenus dans les ensembles de données d'entraînement, ils peuvent être codés dans les modèles et influencer la sortie d'une IA. 

En dehors de la désinformation ou du contenu potentiellement nocif, il y a une préoccupation commune à propos des "deepfakes" - des images ou des vidéos numériquement forgées. Les cyberattaquants peuvent également utiliser l'IA générative pour imiter le style d'un expéditeur de confiance et rédiger des messages demandant des mots de passe ou de l'argent.

De plus, il est souvent difficile de retracer les sorties des modèles jusqu'aux auteurs, ce qui crée des problèmes de droits d'auteur et de plagiat. Cela est encore compliqué par le manque d'information sur certains ensembles de données - par exemple, avec les outils de génération d'images, les utilisateurs peuvent demander quelque chose "dans le style de l'artiste X", alors que "l'artiste X" n'a jamais consenti à ce que ses images fassent partie d'un ensemble de données.

D'autres préoccupations entourant GenAI et l'éthique incluent la durabilité, car la technologie nécessite une énorme puissance de calcul et d'électricité, ainsi que la façon dont elle peut donner du crédit à des affirmations selon lesquelles un reportage authentique est faux en encourageant la méfiance envers les mots et les images en ligne.

Comment pouvez-vous tester la qualité de l'IA ?

Comme nous l'avons mentionné dans la section précédente, l'IA générative peut parfois produire des résultats inexacts ou de faible qualité. Lorsque vous recherchez des outils et des cadres d'IA générative, les mesures de performance seront affichées dans les matériaux de vente, mais il est toujours préférable de vérifier par vous-même.

Les développeurs et les ingénieurs devraient tester le contenu généré par l'IA pour sa qualité et sa diversité afin de s'assurer que le modèle se comporte comme il a été formé à le faire. Il est relativement simple de voir s'il y a une affirmation "factuelle" erronée - mais il est plus délicat d'évaluer la qualité des productions artistiques ou créatives, qui sont subjectives.

Des outils comme l'API d'évaluation MLflow de Databricks peuvent être utilisés pour suivre les paramètres et les modèles de GenAI pour voir si les sorties sont suffisantes pour vos besoins. Cela peut également être combiné avec une évaluation humaine - par exemple, en utilisant votre propre jugement pour évaluer si une œuvre d'art ou de musique générée est attrayante. Parmi les mesures d'évaluation plus objectives, on compte le score d'inception, la distance d'inception de Fréchet (FID) et la vérité terrain.

Vérité de terrain

Cette méthode d'évaluation consiste à identifier la vérité de base sur laquelle l'IA générative a été formée. La vérité de terrain est essentiellement la "bonne" réponse à une requête, basée sur des informations connues pour être factuellement vraies. Elle doit être contenue dans les ensembles de données d'entraînement qui enseignent à l'IA comment arriver à une sortie fiable.

Par exemple, si vous entraîniez un modèle à reconnaître un contenu inexact, vous auriez besoin d'un grand ensemble de données de textes et d'images qui ont été classifiés comme vrais ou faux. Les développeurs peuvent mesurer la précision des réponses et des prédictions en prenant cet ensemble de données comme référence.

Cependant, comme les concepteurs d'IA sont ceux qui construisent la vérité de base, vous dépendez de leur diligence pour s'assurer que l'information est correcte. Idéalement, votre vérité de base proviendra directement de vos utilisateurs sous forme de feedback.

La surveillance de Databricks Lakehouse peut aider les professionnels de l'IA à s'assurer que leurs actifs sont de haute qualité, précis et fiables. La génération de rapports proactifs et les outils unifiés offrent une visibilité complète des données et des modèles pour une détection simple des anomalies, et les métriques intégrées du modèle en tant que juge peuvent être augmentées avec vos métriques de qualité personnalisées.

Métriques de qualité de l'IA

Les métriques de qualité de l'IA sont des mesures qui sont utilisées pour déterminer la performance d'un modèle d'IA générative. En plus des métriques traditionnelles de ML comme la précision et le rappel, des métriques personnalisées spécifiques à GenAI permettent une évaluation importante de ces modèles.  

Par exemple, la métrique de Distance d'Inception Fréchet (FID) évalue la qualité des images créées par l'IA générative. En comparant la distribution des images générées avec celle des vraies images utilisées pour entraîner l'outil, la distance entre la distribution des activations pour certaines couches profondes dans un classificateur peut être calculée. Un score de 0.0 est le meilleur résultat pour le FID.

Databricks a montré la valeur d'utiliser les LLMs comme juge de la qualité des chatbots. Ces techniques de pointe ont abouti à la nouvelle fonctionnalité MLflow modèle-comme-juge, qui peut comparer la sortie de texte de différents modèles d'IA pour évaluer la toxicité et la perplexité.

Défis actuels de l'IA générative

Bien que la technologie se développe rapidement, il reste encore des défis considérables à l'utilisation des modèles d'IA générative.

Mise à l'échelle de l'infrastructure

L'un des principaux défis du déploiement réussi de GenAI est la scalabilité. Comme nous l'avons appris, ces modèles ont besoin d'une énorme quantité de données de haute qualité et non biaisées pour générer les résultats souhaités.

Une infrastructure informatique à grande échelle et une puissance sont nécessaires pour le développement et la maintenance des modèles d'IA générative, ce qui nécessite à son tour des dépenses en capital significatives et une expertise technique. Cela a conduit à une demande croissante de solutions évolutives.

Complexités de l'optimisation

Les praticiens de l'apprentissage automatique peuvent également faire face à un certain nombre de défis de bas niveau qui résultent de la nécessité d'optimiser les modèles d'IA générative. Des exemples de ces complexités peuvent inclure l'effondrement de mode et les gradients disparus. 

L'effondrement de mode est un type d'échec qui se produit dans les modèles GAN lorsque le générateur apprend à répéter une sortie crédible que le discriminateur a acceptée au lieu de produire des sorties plus variées. Si le discriminateur n'apprend pas à rejeter des sorties similaires et répétées, chaque itération ultérieure du générateur passera par un petit ensemble de types de sortie.

Les gradients disparus peuvent se produire lorsque des couches supplémentaires avec certaines fonctions d'activation sont ajoutées aux réseaux neuronaux et font que le gradient de la fonction de perte devient trop petit. Un gradient trop petit empêche les poids et les biais des couches initiales de se mettre à jour correctement, ce qui fait échouer des éléments clés de la reconnaissance des données d'entrée et rend le réseau inexact.

La solution d'ajustement fin de Databricks fournit aux data scientists les outils pour aider à contrer ces défis. Une interface simplifiée pour les utilisateurs cache les techniques pour éviter les défis d'optimisation ci-dessus sous le capot, gérées automatiquement pour l'utilisateur.

Données disjointes, outils ML et AI

Des outils séparés et mal intégrés pour les données, l'apprentissage automatique classique et l'IA générative peuvent également créer des défis pour les data scientists. 

Des données de haute qualité sont essentielles pour la formation des modèles d'apprentissage automatique et de GenAI, et les sorties des modèles ML et GenAI doivent être réinjectées dans les pipelines de données. Il est nécessaire de traiter la gouvernance, la qualité et la mise en œuvre de manière holistique à travers les données et le ML/AI, et des plateformes séparées peuvent entraîner des frictions, une inefficacité et des coûts supplémentaires pour les organisations. 

La plateforme d'intelligence de données Databricks prend en charge les charges de travail de données de base, le ML classique et l'IA générative, et elle comprend l'utilisation des données tout au long. En combinant la structure ouverte et unifiée du lakehouse avec l'IA générative, notre Plateforme d'Intelligence de Données optimise les performances, simplifie l'expérience utilisateur et fournit une gouvernance et une confidentialité fortes et sécurisées.

À quoi ressemblera l'avenir de l'IA générative ?

Selon Gartner, l'IA générative devrait avoir un impact similaire à celui de la machine à vapeur, de l'électricité et de l'internet, devenant finalement une "technologie à usage général". C'est parce qu'il y a tellement d'applications potentielles pour la technologie.

Par exemple, des activités qui représentent jusqu'à 30% des heures actuellement travaillées dans l'économie américaine pourraient être automatisées d'ici 2030. Nous verrons également une augmentation des fournisseurs de logiciels intégrant les capacités de l'IA dans leurs outils.

Compréhensiblement, les humains s'inquiètent de perdre leur emploi au profit des machines, mais l'avenir de l'IA pourrait également voir de nombreux nouveaux emplois créés. Par exemple, les humains devront toujours développer et former des systèmes GenAI, y compris choisir le modèle le plus adapté pour une tâche donnée et rassembler des données d'entraînement pour évaluer les résultats.

L'adoption rapide de technologies comme ChatGPT souligne les défis de l'utilisation responsable de GenAI. Les pays et les états constatent déjà qu'ils ont besoin de nouveaux protocoles juridiques et de sécurité pour gérer les problèmes liés au droit d'auteur et aux menaces pour la cybersécurité, et ces technologies sont susceptibles d'être davantage réglementées à l'avenir.

Pendant ce temps, la Plateforme d'intelligence de données Databricks a intégré l'IA générative — ce qui facilite le maintien de la sécurité et de la gouvernance des données, ainsi que le suivi de la qualité des données et le réglage fin de vos modèles.

Au fur et à mesure que les architectures et les algorithmes d'entraînement deviennent plus avancés, les modèles d'IA génératifs deviendront plus puissants. Les organisations doivent se rappeler qu'avec le pouvoir vient la responsabilité, et elles doivent trouver l'équilibre entre l'automatisation et l'implication humaine.

Où puis-je trouver plus d'informations sur l'IA générative ?

Il existe de nombreuses ressources disponibles pour en savoir plus sur l'IA générative, y compris celles-ci :

Formation

  • Fondamentaux de l'IA générative: Suivez ce cours gratuit de Databricks et apprenez les bases de l'IA générative.
  • LLMs: Apprenez à connaître les modèles de base de A à Z (edX et Formation Databricks). Cette formation gratuite de Databricks se plonge dans les détails des modèles de base dans les LLMs.
  • LLMs: Améliorez vos compétences avec le cours Application Through Production (edX et Databricks Training). Cette formation gratuite de Databricks se concentre sur la façon de construire des applications axées sur le LLM avec les cadres les plus récents et les plus connus.

Sites

  • Page d'IA et d'apprentissage automatique de Databricks page

Ebooks

Blogs techniques

Vous pouvez également contacter Databricks pour planifier une démo et parler à quelqu'un de vos projets LLM ou en savoir plus sur les offres de Databricks pour les LLMs.