Les LLM sont essentiels pour l’avenir de toute organisation. Ils évoluent vers des modèles d'action plus larges (formés sur des données d'action) ou des modèles comportementaux plus vastes (formés sur des vidéos comportementales humaines) selon les besoins commerciaux. Par conséquent, les entreprises doivent adopter les LLMOps dès la phase pilote en impliquant les bonnes personnes, en développant des cadres politiques pertinents et en fournissant l'infrastructure et les données nécessaires.

Les LLMOps représentent un ensemble standardisé de pratiques que les entreprises suivent pour construire, déployer, gérer et surveiller des applications basées sur LLM. Cela aide à maximiser la valeur des projets LLM en améliorant l'efficacité des modèles, en réduisant les risques de déploiement, en optimisant l'utilisation des ressources, en facilitant la collaboration et en accélérant les déploiements évolutifs. Très peu d'entreprises participent à l'intégralité du cycle de vie des LLM, de la construction des modèles de base à leur utilisation pour des inférences réelles.

 

Le processus entier est complexe et coûteux car il implique un grand processus d'ingénierie des données, un environnement d'entraînement massif et un ensemble de compétences spécialisé. Par conséquent, le processus LLMOps pour l'ensemble du cycle de vie des LLM peut être logiquement divisé en deux phases :

  • Phase 1 des LLMOps : Construction des modèles
  • Phase 2 des LLMOps : Service des modèles
 

Phase 1 des LLMOps

Bien que de nombreuses entreprises utilisent des modèles de base pré-construits pour leurs cas d'utilisation commerciale, quelques organisations qui accumulent des données spécifiques à certains domaines souhaitent construire leurs propres modèles de base comme avantage concurrentiel. Quelques exemples incluent BloombergGPT, un modèle de base de 50 milliards de paramètres formé sur des données financières, et Salesforce Moirai, un modèle de série temporelle pour les prévisions sans apprentissage.

 

La construction de modèles de base à partir de zéro implique divers processus de la Phase 1 des LLMOps, tels que la préparation des données, la validation, l'entraînement du modèle, les techniques d'optimisation de l'entraînement, les tests de référence et les méthodes d'alignement IA.

 

Préparation des Données

Les données sont essentielles pour tout projet d'IA. Pour les projets d'IA générative, les modèles sont entraînés sur d'énormes quantités de données recueillies à partir de différentes sources sous différentes formes. Les sources de données varient des fichiers, bases de données en ligne, stockage d'objets, entrepôts de données et flux de données. Les formes de données peuvent être structurées, non structurées ou semi-structurées. La performance de tout modèle LLM est directement corrélée à la qualité et à la diversité des données d'entrée sur lesquelles il a été entraîné. La collecte, le prétraitement et la préparation des données sont vitaux pour toute chaîne opérationnelle LLM.

 

Gestion des Données pour les Projets ML

La gestion des données pour les projets ML est généralement gérée via des pipelines ETL (Extract, Transform, Load).

 

Les processus ETL impliquent l'extraction de différentes formes de données à partir de diverses sources, leur transformation par nettoyage, normalisation, changement de structure, puis leur chargement dans des cibles de stockage (bases de données, stockage d'objets, stockage cloud, systèmes de fichiers haute performance). Ces cibles de stockage pour les LLM reposent souvent sur un stockage entièrement flash (NVMe) comme architecture de stockage sous-jacente pour offrir un débit d'E/S élevé, c'est-à-dire des lectures et écritures plus rapides avec une faible latence.

 

Phase 2 des LLMOps

En raison de la complexité et du coût impliqués dans la construction de grands LLM, la plupart des entreprises exploitent des API de modèles open source ou propriétaires pour leurs cas d'utilisation commerciale. Par conséquent, la plupart des entreprises adoptent directement le processus de la Phase 2 des LLMOps, qui implique le service des modèles, la sécurité LLM et la surveillance.

 

Conclusion

Ce cours vous a présenté les concepts fondamentaux des LLMOps, ainsi que des exemples pratiques pour construire des applications basées sur LLM. Vous êtes maintenant prêt à explorer davantage ces frameworks et à les appliquer à vos propres projets !

Modifié le: dimanche 23 février 2025, 17:04