Sommaire
Ah, les GPU ! Ces petites bêtes de performance sont devenues indispensables pour faire tourner et entraîner les modèles d’IA génératifs. Mais avec la demande qui explose, leur coût devient rapidement un frein pour de nombreuses entreprises. Heureusement, une nouvelle solution fait son apparition : les microclouds, un secteur alternatif en plein essor.
Qu’est-ce qu’un microcloud ?
Les microclouds (ou « alternative cloud ») sont des entreprises spécialisées dans la fourniture d’infrastructures GPU à la demande. Des acteurs comme CoreWeave, Lambda Labs, Voltage Park et Together AI sont à l’avant-garde de ce mouvement. CoreWeave, par exemple, a commencé dans le minage de cryptomonnaies avant de se repositionner comme un acteur majeur des services GPU dans le cloud.
Cette tendance illustre un changement de paradigme : de plus en plus d’entreprises se tournent vers les services d’hébergement de GPU dans le cloud, principalement à cause des coûts élevés et des défis techniques liés à l’installation et à la maintenance de cet équipement sur site. Et comme les grands fournisseurs de cloud public ne font pas vraiment de ristournes sur ces services de calcul, les microclouds offrent une alternative plus abordable pour de nombreuses entreprises.
Pourquoi ne pas rester avec les fournisseurs cloud traditionnels ?
Vous vous demandez sûrement pourquoi ne pas simplement utiliser les services GPU proposés par AWS, Google Cloud ou Microsoft Azure. La réponse est simple :
les microclouds sont souvent beaucoup plus économiques pour les projets d’IA nécessitant des GPU.
Le coût de location de GPU populaires comme le Nvidia A100 40GB peut être significativement inférieur sur CoreWeave ou une autre plateforme de microcloud, comparé à Azure ou Google Cloud (vérifiez toutefois les tarifs actuels, car cela reste une observation générale).
Attention aux pièges pour les entreprises
Malgré la vitalité de ce secteur, l’avenir reste quelque peu incertain. La viabilité de la croissance de ces fournisseurs dépend de leur capacité à garantir un approvisionnement constant en GPU de qualité, en grande quantité et à des prix compétitifs. De plus, avec les investissements massifs des grands acteurs du cloud dans des puces d’IA sur mesure, la pression concurrentielle pourrait s’intensifier et se traduire par des baisses de prix visant à conserver leur compétitivité.
Par ailleurs, si les GPU sont actuellement préférables pour les tâches d’IA génératrices en raison de leur vitesse et de leur capacité à effectuer de nombreuses opérations en parallèle, tous les workloads d’IA ne nécessitent pas forcément des GPU. Comme je l’ai déjà souligné, les GPU sont souvent un luxe superflu pour la plupart des tâches d’IA générative. De nos jours, ils sont plus un symbole de statut qu’une nécessité.
Les CPU peuvent encore être utilisés pour les tâches moins sensibles au temps, où une cadence plus lente est acceptable. Certains nouveaux processeurs de type « GPU-like » sont en développement et pourraient offrir un traitement plus adapté à l’IA générative, à un coût inférieur aux GPU actuels.
L’objectif principal est d’optimiser l’utilisation des ressources, y compris les processeurs, pour en faire le plus avec le moins.
Pour la plupart des cas d’utilisation de l’IA, les coûts ramèneront de nombreuses entreprises à la réalité, et l’engouement actuel retombera rapidement.
Un avenir prometteur pour les microclouds
Voilà pour la mise en garde aux entreprises qui pourraient se laisser aveugler par l’effervescence actuelle. Mais dans l’immédiat, les perspectives pour les microclouds sont optimistes. Les analystes s’attendent à ce que le domaine en pleine expansion de l’IA générative continue d’alimenter la demande, ce qui devrait encourager l’émergence de nouvelles start-ups spécialisées dans le cloud GPU.
Mon conseil ?
Si vos prochains projets nécessiteront des GPU, alors les solutions basées sur ces puces devront être envisagées. Le coût du changement, du moins pour l’instant, ne devrait pas être un facteur déterminant pour la plupart de ces architectures.
Ces nouveaux acteurs pourraient représenter une rude concurrence pour les géants du cloud établis, notamment pour les clients ouverts à l’adoption de technologies plus récentes et moins chères pour gérer leurs environnements multiclouds. Les entreprises peinent à maîtriser les coûts élevés du cloud, qui dépassent largement leurs budgets. Une alternative moins chère sera donc la bienvenue.
Il y a près de deux décennies, les principaux acteurs du cloud computing ont commencé à émerger. Entre 2012 et 2016, nous sommes passés d’une trentaine d’entreprises cloud à seulement une poignée, le marché s’étant normalisé. Je m’attends à observer le même schéma ici.
Toute nouvelle arrivante fait face à des défis majeurs. Elles pourraient perdre leur financement, être écrasées par des acteurs plus importants, ou subir une myriade d’autres catastrophes imprévisibles. Il est probable qu’elles soient rachetées à terme et combinées à un système cloud plus vaste, ou que certaines de ces nouvelles entreprises fassent alliance. Certains de ces scénarios représentent des risques pour les entreprises, mais la plupart n’en présentent pas.
En fin de compte, l’avenir des microclouds reste prometteur. Ils apportent une alternative bienvenue aux services GPU traditionnels, souvent trop coûteux pour de nombreuses entreprises. Bien que certaines incertitudes demeurent, ce secteur devrait continuer à se développer, stimulé par la croissance fulgurante de l’IA générative. Une chose est sûre : les GPU resteront au cœur de cette révolution numérique, et les microclouds offrent un moyen d’y accéder à moindre coût.
Y a-t-il une place pour tout le monde ?
La réponse est oui, du moins pour l’instant. Les microclouds comme CoreWeave ou Lambda Labs comblent un vide en proposant des GPU à des tarifs plus abordables que les géants du cloud. Cependant, ces derniers ne resteront probablement pas les bras croisés face à cette concurrence naissante. On peut s’attendre à ce qu’ils ajustent leurs offres pour rester compétitifs, voire qu’ils se lancent eux-mêmes dans le développement de solutions « microcloud » à terme.
Au final, c’est une excellente nouvelle pour les entreprises et les développeurs qui auront accès à des ressources GPU puissantes à moindre coût. Cette démocratisation de l’IA générative ne peut qu’accélérer l’innovation et l’adoption de ces technologies prometteuses. Alors, prêt à explorer les possibilités offertes par les microclouds ?
Résumé / TL;DR
- Les microclouds (ou « alternative cloud ») sont des fournisseurs spécialisés dans les services GPU à la demande
- Ils offrent souvent des tarifs plus avantageux que les géants du cloud pour les projets d’IA nécessitant des GPU
- Bien que prometteurs, les microclouds devront faire face à des défis comme l’approvisionnement en GPU et la concurrence
- Ce secteur émergent devrait continuer à se développer, stimulé par la croissance de l’IA générative
- Les microclouds représentent une alternative bienvenue pour accéder à des ressources GPU puissantes à moindre coût