Plus
    ActualitésIntelligence ArtificielleClaude 3.7 Sonnet : le nouveau modèle d'IA d'Anthropic...

    Claude 3.7 Sonnet : le nouveau modèle d’IA d’Anthropic aurait coûté « quelques dizaines de millions » à développer

    -

    Alors que les géants de l’IA se livrent à une course effrénée pour développer les modèles les plus performants, une information surprenante vient d’être révélée concernant Claude 3.7 Sonnet, le tout nouveau modèle phare d’Anthropic. Contrairement aux centaines de millions dépensés par certains concurrents, ce modèle n’aurait coûté que « quelques dizaines de millions de dollars » à entraîner, tout en utilisant moins de 10^26 opérations en virgule flottante (FLOPs).

    Intégration d'Anthropic avec AWS
    Claude 3.7 Sonnet est désormais disponible sur la plateforme Amazon Bedrock, permettant aux développeurs d’intégrer facilement ce modèle de pointe. Source : Amazon Web Services

    Une clarification inattendue

    C’est le professeur Ethan Mollick de la Wharton School qui a relayé cette information lundi dans un post sur X (anciennement Twitter). Selon lui, les relations publiques d’Anthropic l’ont contacté pour préciser :

    « Sonnet 3.7 ne serait pas considéré comme un modèle à 10^26 FLOP et a coûté quelques dizaines de millions de dollars », tout en ajoutant que « les futurs modèles seront beaucoup plus grands ».

    Cette déclaration est particulièrement intéressante car elle suggère qu’Anthropic a réussi à optimiser drastiquement ses coûts d’entraînement, potentiellement en affinant des architectures existantes plutôt qu’en repartant de zéro.

    Un coût d’entraînement en baisse drastique

    Pour mettre ces chiffres en perspective, les modèles de pointe de 2023 avaient des coûts d’entraînement nettement plus élevés :

    Modèle Entreprise Coût d’entraînement estimé
    Claude 3.7 Sonnet Anthropic Quelques dizaines de millions $
    Claude 3.5 Anthropic Quelques dizaines de millions $
    GPT-4 OpenAI Plus de 100 millions $
    Gemini Ultra Google Environ 200 millions $

    Cette tendance semble indiquer une démocratisation de l’IA de pointe, alors même que les performances continuent de s’améliorer. Pour rappel, Dario Amodei, PDG d’Anthropic, avait déjà révélé dans un récent essai que Claude 3.5, le prédécesseur de Sonnet, avait également coûté « quelques dizaines de millions de dollars » à entraîner.

    Pourquoi cette baisse des coûts est significative

    Cette réduction des coûts d’entraînement pourrait avoir plusieurs explications :

    1. Optimisation des techniques d’entraînement : Anthropic a probablement développé des méthodes plus efficaces pour affiner les modèles existants.
    2. Meilleure architecture : Des innovations architecturales permettant d’obtenir plus de performances avec moins de paramètres.
    3. Infrastructures plus efficaces : L’utilisation de puces dédiées à l’IA comme les TPU de Google ou les puces custom d’AWS pourrait réduire les coûts d’entraînement.

    Il est important de noter que ces coûts ne prennent pas en compte les dépenses liées à la recherche fondamentale, aux tests de sécurité ou au développement des infrastructures nécessaires.

    Visualisation des deux modes opératoires
    Illustration des deux modes de fonctionnement de Claude 3.7 Sonnet : le mode standard pour des réponses rapides et le mode de réflexion étendue pour des problèmes complexes. Source : PromptZone

    Des performances qui défient les attentes

    Malgré son coût d’entraînement relativement modeste, Claude 3.7 Sonnet affiche des performances impressionnantes. Le modèle excelle dans de nombreux benchmarks, notamment en raisonnement, en codage et en compréhension de contextes longs. Sa capacité à traiter jusqu’à 200 000 tokens en entrée le place parmi les modèles les plus avancés actuellement disponibles.

    Le modèle propose également deux modes de fonctionnement distincts :

    • Un mode standard pour des réponses rapides et efficaces
    • Un mode de réflexion étendue permettant au modèle de résoudre des problèmes complexes en décomposant son raisonnement

    Cette double approche représente un compromis intelligent entre vitesse et précision, permettant aux utilisateurs de choisir le mode le plus adapté à leurs besoins.

    Des implications pour l’avenir de l’IA

    Si cette tendance à la baisse des coûts d’entraînement se confirme, elle pourrait avoir plusieurs conséquences majeures pour l’industrie :

    • Démocratisation de l’accès aux modèles de pointe : Des acteurs plus modestes pourraient entrer dans la course au développement de modèles performants.
    • Accélération du rythme d’innovation : Avec des cycles d’entraînement moins coûteux, les entreprises pourraient expérimenter davantage et itérer plus rapidement.
    • Focalisation sur l’alignement et la sécurité : Les ressources économisées sur l’entraînement pourraient être réinvesties dans les tests de sécurité et l’alignement des modèles.

    Cependant, Dario Amodei tempère cet optimisme en prévoyant que « les futurs modèles d’IA coûteront des milliards de dollars ». Cette projection s’explique notamment par l’émergence des modèles dits « de raisonnement », qui travaillent sur des problèmes pendant des périodes prolongées, augmentant significativement les coûts d’inférence.

    L’ère des modèles de raisonnement

    Les modèles comme Claude 3.7 Sonnet marquent le début d’une nouvelle ère pour l’IA générative, celle des « modèles de raisonnement ». Ces systèmes ne se contentent plus de générer du texte, mais peuvent désormais :

    • Décomposer des problèmes complexes en étapes
    • Appliquer différentes stratégies de résolution
    • Vérifier leurs propres résultats
    • Ajuster leur approche en fonction des erreurs détectées

    Cette évolution vers des modèles capables d’un raisonnement plus profond pourrait représenter un véritable changement de paradigme dans l’IA, mais s’accompagne également de défis techniques et économiques considérables.

    En conclusion, si Claude 3.7 Sonnet représente effectivement une avancée significative dans l’optimisation du rapport coût/performance des modèles d’IA, il ne s’agit probablement que d’une étape intermédiaire avant l’arrivée de modèles encore plus ambitieux – et potentiellement beaucoup plus coûteux – dans les mois et années à venir.

    Benjamin
    Benjaminhttps://www.technofeed.fr
    Passionné par les dernières technologies et notamment l'IA, je suis un amateur de tech curieux et enthousiaste qui explore les innovations qui façonnent notre monde numérique. Diplômé en communication digitale, je transforme ma fascination pour l'innovation technologique en récits captivants qui décryptent les avancées les plus prometteuses. Sur TechnoFeed, je m'attache à vulgariser des concepts complexes pour les rendre accessibles à tous, des passionnés de high-tech aux néophytes. Mon objectif : démystifier la technologie et montrer comment elle peut améliorer concrètement notre quotidien. Entre analyses pointues et regards humains, je vous invite à découvrir les technologies de demain à travers mes articles. Quand je ne suis pas plongé dans l'actualité tech, vous me trouverez probablement à tester de nouveaux outils SaaS, de nouvelles IA ou échanger avec des entrepreneurs passionnés. La technologie n'est pas qu'une histoire de machines, c'est avant tout une histoire d'hommes et de passion !

    Nos Dernières Actus

    Apple a empoché plus de 10 milliards de dollars de commissions sur l’App Store américain en 2024

    Selon une nouvelle analyse d’Appfigures, les revenus d’Apple tirés des commissions de l’App Store américain ont plus que doublé...

    L’IA de Microsoft réduit de 70% l’épuisement des médecins à l’Hôpital d’Ottawa

    L'Hôpital d'Ottawa révolutionne la prise en charge des patients grâce à une technologie d'intelligence artificielle qui transforme les consultations...

    Huawei largue Windows et dévoile son premier laptop sous HarmonyOS : indépendance technologique chinoise

    C'est désormais officiel. Huawei a présenté hier son tout premier ordinateur portable équipé de son système d'exploitation maison, HarmonyOS...

    VMware : Broadcom sort l’artillerie lourde pour mater les résistances au modèle abonnement

    Depuis son acquisition coup de poing de VMware pour 69 milliards de dollars fin 2023, Broadcom n’y est pas...

    Tendances

    Alibaba casse les codes avec ZeroSearch : l’IA qui se passe de Google pour fouiller le web

    Alibaba vient de dévoiler une innovation qui va secouer le petit monde de l'IA. Baptisée ZeroSearch, cette prouesse technique...

    Cloudflare explose les compteurs : contrat record de 100 millions de dollars et bond en bourse de 5 %

    Des résultats solides pour le premier trimestre Pour le trimestre clos au 31 mars, Cloudflare a publié un bénéfice par...

    Nos Guides Pratiques

    Que peut-on faire avec ChatGPT ? Exemples détaillés

    Que peut-on faire avec ChatGPT ? Un guide détaillé...

    Comment fonctionne ChatGPT ? Les dessous du chatbot le plus connu

    Comment fonctionne ChatGPT ? Le guide ultime Aujourd'hui, nous plongeons...

    A lire égalementÀ NE PAS RATER !
    Recommandés pour vous