Plus
    ActualitésIntelligence ArtificielleAlibaba ouvre grand les portes de l'IA générative avec...

    Alibaba ouvre grand les portes de l’IA générative avec Wan 2.1, son nouveau modèle open source

    -

    Alibaba frappe un grand coup dans le monde bouillonnant de l’IA générative. Le géant chinois du e-commerce vient de libérer en open source Wan 2.1, sa toute dernière famille de modèles d’intelligence artificielle capables de générer images et vidéos. Une annonce qui résonne comme un défi lancé aux ténors du secteur, notamment OpenAI, et qui confirme les ambitions dévorantes d’Alibaba dans ce domaine.

    De Wanx à Wan : l’ambition d’une IA généraliste

    Souvenez-vous, en janvier 2024, Alibaba levait le voile sur Wanx, un premier modèle prometteur. Quelques mois plus tard, re-baptisé simplement « Wan » (abréviation de « Wan AI » pour « Wide Artificial Intelligence »), le projet prend une nouvelle dimension. Ce changement de nom n’est pas anodin. Il traduit la volonté d’Alibaba de ne pas se cantonner à un seul type de génération, mais bien de proposer une solution polyvalente, capable de jongler avec différents formats et applications. Wan 2.1 n’est donc pas qu’une simple mise à jour, c’est l’incarnation de cette ambition élargie.

    Représentation d'Alibaba dans le secteur de l'IA
    Alibaba investit massivement dans l’IA avec la sortie de son modèle Wan 2.1, poursuivant sa stratégie d’innovation technologique. Source : Invezz

    Un modèle multi-talents accessible à tous

    Alors, que peut-on faire concrètement avec Wan 2.1 ? La réponse est simple : beaucoup de choses ! Ce modèle se révèle être un véritable couteau suisse de l’IA générative. Il maîtrise la génération vidéo (Text-to-Video ou T2V) et image (Image-to-Video ou I2V), bien sûr, mais permet aussi l’édition vidéo, la génération d’images à partir de texte (T2I) et même la synthèse vocale (Voice-to-Animation ou V2A). Une polyvalence impressionnante qui ouvre un champ des possibles immense pour les développeurs et les créateurs.

    Interface du modèle d'IA Wan 2.1
    Le modèle Wan 2.1, nouvelle solution open-source d’Alibaba pour la génération vidéo et image, disponible sur HuggingFace. Source : HuggingFace

    Côté technique, Alibaba a mis l’accent sur l’accessibilité. Wan 2.1 a été optimisé pour fonctionner sur la plupart des GPU avec une consommation de VRAM raisonnable (8,19 Go). Fini les configurations matérielles hors de prix, l’IA générative devient accessible au plus grand nombre. Autre atout de taille : la prise en charge simultanée du chinois et de l’anglais. Une ouverture linguistique stratégique pour conquérir un public international. Enfin, son VAE (Variational Auto-Encoder) vidéo permet d’encoder et de décoder des vidéos en 1080p avec une précision temporelle remarquable, promettant des résultats de haute qualité.

    Caractéristique Description
    Fonctionnalités T2V, I2V, Édition vidéo, T2I, V2A
    Consommation VRAM 8,19 Go
    Langues Chinois, Anglais
    Résolution vidéo 1080p
    Algorithme de compression VAE (Variational Auto-Encoder) performant
    Disponibilité ModelScope, Hugging Face (Wan-AI/Wan2.1-T2V-14B)

    Un pari stratégique sur l’open source

    La décision de diffuser Wan 2.1 en open source est un choix fort. Alibaba ne se contente pas de dévoiler une technologie innovante, il la partage avec le monde entier. Cette stratégie vise à fédérer une communauté de développeurs autour de ses solutions, stimulant ainsi l’innovation et créant un écosystème dynamique. Un pari audacieux qui pourrait s’avérer payant à long terme, notamment pour Alibaba Cloud, la branche cloud computing du groupe, qui ambitionne de devenir un leader mondial du secteur.

    La bataille de l’IA fait rage en Chine

    Le lancement de Wan 2.1 intervient dans un contexte de concurrence acharnée sur le marché de l’IA, notamment en Chine. Des acteurs comme DeepSeek rivalisent d’ingéniosité pour développer des modèles open source capables de concurrencer les géants américains. Alibaba, avec ses investissements colossaux (52 milliards de dollars sur trois ans dans l’IA et le cloud), entend bien rester dans la course.

    QwQ-Max, le prochain atout d’Alibaba ?

    L’entreprise ne compte pas s’arrêter là. En parallèle de Wan 2.1, elle a dévoilé une version préliminaire de QwQ-Max, un modèle axé sur le raisonnement. Ce futur projet, également destiné à être open source, témoigne de la volonté d’Alibaba de couvrir l’ensemble du spectre de l’IA générative, de la création multimédia à la réflexion complexe.

    Des défis et un avenir prometteur

    Le chemin est encore long pour Alibaba. Maintenir son avance technologique face à une concurrence toujours plus agressive sera un défi permanent. Cependant, en misant sur l’open source et en proposant des outils performants et accessibles, le géant chinois se donne les moyens de ses ambitions. L’avenir nous dira si cette stratégie audacieuse portera ses fruits.

    Benjamin
    Benjaminhttps://www.technofeed.fr
    Passionné par les dernières technologies et notamment l'IA, je suis un amateur de tech curieux et enthousiaste qui explore les innovations qui façonnent notre monde numérique. Diplômé en communication digitale, je transforme ma fascination pour l'innovation technologique en récits captivants qui décryptent les avancées les plus prometteuses. Sur TechnoFeed, je m'attache à vulgariser des concepts complexes pour les rendre accessibles à tous, des passionnés de high-tech aux néophytes. Mon objectif : démystifier la technologie et montrer comment elle peut améliorer concrètement notre quotidien. Entre analyses pointues et regards humains, je vous invite à découvrir les technologies de demain à travers mes articles. Quand je ne suis pas plongé dans l'actualité tech, vous me trouverez probablement à tester de nouveaux outils SaaS, de nouvelles IA ou échanger avec des entrepreneurs passionnés. La technologie n'est pas qu'une histoire de machines, c'est avant tout une histoire d'hommes et de passion !

    Nos Dernières Actus

    Apple a empoché plus de 10 milliards de dollars de commissions sur l’App Store américain en 2024

    Selon une nouvelle analyse d’Appfigures, les revenus d’Apple tirés des commissions de l’App Store américain ont plus que doublé...

    L’IA de Microsoft réduit de 70% l’épuisement des médecins à l’Hôpital d’Ottawa

    L'Hôpital d'Ottawa révolutionne la prise en charge des patients grâce à une technologie d'intelligence artificielle qui transforme les consultations...

    Huawei largue Windows et dévoile son premier laptop sous HarmonyOS : indépendance technologique chinoise

    C'est désormais officiel. Huawei a présenté hier son tout premier ordinateur portable équipé de son système d'exploitation maison, HarmonyOS...

    VMware : Broadcom sort l’artillerie lourde pour mater les résistances au modèle abonnement

    Depuis son acquisition coup de poing de VMware pour 69 milliards de dollars fin 2023, Broadcom n’y est pas...

    Tendances

    Alibaba casse les codes avec ZeroSearch : l’IA qui se passe de Google pour fouiller le web

    Alibaba vient de dévoiler une innovation qui va secouer le petit monde de l'IA. Baptisée ZeroSearch, cette prouesse technique...

    Cloudflare explose les compteurs : contrat record de 100 millions de dollars et bond en bourse de 5 %

    Des résultats solides pour le premier trimestre Pour le trimestre clos au 31 mars, Cloudflare a publié un bénéfice par...

    Nos Guides Pratiques

    Comment fonctionne ChatGPT ? Les dessous du chatbot le plus connu

    Comment fonctionne ChatGPT ? Le guide ultime Aujourd'hui, nous plongeons...

    Que peut-on faire avec ChatGPT ? Exemples détaillés

    Que peut-on faire avec ChatGPT ? Un guide détaillé...

    A lire égalementÀ NE PAS RATER !
    Recommandés pour vous