World Labs vient de lancer Marble, le tout premier « modèle monde » commercial, marquant une nouvelle étape dans la course à l’IA spatiale et à « l’AGI », l’intelligence artificielle générale. Cette technologie, désormais accessible au grand public, entend transformer la création d’environnements 3D et positionner la startup fondée par Fei-Fei Li dans le peloton de tête d’un secteur en pleine effervescence.
Marble : Un lancement public qui accélère la course aux « modèles mondes » IA
Présenté en bêta privée il y a deux mois, Marble est disponible publiquement depuis le 12 novembre 2025. La société World Labs propose un modèle capable de générer des environnements 3D complets à partir d’entrées variées : texte, images, vidéos, panoramas ou plans 3D. L’entreprise veut dépasser la simple génération d’images ou de vidéos pour permettre aux machines de « fabriquer des mondes » explorables.
Marble transforme ces entrées en scènes complètes grâce à une analyse de la géométrie implicite, des volumes ou des matériaux, avant de reconstruire un environnement navigable. Il faut toutefois garder à l’esprit qu’elle invente ce qui n’est pas décrit par le prompt ou les visuels.
Justin Johnson, cofondateur de World Labs, décrit cette approche à TechCrunch comme étant une rupture technologique :
« C’est une toute nouvelle catégorie de modèle qui génère des mondes 3D, et ça va être de mieux en mieux au fil du temps. »
Contrairement à d’autres modèles encore limités à des démonstrations ou à des prototypes, Marble produit des mondes persistants et téléchargeables, déjà accessibles au public.
Un outil d’intelligence artificielle qui donne davantage de contrôle aux créateurs
L’une des ambitions majeures de World Labs est d’offrir un véritable contrôle créatif aux utilisateurs. Johnson insiste sur ce point :
« Il devrait toujours exister une solution rapide pour générer quelque chose… Mais vous devriez aussi pouvoir aller beaucoup plus loin et garder un grand contrôle sur ce que vous générez. Vous ne voulez pas que la machine prenne simplement le volant et vous ôte toute créativité. »
Marble propose plusieurs fonctions novatrices dans ce domaine. Contrairement à la bêta, on peut désormais charger plusieurs images ou vidéos pour rendre compte d’un espace, et faire en sorte que le modèle invente le moins possible d’éléments.
L’outil Chisel, un éditeur 3D, permet ausi de poser une structure spatiale grossière (blocs, murs, plans), à laquelle on ajoute un prompt textuel, pour guider l’IA dans la création du monde. Celle-ci est réalisée en dissociant la structure du style, un peu comme un code HTML séparé de sa « feuille de styles », pour un site web. Les utilisateurs peuvent également déplacer directement des objets : « Je peux simplement entrer dans le monde, saisir le bloc 3D qui représente le canapé et le déplacer ailleurs », précise Johnson.

D’autres fonctionnalités renforcent cette logique : la possibilité d’agrandir un espace existant (« Click & Expand ») ou de fusionner plusieurs mondes via un “composer mode”. Une fois l’univers terminé, on peut l’exporter sous forme « d’éclaboussures gaussiennes » (Gaussian splats), de maillage triangulaire 3D ou même de vidéo. Le premier format consiste en une sorte de nuage de particules très précis, proche du rendu dans l’IA, tandis que le second est couramment utilisé pour les jeux vidéo.
Le modèle s’adresse autant aux créateurs de jeux vidéo, d’effets visuels ou d’expériences VR qu’aux usages industriels liés à la robotique ou à la simulation. Les mondes générés, notamment en maillage triangulaire, sont compatibles avec Unity, Unreal Engine, Blender, mais aussi explorables en réalité virtuelle avec les casques Vision Pro et Quest 3.
Les « world models », nouvelle stratégie des géants de l’IA pour atteindre l’AGI
L’émergence de Marble s’inscrit dans une tendance plus large : la montée en puissance des modèles mondes. Google DeepMind, Meta ou Nvidia développent eux aussi des systèmes capables de comprendre et de prédire des environnements physiques à partir de vidéos ou de données robotiques.
Mais, comparés à Marble de World Labs, les concurrents semblent moins avancés. Les start-ups comme Decart et Odyssey en sont à la phase de simples démos, et Genie 3 de Google est pour le moment limité à la recherche et à une sélection de testeurs. De plus, Marble réduirait les déformations typiques des systèmes qui génèrent un univers au fur et à mesure de l’exploration, comme ces modèles précités, ou RTFM, un autre système de World Labs.
Ces modèles sont perçus comme une voie potentielle vers une intelligence plus générale, qui pourrait se rapprocher ou dépasser celle de l’humain (« l’AGI »), alors que les progrès des LLM comme ChatGPT semblent ralentir. Ce principe repose sur l’assertion que l’intelligence des êtres vivants s’est formée sur la compréhension spatiale de leur environnement, avant l’arrivée du langage. Ou tout du moins, que le langage seul n’est pas suffisant pour développer un tel niveau d’intelligence.
De plus, les world models, en cherchant à comprendre le monde réel, seraient plus réalistes d’un point de vue des lois physiques que les modèles actuels de génération de vidéos, comme Sora. Ils sont entraînés sur de grosses quantités de données du monde réel, comme les plus de 10 millions de lieux cartographiés par Niantic, via ses jeux tels que Pokémon Go.
Yann Le Cun quitte Meta : que va devenir son « world model » V-JEPA ?
Yann Le Cun, pionnier français de l’IA actuellement chez Meta, défend depuis longtemps cette approche. Il met en avant la capacité de ces systèmes à raisonner sur le monde réel, contrairement à ceux centrés sur le texte. Le chercheur a entraîné son modèle V-JEPA sur des vidéos brutes afin de reproduire la manière dont les enfants, ou bien les animaux, apprennent en observant.
Mais Le Cun devrait quitter prochainement Meta pour pouvoir continuer dans cette voie, justement à cause de divergences d’opinion quant au futur de l’IA. Mark Zuckerberg souhaiterait en effet rapidement rattraper son retard dans le domaine des grands modèles de langage, et venir concurrencer les LLM comme ChatGPT. Le Cun a au contraire une vision à long terme, estimant qu’il pourrait mettre 10 ans à atteindre une IA supérieure, basée sur un modèle monde ; seule solution, selon lui, pour dépasser les limites actuelles.
Pour certains experts, comme la chaîne Vision IA, Meta fait d’ailleurs une grosse erreur en laissant Le Cun s’en aller. Le marché potentiel pourrait être en effet colossal. Pour Nvidia, les modèles mondes pourraient représenter une opportunité de l’ordre de « 100 billions de dollars » si ces systèmes parviennent à comprendre et à agir dans le monde physique. L’entreprise de Jensen Huang fait d’ailleurs partie des investisseurs de World Labs, qui est parvenue à lever, en septembre 2024, 230 millions de dollars.
Avec Marble, World Labs ouvre au public une IA de modèle monde avancée, combinant génération 3D, outils d’édition et export vers des formats professionnels. Cette sortie intervient alors que les world models deviennent un nouvel axe stratégique pour l’ensemble du secteur, des startups aux géants de l’IA. Reste désormais à savoir si ces technologies permettront aux machines d’acquérir la “spatial intelligence” que Fei-Fei Li et Le cun considèrent comme indispensable pour la prochaine génération d’intelligences artificielles.
Certains liens de cet article peuvent être affiliés.
