La France compte un nouvel acteur dans l’intelligence artificielle. Basée à Paris, la start-up Gradium, spécialisée dans l’IA vocale, a officialisé son lancement début décembre et annoncé une levée de fonds de 60 millions d’euros. Issue en partie du laboratoire de recherche Kyutai, l’entreprise ambitionne de commercialiser des technologies vocales capables de rivaliser avec les grands acteurs américains du secteur. Neil Zeghidour, directeur général de Gradium et cofondateur de Kyutai, en a dit plus sur le projet sur BFM Business, ce mardi 16 décembre.
Gradium : une levée de fonds de 60 millions d’euros pour commercialiser l’IA vocale
Gradium développe des modèles de base destinés à intégrer l’IA vocale dans des environnements variés, comme les jeux vidéo, les logiciels de centres d’appels, les podcasts personnalisés ou les applications d’apprentissage de langues. Les modèles sont déjà disponibles en cinq langues (anglais, français, allemand, espagnol et portugais) et l’entreprise prévoit d’en ajouter d’autres.
Début décembre, la start-up a bouclé une première levée de fonds de 60 millions d’euros, l’une des plus importantes de l’année dans la French Tech. Celle-ci a été menée par FirstMark Capital et Eurazeo, avec la participation notamment de DST Global Partners, Amplify Partners, ainsi que de plusieurs investisseurs individuels, dont Eric Schmidt, ancien PDG de Google, Xavier Niel et Rodolphe Saadé (CMA CGM). Ces trois derniers sont également les mécènes du laboratoire Kyutai.

Pour Neil Zeghidour, cette levée doit permettre de transformer des avancées scientifiques en produits exploitables à grande échelle. Dans des propos rapportés par Le Monde, le PDG estime que « le potentiel de l’IA vocale reste largement inexploité » et que la voix pourrait devenir « l’interface principale entre humains et machines ».
Un phénomène confirmé par une récente étude de Jabra et la London School of Economics, et sur lequel tenteraient de se placer des géants de la tech comme OpenAI, avec des objets connectés. Un bras de fer qui ne fait pas peur à Zeghidour :
« Même en étant petit et à Paris, on peut être dans la course mondiale et en concurrence directe avec OpenAI ou Meta », a-t-il assuré.
Une équipe issue de Google DeepMind, Meta et du laboratoire Kyutai
Gradium est la première start-up issue du laboratoire de recherche Kyutai, fondé en 2023 à Paris pour développer des modèles d’IA multimodaux open source. Son équipe dirigeante rassemble quatre profils issus de la recherche de pointe. Le PDG Neil Zeghidour (ancien de Google DeepMind et Meta) est épaulé du directeur scientifique Alexandre Défossez (Meta), du directeur de la technologie Olivier Teboul (Google Brain) et du directeur informatique Laurent Mazaré (Google DeepMind).
Avant la création de Gradium, plusieurs membres de l’équipe avaient contribué chez Kyutai au développement de modèles d’IA vocale, des « audio large models », comme Moshi, le traducteur Hibiki ou Unmute. Ces travaux ont suscité l’intérêt d’acteurs industriels, comme le souligne Neil Zeghidour : « Nous avons commencé à recevoir des marques d’intérêt de pas mal de grosses boîtes dont on n’aurait jamais imaginé qu’elles contacteraient une organisation à but non lucratif pour des solutions de voix. »
Toutefois, le cadre non lucratif de Kyutai limitait la possibilité de répondre à ces demandes, notamment sur des aspects comme la qualité audio ou le multilinguisme. Gradium a donc été fondée dans l’idée de commercialiser, pour divers secteurs, ces solutions d’IA vocales.
« Devenir le champion mondial de l’IA vocale » : les atouts de Gradium
Gradium mise avant tout sur des IA vocales capables de fonctionner en « speech to speech », c’est-à-dire sans transcription textuelle intermédiaire, afin de réduire la latence, pour des conversations « en temps réel ». Un atout face à des concurrents comme ChatGPT, dont les fonctions vocales sont, a contrario, plus lentes.
« Dans la voix, on a l’opportunité de devenir le champion mondial, y compris devant les Big Tech. C’était impossible de ne pas saisir cette opportunité », a assuré Neil Zeghidour sur BFM.
De plus, comme le PDG nous l’explique sur BFM, les modèles de voix sont « beaucoup plus compacts et donc beaucoup plus frugaux à entraîner » que les LLM, qui « nécessitent des dizaines de milliers de machines » et énormément de puissance de calcul. Un argument qu’il met en avant pour convaincre les investisseurs de leur capacité à venir concurrencer les géants de la tech américains, même sans disposer de leurs ressources techniques et financières.
En parallèle, l’entreprise veut aussi proposer des modèles passant par du texte, qui faciliterait, selon elle, la personnalisation par les clients. Les premiers cas d’usage, sur lesquels travaillerait actuellement Gradium, concernent l’interprétariat, les transcriptions de rendez-vous médicaux, les sondages, l’apprentissage des langues ou encore le jeu vidéo mobile.
La start-up met également en avant la rapidité de son développement :
« En trois mois, nous avons entraîné des modèles, créé une infrastructure, acquis des clients, atteint un niveau où l’on est déjà compétitif avec des boîtes qui ont plusieurs années d’existence », affirme le PDG, cité par Les Echos.
Les liens avec Kyutai restent étroits : les équipes partagent encore les mêmes locaux, et Alexandre Défossez conserve un rôle au sein du laboratoire. Kyutai détient par ailleurs des parts dans Gradium, un montage que son dirigeant considère comme vertueux : « Cela crée un écosystème où on peut avoir une recherche fondamentale pérennisée sur le long terme et des boîtes qui ont accès à de la technologie de haut niveau. »
Avec Gradium, la scène parisienne de l’intelligence artificielle s’enrichit d’un nouvel acteur positionné sur l’IA vocale, un segment encore peu occupé en Europe. Sans oublier l’arrivée très attendue de Yann LeCun, pionnier de l’IA, parti de chez Meta pour développer son projet de « world models ». Avec ces jeunes pousses de la tech françaises, les pouvoirs publics espèrent ainsi voir notre position se renforcer face à la domination américaine et chinoise. Et vous, pensez-vous que ces autres approches de l’IA peuvent faire la différence ?
Certains liens de cet article peuvent être affiliés.

C’est fascinant de voir une start-up comme Gradium émerge à Paris. L’IA vocale a vraiment le potentiel de transformer le secteur médical en assistante des chirurgiens. J’espère qu’elle réussira!
L’émergence de Gradium est prometteuse pour l’IA vocale en Europe. Cela pourrait réellement transformer nos interactions homme-machine, surtout pour des applications en temps réel et multilingues.
Cet article souligne l’importance d’une approche éthique dans le développement de l’IA vocale. Il est essentiel que la technologie réponde à nos besoins sociétaux sans nuire à nos valeurs fondamentales.
La levée de fonds de Gradium est impressionnante. Leur approche d’intégration de l’IA vocale dans divers secteurs pourrait redéfinir la concurrence en Europe contre les géants américains.