+13 millions d’euros en seed et un cap assumé sur l’open source : à Paris, Probabl officialise une levée qui propulse la spin-off de l’Inria dans la cour des bâtisseurs d’infrastructures logicielles européennes. « L’open gagne toujours », martèle son CEO Yann Lechelle, qui veut transformer un machine learning artisanal en avantage compétitif mesurable pour les entreprises.

Levée de 13 M€ : Probabl accélère l’open source industriel

Probabl annonce un tour de seed de 13 millions d’euros, co-mené par Serena et Capital Fund Management, avec la participation de Mozilla Ventures et du fonds French Tech Souveraineté opéré par Bpifrance dans le cadre de France 2030. La société, fondée en 2023, totalise désormais 18,5 millions d’euros levés depuis sa création. L’opération, officialisée le 16 octobre 2025, figure parmi les plus importantes amorçages européens pour un modèle COSS (Commercial Open Source Software) focalisé sur le machine learning (Maddyness, 16 octobre 2025).

Le tour vise à accélérer le passage à l’échelle de solutions open source dédiées à l’IA d’entreprise, en renforçant produits, équipes et rayonnement international. Probabl opère depuis Paris, Saclay, Sophia Antipolis et Berlin. Cette géographie assume une stratégie européenne centrée sur la souveraineté technologique et la proximité avec les écosystèmes académiques et industriels.

Pour Yann Lechelle, la feuille de route est claire : « Nous construisons une force unique dans l’open source pour aider les entreprises à véritablement s’approprier leur data science ». La startup veut faire de l’explicabilité et de la reproductibilité des standards opérationnels, compatibles avec les impératifs de conformité et de traçabilité.

Calendrier et investisseurs de la levée

Montant : 13 millions d’euros. Date : 16 octobre 2025. Co-lead : Serena et Capital Fund Management. Participants : Mozilla Ventures, French Tech Souveraineté via Bpifrance sous France 2030. Cumul de financements depuis 2023 : 18,5 millions d’euros. Objectif : industrialiser un socle open source d’IA et déployer à l’international.

Métriques Valeur Évolution
Montant du seed 13 M€ n/a
Financements cumulés depuis 2023 18,5 M€ n/a
Téléchargements de Scikit-learn Plus de 2,5 milliards Adoption croissante
Année de création de Probabl 2023 n/a
Implantations Paris, Saclay, Sophia Antipolis, Berlin Extension internationale

Scikit-learn, actif stratégique : adoption mondiale et gouvernance

Au cœur du projet, Scikit-learn s’impose comme la bibliothèque de machine learning la plus utilisée au monde, initiée en 2007 en Python et désormais éditée et gérée par Probabl, spin-off officielle de l’Inria. Son succès s’explique par un socle d’algorithmes robustes, une API stable et une culture de documentation qui facilite l’adoption par les équipes data et les DSI.

La bibliothèque dépasse les 2,5 milliards de téléchargements, avec des usages qui irriguent le secteur financier, l’industrie et la tech grand public. Des acteurs du CAC 40 comme BNP Paribas l’emploient, tout comme des entreprises américaines telles que Nvidia et Netflix. Selon Sifted, le périmètre d’adoption s’étend également à Spotify et JP Morgan, confirmant une empreinte internationale.

BNP Paribas et Nvidia : usages en production

En France, les opérations data des grands groupes s’appuient sur des briques open source éprouvées lorsqu’elles combinent fiabilité, reproductibilité et compatibilité réglementaire. Scikit-learn répond à ces critères en offrant un cadre clair pour l’apprentissage statistique, la sélection de modèles, la validation et la mise en production contrôlée. Chez des entreprises comme BNP Paribas ou Nvidia, l’intérêt tient à la stabilité et à l’interopérabilité de l’écosystème Python.

Spotify et JP Morgan : échelle mondiale

Les cas d’usage cités par Sifted, notamment Spotify et JP Morgan, illustrent la capacité de Scikit-learn à fonctionner à grande échelle pour des pipelines de data science distribués. Ce positionnement renforce la thèse de Probabl : partir d’un socle méthodologique clair, reproductible et documenté pour réduire les coûts d’intégration et de maintenance.

Trois facteurs expliquent sa résilience : API stable qui limite la dette technique, écosystème outillé autour de Python pour l’intégration avec les data lakes et orchestrateurs, culture qualité héritée de l’Inria avec des jeux de tests rigoureux. Résultat : une bascule plus rapide du POC à la production, un avantage décisif pour les DSI.

Fermé vs open source : la thèse de Yann Lechelle

Le débat entre modèles propriétaires et open source structure aujourd’hui la concurrence en IA. Yann Lechelle revendique un choix net : « L’open source est la colonne vertébrale de l’IA » et « l’ouverture finit par triompher des enclos propriétaires ». Le PDG de Probabl fait le parallèle avec le World Wide Web face aux portails fermés et Linux face aux systèmes d’exploitation propriétaires, et voit dans les modèles open weights un nouvel exemple de bascule de marché.

Le message est cohérent avec la trajectoire de la startup : inscrire une chaîne de valeur industrielle sur du logiciel ouvert, en capitalisant sur l’adoption des développeurs, les effets réseau et la transparence des processus d’entraînement. L’ambition affichée est de concilier indépendance technologique et performances business.

Les open weights sont des modèles dont les poids sont publiquement accessibles, permettant audit, fine-tuning et déploiement on-premise ou cloud sans dépendre d’un service fermé. Pour les entreprises, l’intérêt réside dans la maîtrise du cycle de vie, la réduction des coûts de sortie et l’alignement avec les politiques de souveraineté.

Ce positionnement ne nie pas l’existence de modèles fermés performants. Il met toutefois l’accent sur la traçabilité, la reproductibilité et la gouvernance des modèles, des critères clés dans des environnements soumis à des exigences réglementaires et à des audits fréquents.

Écosystème français de l’IA : financements publics et cap France 2030

La dynamique de Probabl s’inscrit dans un écosystème français robuste. La Direction générale des Entreprises recense 590 startups dédiées à l’IA dans l’Hexagone, dont 16 licornes, et 1,5 milliard d’euros d’aides publiques en 2022 pour soutenir l’innovation et la mise sur le marché de produits IA (DGE).

Lancé en 2021, le plan France 2030 vise la montée en puissance de la France sur l’IA et la robotique. À VivaTech 2024, trois dispositifs ont été présentés : un programme de recherche de 30 millions d’euros en robotique, un appel à manifestation d’intérêt Robotique et machine intelligente, et un futur instrument Pionnier de l’IA dédié aux innovations de rupture. Bpifrance, au travers du fonds French Tech Souveraineté, s’inscrit dans ce déploiement et soutient la levée de Probabl au titre de la souveraineté technologique.

  • Recherche : 30 M€ fléchés sur la robotique pour soutenir les laboratoires et leurs partenariats industriels.
  • AMI Robotique et machine intelligente : identification de projets à fort potentiel de transfert industriel.
  • Pionnier de l’IA : futur dispositif destiné aux innovations de rupture, pour accélérer l’industrialisation.

Dans ce cadre, l’open source n’est pas une posture idéologique mais un instrument de politique industrielle pour sécuriser les chaînes de valeur, limiter les dépendances et favoriser la compétitivité des PME et ETI en data science. La trajectoire de Probabl illustre cette orientation, avec un ancrage de recherche Inria et une exécution produit tournée vers l’industrie.

L’open source, un choix de conformité autant que de coût

Pour des groupes soumis à des obligations de conformité, l’ouverture des briques logicielles facilite les audits, la traçabilité des données et le contrôle des fournisseurs critiques. Dans un contexte où la La RGPD et les exigences de transparence progressent, l’open source permet d’aligner architecture, conformité et contrôle budgétaire.

L’Inria au cœur du triptyque science, industrie et souveraineté

Inria, institut national de recherche en sciences et technologies du numérique, est à l’origine de Scikit-learn, une bibliothèque née il y a près de deux décennies et devenue un standard mondial. La création de Probabl en 2023 formalise la mise en production d’un capital scientifique reconnu, avec un modèle d’édition open source commerciale et une gouvernance resserrée pour accélérer l’adoption en entreprise.

Gaël Varoquaux, co-fondateur et conseiller scientifique de Probabl, rappelle l’ADN du projet : « Notre but est de donner aux entreprises les moyens d’exploiter leurs données grâce à un apprentissage statistique simple, responsable, reproductible et durable. » Cette vision s’articule autour de l’exigence de réplicabilité, de la réduction du bruit expérimental et d’un effort constant de pédagogie auprès des équipes data.

Gaël Varoquaux : rigueur scientifique et gouvernance

La présence de Gaël Varoquaux, chercheur à l’Inria et animateur de longue date de l’écosystème scikit, structure la gouvernance technique. L’objectif est d’aligner la feuille de route open source avec les usages industriels, sans renoncer aux standards qui ont fait la réputation de la bibliothèque : tests, documentation et sobriété de l’API.

Le Commercial Open Source Software repose sur un cœur open source et des offres commerciales associées. Les avantages : effet d’adoption côté développeurs, coûts d’acquisition clients mieux maîtrisés, réutilisation étendue. Le défi : équilibrer gouvernance communautaire et exigences clients sur les feuilles de route et les SLA.

Impacts business pour les DSI : industrialiser un machine learning transparent

Au-delà de la technique, le message adressé aux directions data et DSI est résolument opérationnel : la valeur se matérialise quand les modèles sortent du POC pour alimenter des processus métiers répétables et auditables. Probabl vise ce passage à l’échelle, en s’appuyant sur un socle méthodologique homogène et une bibliothèque universellement comprise par les data scientists.

Trois axes ressortent pour les entreprises françaises, en particulier celles du CAC 40 et les ETI exportatrices :

  • Réduction de la dette technique : une API stable limite les régressions lors des montées de version et facilite les migrations cloud ou on-premise.
  • Conformité et auditabilité : la documentation des pipelines et l’accès au code des algorithmes simplifient les audits liés à La RGPD et aux politiques de gestion des risques.
  • Coûts de sortie maîtrisés : les briques ouvertes diminuent l’effet de verrouillage fournisseur, favorisent la multi-sourcing strategy et permettent des arbitrages plus fins entre coût et performance.

En filigrane, le débat fermé vs ouvert n’est pas qu’idéologique. Il est économique et juridique, puisqu’il conditionne la capacité des entreprises à documenter leurs modèles, à évaluer les biais et à justifier des décisions algorithmisées.

Qui est Probabl : mission, équipes et ancrage

Probabl a été fondée par 14 personnes avec une ambition explicite : « transformer le machine learning d’une boîte noire en un moteur transparent, fiable et créateur de valeur ». Le pilotage exécutif de Yann Lechelle, ancien dirigeant de Scaleway, est un atout pour l’industrialisation et la scalabilité. L’adossement scientifique à l’Inria et la confiance des investisseurs orientés deeptech renforcent la crédibilité du plan d’exécution.

Ce que change l’industrialisation de la data science

  1. Standardisation des pratiques de feature engineering, validation croisée et déploiement.
  2. Traçabilité des modèles, favorable aux audits internes et à la maîtrise des risques.
  3. Transférabilité des compétences, grâce à des outils massivement enseignés et documentés.

Souveraineté et compétitivité : cadre européen, usages concrets

La souveraineté technologique européenne ne peut s’envisager sans un socle logiciel ouvert, réplicable et hébergeable à façon. La démarche de Probabl rejoint les priorités publiques récentes et répond à des besoins immédiats des entreprises : contrôler l’infrastructure d’IA, clarifier les responsabilités et prévenir les dépendances critiques.

Les propos de Bruno Bonnell, à la tête du Secrétariat général pour l’Investissement, ont rappelé la nécessité d’outiller les startups pour franchir les paliers d’industrialisation. En articulant un produit adopté mondialement et des exigences de conformité élevées, Probabl se positionne pour ancrer un standard européen d’IA explicable et durable.

  • Documentation : conserver les versions, jeux de tests et métriques à chaque itération de modèle.
  • Explicabilité : privilégier des modèles et outils qui permettent de justifier une décision, notamment en environnement client.
  • Gouvernance : définir des rôles et responsabilités clairs dans la chaîne MLOps pour répondre aux audits.

Cap international et feuille de route produit

L’injection de capital doit permettre à Probabl d’étendre sa présence hors de France, en capitalisant sur ses implantations à Berlin et sur les synergies européennes. Le développement de solutions open source au service de l’adoption de l’IA en entreprise constitue le cœur de la stratégie. L’ambition n’est pas de multiplier les fonctionnalités, mais de consolider un socle fiable et de lever les freins opérationnels identifiés auprès des DSI et des équipes data.

Dans une compétition où l’adoption des développeurs détermine la vitesse de diffusion, la combinaison standard de facto + gouvernance éditoriale + investisseurs spécialisés offre une fenêtre d’opportunité. La mécanique d’effets réseau peut alors jouer plein pot, au bénéfice d’un modèle COSS qui assume sa vocation industrielle.

Un jalon pour l’open source d’IA en France

La levée de 13 millions d’euros de Probabl s’inscrit dans un moment charnière pour l’IA européenne. Elle réunit un actif logiciel mondialement adopté, un ancrage scientifique reconnu et un soutien public-privé aligné sur les enjeux de souveraineté. La trajectoire sera scrutée par les décideurs financiers et technologiques, tant la demande de solutions transparentes et reproductibles progresse dans l’industrie.

Si l’ouverture l’emporte sur la durée, comme le soutient Yann Lechelle, la question n’est plus de savoir si l’open source gagnera, mais comment elle structurera les chaînes de valeur de l’IA en entreprise. Le signal envoyé par Probabl est celui d’un standard industriel qui s’organise et s’exporte.