Mistral AI vient de lancer son premier modèle de langage, Mistral 7B
Mistral AI vient d'annoncer le lancement de son premier modèle de langage, Mistral 7B. Il viendra concurrencer les technologies américaines de Meta et d'OpenAi.
Mistral AI, une start-up fondée en avril 2023 et basée à Paris, a dévoilé son premier modèle de langage, Mistral 7B. Cette technologie est accessible en open-source, c'est-à-dire que tout le monde peut l’utiliser sans restrictions, comme c’est le cas de Chat GPT. Plus qu’un ersatz de modèle de langage, Mistral AI se positionne comme un véritable concurrent aux technologies américaines.
Personnalisable à l’infini
Le 27 septembre 2023, Mistral AI a dévoilé son premier modèle de langage : Mistral 7B. Bien qu’accessible à tous, il a été pensé pour les développeurs qui eux seront aptes à les exploiter au maximum de leur capacité. Ces derniers pourront en effet personnaliser cette intelligence artificielle comme bon leur semble et la commercialiser par la suite.
La raison derrière cette invitation à la personnalisation de cette technologie par les utilisateurs de cette dernière se cache dans un communiqué publié par Mistral AI : « Nous sommes convaincus qu'en formant nos propres modèles, en les publiant ouvertement et en encourageant les contributions de la communauté, nous pouvons construire une alternative crédible à l'oligopole émergent de l'IA. Les modèles génératifs ouverts joueront un rôle central dans la prochaine révolution de l'IA » .
Meilleur rapport taille/performance du marché
Mistral 7B se distingue de ses concurrents par sa petitesse : il s’appuie sur 7 milliards de paramètres, là où LLaMA 13B (Large Language Model Data AI 13 billions) a un dimensionnement de 33 milliards de paramètres. En ce qui concerne Chat GPT, la technologie d’Open AI est encore loin devant, avec ses centaines de milliards de paramètres. Pourtant, s’il est petit par la taille, cela n’empêche pas Mistral 7B de concurrencer ces 2 technologies américaines. En effet, selon Mistral AI, leur modèle de langage serait « plus performant que LLaMA 13B sur tous les indicateurs, et bon en code », qui lui-même surclasserait Chat GPT-3 « sur la plupart des points de référence ».
Mistral 7B ne se distingue pas uniquement que par son rapport taille/performance au-dessus de la moyenne. Il est en plus près de deux fois moins cher que les modèles disponibles aujourd’hui. Ceci s’explique par le fait qu’Arthur Mensch, ancien de Google et co-fondateur de Mistral AI au côté de Timothée Lacroix et de Guillaume Lample, se soit mis à la place de ses prospects : « L'objectif pour un client est de choisir le modèle le moins coûteux qui résout son cas d’utilisation. »
Continuer sur leur lancée
Dans le sillage du succès de leur levée de fonds enregistré plus tôt dans l’année et du lancement de Mistral 7B, Mistral AI souhaite développer de nouveaux modèles. Car oui, Mistral 7B n’est qu’un premier modèle sur lequel vont se baser de nombreux suivants. Leurs futurs modèles seront fondés sur des architectures différentes de ceux sur lesquels a été bâti Mistral 7B, le but étant que ces modèles soient plus faciles d’accès et d’utilisation. Comme le dévoile Arthur Mensch, « C'est un premier pas, on est en train de développer des modèles plus gros, et de développer une plateforme pour rendre leur utilisation facile. »