Petit à petit, le coût de l’OCR augmente chez Mistral AI.
L’entreprise avait lancé son premier modèle spécialisé en mars 2025. Le tarif était de 1 $ pour 1000 pages, hors traitement par lots.
Ce prix avait été maintenu avec la deuxième génération, introduite en mai 2025. Il avait en revanche doublé (2 $ les 1000 pages) avec Mistral OCR 3, arrivé en décembre.
Rebelote avec Mistral OCR 4, fraîchement ajouté à l’API* : il en coûte désormais 4 $ pour 1000 pages.
Une base OCR étendue avec de l’annotation
Le coût facial a certes augmenté, mais l’offre est devenue fonctionnellement plus riche.
Avec la première génération, Mistral AI avait mis l’accent sur le multilinguisme (une dizaine de langues), la multimodalité (texte + images) et la variété des formats pris en charge (tableaux, expressions mathématiques…). Il proposait aussi un système d’extraction structurée à base de schémas JSON.
Ce système d’annotation, combiné à l’OCR de base, allait former l’ossature de Document AI. Sous cette marque, poussée concomitamment au lancement de la deuxième génération, l’entreprise prônait l’intégration avec le reste de ses solutions. En particulier ses autres LLM, pour une analyse des extractions en langage naturel (questions-réponses). L’ensemble serait placé sous l’ombrelle Mistral Studio à son annonce en octobre 2025.
Une extraction plus fine, au niveau des blocs
Depuis Mistral OCR 3, on peut choisir le format d’extraction des tableaux (HTML ou Markdown). On dispose aussi d’une option d’extraction séparée des en-têtes et des pieds de pages.
Avec Mistral OCR 4 arrive un paramètre include_blocks, non actif par défaut. Il délimite les éléments de chaque page par des boîtes englobantes et les classe selon leur nature (paragraphe, titre, liste, tableau, image, équation, légende, bloc de code, citation, signature…). Gérant les schémas d’output, il accepte aussi les prompts personnalisés. Il est censé favoriser, entre autres, l’apport de primitives structurelles à des agents IA.
Exploitant des modèles spécifiques dont Mistral Small, ces fonctionnalités entrent dans la famille Document AI, qui a sa propre tarification… elle aussi en augmentation (5 $ les 1000 pages, contre 3 $ avec Mistral OCR 3).
Mistral AI, plus précis sur ses benchmarks
Autre nouveauté de Mistral OCR 4 : des scores de confiance, par page et par mot.
En parallèle, Mistral AI se montre plus précis quant à la méthode de calcul des indicateurs de performance qu’il communique. C’est notamment la première fois qu’il mentionne des benchmarks tiers. En l’occurrence, OlmOCRBench et OmniDocBench. Il ne s’interdit pas de pointer leur tendance à pénaliser des outputs corrects, qu’elle découle de la segmentation des équations, de l’ordre de lecture dans les documents à plusieurs colonnes ou simplement d’erreurs dans la source de vérité (fautes de frappe, texte manquant, transcription de zones masquées…).
La première génération (mars 2025) avait été comparée à Google Document AI, Azure OCR, GPT-4o et plusieurs modèles Gemini (1.5 Flash, 1.5 Pro, 2.0 Flash).
La dernière a été opposée à davantage de modèles spécialisés, dont Chandra OCR 2, Mineru Pro, PaddleOCR VL, GLM OCR et DeepSeek OCR. Mistral AI a aussi effectué un test de préférence humaine en 12 langues contre Amazon Textract, Azure Document Intelligence, Gemini 3.1 Pro Preview, GPT-5.5 Pro et « Databricks » (modèle non spécifié).
* Mistral AI propose aussi, depuis la première génération, une option de déploiement sur site. Il promettait initialement jusqu’à 2000 pages par minute sur un GPU.
Illustration générée par IA
The post Chez Mistral AI, l’OCR s’enrichit, mais cela a un prix appeared first on Silicon.fr.