ニュース
仏Mistral AI、Markdown出力も可能な「Mistral OCR」
2025年3月7日 12:39
フランスのAIスタートアップ企業のMistral AI(ミストラルAI)は、光学文字認識(OCR)技術を用いたドキュメント理解API「Mistral OCR」を発表した。価格は1,000ページあたり1ドルで、APIプラットフォーム「la Plateforme」を通じて利用可能。
Mistral OCRは、画像やPDFを入力し、順序を保持した形でテキストと画像を抽出できる。また、複雑なレイアウトの文書やマルチモーダルドキュメント(スライド資料や科学論文など)にも対応し、高度な構造解析を実現している。
画像とテキストが交互に配置された「インターリーブ」構造を保持したまま解析できる点が特長。文書の構造を維持したまま、Markdown(マークダウン)形式での出力も可能で、見出し、箇条書き、表、強調などの情報を自動的に付与し、元のドキュメントの構成を反映する。これにより、OCRで抽出した内容をそのままドキュメント管理システムやナレッジベースへ組み込むことができる。
同社は、OCR性能を評価するベンチマークにおいて、GoogleドキュメントAIやAzure OCR、GPT-4oなどほかの主要なモデルを上回るスコアを記録。特に数学、スキャン文書、多言語処理、表解析の分野で優れた精度を示したという。さらに、毎分最大2,000ページの高速処理を実現している。
価格は1,000ページあたり1ドルで、APIは「la Plateforme」経由で利用できるほか、同社のLLM「le Chat」でも無料試用が可能。今後、クラウドパートナーやオンプレミス環境での展開も予定している。