mistral-ai推出高精度OCR API

mistral-ai推出高精度OCR API,具备先进的文档理解功能

mistral-ai发布了一款新的OCR API,根据基准测试,其精度超越了现有市场解决方案。该公司推出了两个模型,mistral-ocr-2503mistral-ocr-latest,旨在从图像和文档中提取文本,并具备先进的文档理解能力。这些模型支持多种语言,能够识别印刷和手写文本,并保持文档的原始布局和格式。它们还可以从表格、表单和复杂布局中提取文本。

mistral-ai OCR的准确率达到了94.89%,在多语言上的表现为99.02%,超越了如谷歌文档AIAzure OCR等竞争对手。它能够高效地将复杂的信息图表转换为数字格式,适用于视觉密集的材料。其轻量级架构允许在单个计算节点上每分钟处理2000页。

其模型成本效益高,提供每美元1000页或通过批处理每美元2000页的服务。一个独特的功能“文档即提示”,允许用户将整个文档作为AI指令输入,用于结构化信息提取,输出数据为与AI和数据处理应用兼容的JSON格式。该API支持自托管,以增强数据安全,并在米斯特拉尔的开发者平台“la Plateforme”上运行,未来计划支持云和推理合作伙伴。

1 Like