首页
学习
活动
专区
圈层
工具
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
首页
学习
活动
专区
圈层
工具
MCP广场
MCP广场 >详情页
mcp-mistral-ocr2025-05-280分享
github
使用Mistral OCR API(付费)通过本地或URL识别图像或PDF中的文字。
By everaldo
2025-05-280
github
详情内容

MCP Mistral OCR

smithery 徽章

这是一个基于MCP协议的服务器,通过Mistral AI的OCR API提供光学字符识别功能。该服务器可处理本地文件和URL链接,支持图像和PDF文档。

功能特性

  • 使用Mistral OCR处理本地文件(图像和PDF)
  • 支持通过明确指定文件类型来处理URL来源的文件
  • 兼容多种文件格式(JPG、PNG、PDF等)
  • 结果以带时间戳的JSON文件保存
  • Docker容器化部署
  • 采用UV包管理工具

环境变量

  • MISTRAL_API_KEY:您的Mistral AI API密钥
  • OCR_DIR:本地文件处理的目录路径。在容器内部,该路径始终映射到/data/ocr

安装方式

通过Smithery安装

要自动为Claude Desktop安装Mistral OCR,可通过Smithery

npx -y @smithery/cli install @everaldo/mcp/mistral-crosswalk --client claude

使用Docker

  1. 构建Docker镜像:
docker build -t mcp-mistral-ocr .
  1. 运行容器:
docker run -e MISTRAL_API_KEY=你的API密钥 -e OCR_DIR=/data/ocr -v /本地文件路径:/data/ocr mcp-mistral-ocr

本地开发环境

  1. 安装UV包管理器:
pip install uv
  1. 创建并激活虚拟环境:
uv venv
source .venv/bin/activate  # Unix系统
# 或
.venv\Scripts\activate  # Windows系统
  1. 安装依赖项:
uv pip install .

Claude Desktop配置

将以下配置添加到claude_desktop_config.json

{
  "mcpServers": {
    "mistral-ocr": {
      "command": "docker",
      "args": [
        "run",
        "-i",
        "--rm",
        "-e",
        "MISTRAL_API_KEY",
        "-e",
        "OCR_DIR",
        "-v",
        "C:/你的文件路径:/data/ocr",
        "mcp-mistral-ocr:latest"
      ],
      "env": {
        "MISTRAL_API_KEY": "<你的MISTRAL_API_KEY>",
        "OCR_DIR": "C:/你的文件路径"
      }
    }
  }
}

可用工具

1. process_local_file

处理配置的OCR_DIR目录中的文件:

{
    "name": "process_local_file",
    "arguments": {
        "filename": "document.pdf"
    }
}

2. process_url_file

处理URL来源的文件。需要明确指定文件类型:

{
    "name": "process_url_file",
    "arguments": {
        "url": "https://example.com/document",
        "file_type": "image"  // 或 "pdf"
    }
}

输出结果

OCR结果以JSON格式保存在OCR_DIR目录下的output子目录中。每个结果文件按以下格式命名:

  • 本地文件:{原始文件名}_{时间戳}.json
  • URL文件:{URL文件名}_{时间戳}.jsonurl_document_{时间戳}.json(如果URL中没有文件名)

时间戳格式为YYYYMMDD_HHMMSS

支持的文件类型

  • 图像:JPG、JPEG、PNG、GIF、WebP
  • 文档:PDF及其他Mistral OCR支持的文档格式

限制条件

  • 最大文件大小:50MB(由Mistral API限制)
  • 最大文档页数:1000页(由Mistral API限制)
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档