这是一个基于MCP协议的服务器,通过Mistral AI的OCR API提供光学字符识别功能。该服务器可处理本地文件和URL链接,支持图像和PDF文档。
MISTRAL_API_KEY
:您的Mistral AI API密钥OCR_DIR
:本地文件处理的目录路径。在容器内部,该路径始终映射到/data/ocr
要自动为Claude Desktop安装Mistral OCR,可通过Smithery:
npx -y @smithery/cli install @everaldo/mcp/mistral-crosswalk --client claude
docker build -t mcp-mistral-ocr .
docker run -e MISTRAL_API_KEY=你的API密钥 -e OCR_DIR=/data/ocr -v /本地文件路径:/data/ocr mcp-mistral-ocr
pip install uv
uv venv
source .venv/bin/activate # Unix系统
# 或
.venv\Scripts\activate # Windows系统

uv pip install .
将以下配置添加到claude_desktop_config.json
:
{
"mcpServers": {
"mistral-ocr": {
"command": "docker",
"args": [
"run",
"-i",
"--rm",
"-e",
"MISTRAL_API_KEY",
"-e",
"OCR_DIR",
"-v",
"C:/你的文件路径:/data/ocr",
"mcp-mistral-ocr:latest"
],
"env": {
"MISTRAL_API_KEY": "<你的MISTRAL_API_KEY>",
"OCR_DIR": "C:/你的文件路径"
}
}
}
}

处理配置的OCR_DIR目录中的文件:
{
"name": "process_local_file",
"arguments": {
"filename": "document.pdf"
}
}

处理URL来源的文件。需要明确指定文件类型:
{
"name": "process_url_file",
"arguments": {
"url": "https://example.com/document",
"file_type": "image" // 或 "pdf"
}
}

OCR结果以JSON格式保存在OCR_DIR
目录下的output
子目录中。每个结果文件按以下格式命名:
{原始文件名}_{时间戳}.json
{URL文件名}_{时间戳}.json
或 url_document_{时间戳}.json
(如果URL中没有文件名)时间戳格式为YYYYMMDD_HHMMSS
。