Claude Vision & GPT-4 Vision图像识别工具添加福利群:解决AI开发者的「MCP实战痛点」一个使用Anthropic和OpenAI视觉API提供图像识别功能的MCP服务器。版本0.1.2。
sudo apt-get install tesseract-ocrbrew install tesseractgit clone https://github.com/mario-andreschak/mcp-image-recognition.git
cd mcp-image-recognition

cp .env.example .env
# 使用您的API密钥和偏好编辑.env文件

build.bat
使用Python启动服务器:
python -m image_recognition_server.server
或使用批处理文件启动:
run.bat server
使用MCP Inspector以开发模式启动服务器:
run.bat debug
describe_image
describe_image_from_file
ANTHROPIC_API_KEY:您的Anthropic API密钥OPENAI_API_KEY:您的OpenAI API密钥VISION_PROVIDER:主视觉提供方(anthropic或openai)FALLBACK_PROVIDER:可选备用提供方LOG_LEVEL:日志级别(DEBUG、INFO、WARNING、ERROR)ENABLE_OCR:启用Tesseract OCR文本提取(true或false)TESSERACT_CMD:Tesseract可执行文件的自定义路径(可选)OPENAI_MODEL:OpenAI模型(默认:gpt-4o-mini)。可以使用OpenRouter格式指定其他模型(例如anthropic/claude-3.5-sonnet:beta)OPENAI_BASE_URL:OpenAI API的自定义基础URL(可选)。使用OpenRouter时设置为https://openrouter.ai/api/v1OPENAI_TIMEOUT:OpenAI API的自定义超时时间(秒,可选)OpenRouter允许您使用OpenAI API格式访问各种模型。要使用OpenRouter,请按照以下步骤操作:
OPENAI_API_KEY设置为您的OpenRouter API密钥OPENAI_BASE_URL设置为https://openrouter.ai/api/v1OPENAI_MODEL中使用OpenRouter格式设置所需模型(例如anthropic/claude-3.5-sonnet:beta)VISION_PROVIDER设置为openaiclaude-3.5-sonnet-betagpt-4o-miniOPENAI_MODEL中使用anthropic/claude-3.5-sonnet:beta格式运行所有测试:
run.bat test

运行特定测试套件:
run.bat test server
run.bat test anthropic
run.bat test openai

构建Docker镜像:
docker build -t mcp-image-recognition .
运行容器:
docker run -it --env-file .env mcp-image-recognition

MIT许可证 - 详情请参阅LICENSE文件