5535

3571963438/5535

3.1

If you are the rightful owner of 5535 and would like to certify it and/or have it hosted online, please leave a comment on the right or send an email to henry@mcphub.com.

This is an OCR MCP server based on Tesseract.js, designed to extract text from images.

OCR 图片文字识别工具

图片转文字工具,基于 Tesseract.js 实现,支持 18 种语言识别。

安装依赖

npm install

启动服务

npm start

功能列表

1. 基础图片识别

识别图片中的文字内容。

参数:

  • image_path: 图片文件路径
  • language: 识别语言(默认:eng)
  • enhance_quality: 开启增强识别模式
  • output_format: 输出格式(text 或 json)
  • psm: 页面分割模式(3-11)

2. Base64 图片识别

支持 Base64 编码的图片识别。

参数:

  • image_base64: Base64 编码的图片数据
  • language: 识别语言

3. 预处理增强识别

针对模糊、低质量图片进行预处理后识别。

预处理选项:

  • enhance_contrast: 增强对比度
  • remove_noise: 去除噪点
  • scale: 图片放大倍数
  • adaptive_threshold: 自适应阈值
  • denoise_strength: 降噪强度

4. 批量识别

同时识别多张图片。

参数:

  • image_paths: 图片路径数组
  • language: 识别语言
  • parallel: 是否并行处理

5. 区域识别

只识别图片中指定区域的文字。

区域参数:

  • x: 起始 X 坐标
  • y: 起始 Y 坐标
  • width: 区域宽度
  • height: 区域高度

6. 查询支持的语言

获取所有支持的识别语言列表。

支持的语言

代码语言代码语言
eng英语chi_sim简体中文
chi_tra繁体中文jpn日语
kor韩语fra法语
deu德语spa西班牙语
rus俄语ara阿拉伯语
hin印地语tha泰语
vie越南语por葡萄牙语
ita意大利语nld荷兰语
pol波兰语tur土耳其语

多语言组合: 使用 + 连接,如 eng+chi_sim

PSM 页面分割模式

模式说明适用场景
3全自动(默认)一般图片
6单个文本块一段完整文字
7单行文本单行文字
8单个单词单词识别
11稀疏文本文字较少的图片

提高识别准确度

  1. 开启增强模式 enhance_quality: true
  2. 使用预处理功能处理低质量图片
  3. 选择正确的语言代码
  4. 根据图片类型选择合适的 PSM 模式
  5. 使用高分辨率、清晰的图片

技术栈

  • OCR 引擎: Tesseract.js v5.0.0
  • 运行环境: Node.js >= 18.0.0
  • 通信协议: Stdio

版本

当前版本: v3.0.0

许可证

MIT License