3571963438/5535

3.1

If you are the rightful owner of 5535 and would like to certify it and/or have it hosted online, please leave a comment on the right or send an email to dayong@mcphub.com.

This is an OCR MCP server based on Tesseract.js, designed to extract text from images.

OCR 图片文字识别工具

图片转文字工具，基于 Tesseract.js 实现，支持 18 种语言识别。

安装依赖

npm install

启动服务

npm start

功能列表

1. 基础图片识别

识别图片中的文字内容。

参数：

image_path: 图片文件路径
language: 识别语言（默认：eng）
enhance_quality: 开启增强识别模式
output_format: 输出格式（text 或 json）
psm: 页面分割模式（3-11）

2. Base64 图片识别

支持 Base64 编码的图片识别。

参数：

image_base64: Base64 编码的图片数据
language: 识别语言

3. 预处理增强识别

针对模糊、低质量图片进行预处理后识别。

预处理选项：

enhance_contrast: 增强对比度
remove_noise: 去除噪点
scale: 图片放大倍数
adaptive_threshold: 自适应阈值
denoise_strength: 降噪强度

4. 批量识别

同时识别多张图片。

参数：

image_paths: 图片路径数组
language: 识别语言
parallel: 是否并行处理

5. 区域识别

只识别图片中指定区域的文字。

区域参数：

x: 起始 X 坐标
y: 起始 Y 坐标
width: 区域宽度
height: 区域高度

6. 查询支持的语言

获取所有支持的识别语言列表。

支持的语言

代码	语言	代码	语言
eng	英语	chi_sim	简体中文
chi_tra	繁体中文	jpn	日语
kor	韩语	fra	法语
deu	德语	spa	西班牙语
rus	俄语	ara	阿拉伯语
hin	印地语	tha	泰语
vie	越南语	por	葡萄牙语
ita	意大利语	nld	荷兰语
pol	波兰语	tur	土耳其语

多语言组合： 使用 + 连接，如 eng+chi_sim

PSM 页面分割模式

模式	说明	适用场景
3	全自动（默认）	一般图片
6	单个文本块	一段完整文字
7	单行文本	单行文字
8	单个单词	单词识别
11	稀疏文本	文字较少的图片

提高识别准确度

开启增强模式 enhance_quality: true
使用预处理功能处理低质量图片
选择正确的语言代码
根据图片类型选择合适的 PSM 模式
使用高分辨率、清晰的图片

技术栈

OCR 引擎: Tesseract.js v5.0.0
运行环境: Node.js >= 18.0.0
通信协议: Stdio

版本

当前版本: v3.0.0

许可证

MIT License