3571963438/5535
3.1
If you are the rightful owner of 5535 and would like to certify it and/or have it hosted online, please leave a comment on the right or send an email to henry@mcphub.com.
This is an OCR MCP server based on Tesseract.js, designed to extract text from images.
OCR 图片文字识别工具
图片转文字工具,基于 Tesseract.js 实现,支持 18 种语言识别。
安装依赖
npm install
启动服务
npm start
功能列表
1. 基础图片识别
识别图片中的文字内容。
参数:
image_path: 图片文件路径language: 识别语言(默认:eng)enhance_quality: 开启增强识别模式output_format: 输出格式(text 或 json)psm: 页面分割模式(3-11)
2. Base64 图片识别
支持 Base64 编码的图片识别。
参数:
image_base64: Base64 编码的图片数据language: 识别语言
3. 预处理增强识别
针对模糊、低质量图片进行预处理后识别。
预处理选项:
enhance_contrast: 增强对比度remove_noise: 去除噪点scale: 图片放大倍数adaptive_threshold: 自适应阈值denoise_strength: 降噪强度
4. 批量识别
同时识别多张图片。
参数:
image_paths: 图片路径数组language: 识别语言parallel: 是否并行处理
5. 区域识别
只识别图片中指定区域的文字。
区域参数:
x: 起始 X 坐标y: 起始 Y 坐标width: 区域宽度height: 区域高度
6. 查询支持的语言
获取所有支持的识别语言列表。
支持的语言
| 代码 | 语言 | 代码 | 语言 |
|---|---|---|---|
| eng | 英语 | chi_sim | 简体中文 |
| chi_tra | 繁体中文 | jpn | 日语 |
| kor | 韩语 | fra | 法语 |
| deu | 德语 | spa | 西班牙语 |
| rus | 俄语 | ara | 阿拉伯语 |
| hin | 印地语 | tha | 泰语 |
| vie | 越南语 | por | 葡萄牙语 |
| ita | 意大利语 | nld | 荷兰语 |
| pol | 波兰语 | tur | 土耳其语 |
多语言组合: 使用 + 连接,如 eng+chi_sim
PSM 页面分割模式
| 模式 | 说明 | 适用场景 |
|---|---|---|
| 3 | 全自动(默认) | 一般图片 |
| 6 | 单个文本块 | 一段完整文字 |
| 7 | 单行文本 | 单行文字 |
| 8 | 单个单词 | 单词识别 |
| 11 | 稀疏文本 | 文字较少的图片 |
提高识别准确度
- 开启增强模式
enhance_quality: true - 使用预处理功能处理低质量图片
- 选择正确的语言代码
- 根据图片类型选择合适的 PSM 模式
- 使用高分辨率、清晰的图片
技术栈
- OCR 引擎: Tesseract.js v5.0.0
- 运行环境: Node.js >= 18.0.0
- 通信协议: Stdio
版本
当前版本: v3.0.0
许可证
MIT License