easyocr
Compare original and translation side by side
🇺🇸
Original
English🇨🇳
Translation
Chineseeasyocr
easyocr
EasyOCR es un motor OCR basado en deep learning que soporta más de 80 idiomas y scripts. Funciona como alternativa/fallback a PaddleOCR con mejor rendimiento en caracteres especiales y alfabetos no latinos.
EasyOCR是一款基于深度学习的OCR引擎,支持超过80种语言和文字脚本。它可作为PaddleOCR的替代/备用方案,在特殊字符和非拉丁字母识别上表现更优。
When to use
适用场景
Usar en el como segundo motor OCR cuando PaddleOCR tiene baja confianza (< 0.7) en la extracción. Especialmente útil para documentos con caracteres árabes, cirílicos o asiáticos.
ocr_agent当PaddleOCR的提取置信度较低(< 0.7)时,可在中作为第二OCR引擎使用。尤其适用于包含阿拉伯文、西里尔文或亚洲文字的文档。
ocr_agentInstructions
使用说明
- Instalar: .
pip install easyocr - Inicializar reader con idiomas: .
reader = easyocr.Reader(['es', 'en', 'fr'], gpu=True) - Ejecutar OCR: .
results = reader.readtext(image) - Cada resultado contiene: .
[bbox, text, confidence] - Filtrar resultados con confianza < 0.5.
- Comparar resultados con PaddleOCR y usar el de mayor confianza por campo.
- Normalizar texto extraído con el .
regex_data_normalizer
- 安装:。
pip install easyocr - 初始化支持指定语言的读取器:。
reader = easyocr.Reader(['es', 'en', 'fr'], gpu=True) - 执行OCR识别:。
results = reader.readtext(image) - 每个返回结果包含:。
[bbox, text, confidence] - 过滤掉置信度低于0.5的结果。
- 将结果与PaddleOCR的输出对比,每个字段选用置信度更高的结果。
- 使用对提取的文本进行归一化处理。
regex_data_normalizer
Notes
注意事项
- EasyOCR es más lento que PaddleOCR (~2x); usar solo como fallback.
- El modelo se descarga automáticamente la primera vez; pre-descargar en el Docker build.
- No soporta MRZ de forma nativa; usar para la zona MRZ.
mrz_parser
- EasyOCR速度比PaddleOCR慢(约2倍),仅作为备用方案使用。
- 首次使用时会自动下载模型,建议在Docker构建阶段提前预下载。
- 原生不支持MRZ识别,MRZ区域请使用处理。
mrz_parser