Primero diremos que esta herramienta proviene de Docsumo una satarup de Bombay, que hace años ofrece soluciones empresariales para la digitalización de documentos sobre todo en el ámbito administrativo.

Las herramientas para escanear documentos y extraer textos de ellos no son algo nuevo. La tecnología de reconocimiento óptico de caracteres (OCR) se puede encontrar en software para casi cualquier plataforma, incluyendo plataformas web.

Normalmente las herramientas de Docsumo se ofrece mediante servicio de pago, pero últimamente esta dejando muchas herramientas de forma abierta.

Empecemos diciendo que, aunque Extract Tables lo han dejado de forma gratuita limita a 20 documentos por día.

Permite capturar tablas y reconocer los binomios clave-valor a partir de imágenes escaneadas o archivos PDF. Para obtener resultados más precisos, puedes entrenar el algoritmo, aportando algunas muestras para guiarlo. Igualmente, tras escanear y antes de exportar, puedes verificar manualmente los datos y corregirlos si es necesario.

Si necesitas exportar los datos en formato JSON, puedes configurar reglas para que el documento exportado sea válido para trabajarlo con alguna API en particular. También, puedes exportar la tabla escaneada en formato XLSX, para editarla en algún procesador de hojas de cálculo. Otras dos opciones son en formato de texto plano (TXT) y una copia de la imagen original.

Esta herramienta ha sido liberada junto a otras herramientas OCR para el escaneo y transformación de documentos.

Por lo general, las tablas son una debilidad de las aplicaciones de reconocimiento de caracteres.

Pasa a probar Extract Table.