Contenidos
Reconocimiento óptico de caracteres
Suponga que quiere digitalizar un artículo de una revista o un contrato impreso. Podrías pasar horas reescribiendo y corrigiendo errores de imprenta. O podría convertir todo el material necesario en formato digital en varios minutos utilizando un escáner (o una cámara digital) y un software de reconocimiento óptico de caracteres.
Veamos cómo reconoce el texto FineReader OCR. En primer lugar, el programa analiza la estructura de la imagen del documento. Divide la página en elementos como bloques de texto, tablas, imágenes, etc. Las líneas se dividen en palabras y luego – en caracteres. Una vez señalados los caracteres, el programa los compara con un conjunto de imágenes patrón. Avanza numerosas hipótesis sobre lo que es ese carácter. Basándose en estas hipótesis, el programa analiza diferentes variantes de división de líneas en palabras y de palabras en caracteres. Tras procesar un gran número de estas hipótesis probabilísticas, el programa toma finalmente la decisión, presentándole el texto reconocido.
El reconocimiento óptico de caracteres, o OCR, es una tecnología que permite convertir diferentes tipos de documentos, como documentos en papel escaneados, archivos PDF o imágenes capturadas por una cámara digital, en datos editables y que permiten realizar búsquedas.
Google ocr
El OCR (reconocimiento óptico de caracteres) es una tecnología esencial para que las empresas trabajen con documentos escaneados. Sin ella, no se puede buscar en los documentos a menos que se introduzcan manualmente en un procesador de textos. En esencia, este software permite a los ordenadores leer documentos de la misma manera que lo hace un ser humano: reconociendo los patrones de las letras y seleccionando el texto de una imagen.
Esta tarea es sorprendentemente difícil porque nuestros cerebros funcionan de forma diferente al procesador de un ordenador. Mientras que el cerebro humano toma nuestra información visual y la clasifica según formas y patrones, los ordenadores ven las imágenes como una colección de píxeles. Tradicionalmente, los programadores debían introducir los patrones que querían que los ordenadores reconocieran, lo que significaba que su alcance era limitado y que pequeñas variaciones en el tipo de letra podían hacer que el texto fuera totalmente ilegible para los ordenadores. El software de reconocimiento óptico de caracteres (OCR) se desarrolló como solución a este problema, y hoy es una poderosa herramienta para las empresas.
Esta tecnología ha evolucionado con el tiempo y sus primeras etapas no eran ni de lejos tan potentes como lo son hoy. El primer caso de éxito del software OCR se utilizó en las finanzas y todavía puede verse en los cheques bancarios. El tipo de letra distintivo utilizado para el número de cuenta y de ruta en los cheques se llama OCR-A. Se diseñó para que fuera clara y diferenciara cada letra y número de los demás. Como resultado, se pudo enseñar a los ordenadores a leer un único tipo de letra a partir de una imagen.
Explicación de Ocr
Si trabaja en una oficina equipada con un escáner de documentos, seguro que ha utilizado un PDF. Y quizá conozca al mejor amigo del PDF, su pariente acrónimo, el OCR, o reconocimiento óptico de caracteres. Pero, ¿qué es el OCR? ¿Por qué es beneficioso para los PDF? Este artículo examina qué es el OCR y descubre los casos de uso más populares.
¿Qué es el OCR? OCR significa reconocimiento óptico de caracteres. Es una tecnología muy extendida para reconocer el texto dentro de las imágenes, como los documentos y las fotos escaneadas. La tecnología OCR se utiliza para convertir prácticamente cualquier tipo de imagen que contenga texto escrito (mecanografiado, manuscrito o impreso) en datos de texto legibles por la máquina.La tecnología OCR se hizo popular a principios de los años 90 al digitalizar periódicos históricos. Desde entonces, la tecnología ha experimentado varias mejoras. Hoy en día, las soluciones ofrecen una precisión de OCR casi perfecta. Además, se utilizan métodos avanzados como el OCR zonal para automatizar flujos de trabajo complejos basados en documentos.
Con el OCR zonal, se crean zonas o áreas en los documentos para establecer márgenes específicos para páginas enteras. A continuación, se extraen los datos de las áreas designadas. Todo lo que se recorta se recorta, y los caracteres introducidos parcialmente en los campos zonales no se pueden leer. Las «zonas inteligentes» optimizan la extracción de datos, la precisión y permiten al usuario establecer reglas de formato para el procesamiento avanzado de documentos. El OCR o reconocimiento óptico de caracteres completo lee todo el documento. A continuación, coloca una capa textual sobre el documento PDF. Las capas textuales permiten buscar en todo el contenido del documento. Esto es lo mejor para los informes, los contratos o cualquier documento con palabras o frases esenciales que puedan buscarse.
Cómo funciona el ocr
El reconocimiento óptico de caracteres o lector óptico de caracteres (OCR) es la conversión electrónica o mecánica de imágenes de texto mecanografiado, escrito a mano o impreso en texto codificado por una máquina, ya sea a partir de un documento escaneado, una foto de un documento, una foto de una escena (por ejemplo, el texto de las señales y vallas publicitarias en una foto de un paisaje) o del texto de los subtítulos superpuestos en una imagen (por ejemplo: de una emisión de televisión)[1].
Las primeras versiones necesitaban ser entrenadas con imágenes de cada carácter y trabajaban con una fuente a la vez. En la actualidad, son comunes los sistemas avanzados capaces de producir un alto grado de precisión en el reconocimiento de la mayoría de los tipos de letra, y con soporte para una variedad de entradas de formato de archivo de imagen digital[2] Algunos sistemas son capaces de reproducir una salida formateada que se aproxima a la página original, incluyendo imágenes, columnas y otros componentes no textuales.
Los primeros sistemas de reconocimiento óptico de caracteres se remontan a las tecnologías relacionadas con la telegrafía y la creación de dispositivos de lectura para ciegos[3]. En 1914, Emanuel Goldberg desarrolló una máquina que leía caracteres y los convertía en un código telegráfico estándar[4]. Al mismo tiempo, Edmund Fournier d’Albe desarrolló el Optophone, un escáner manual que, al moverse por una página impresa, producía tonos que correspondían a letras o caracteres específicos[5].