Lector de Caracteres

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 6

Unidad Educativa

Libertador Simón Bolívar

Lector de
Caracteres

Estudiante : Cristian Brayan Callizaya Choque

Prof. : Yeri Rada Blanco

Materia : Hardware de Computadoras

Curso : 4to “B” Secundaria

2023
LECTOR DE CARACTERES

¿Qué es el reconocimiento óptico de caracteres (OCR)?

El reconocimiento óptico de caracteres (OCR) es el proceso por el cual se convierte una


imagen de texto en un formato de texto que pueden leer las máquinas. Por ejemplo, si
escanea el formulario o un recibo, su computadora guarda el escaneo como un archivo de
imagen. No se puede utilizar un editor de texto para editar, buscar o contar las palabras
del archivo de imagen. Sin embargo, se puede utilizar el OCR para convertir la imagen en
un documento de texto con su contenido como datos de texto.

¿Por qué es importante el OCR?

La mayoría de los flujos de trabajo comerciales suponen recibir información de medios de


comunicación impresos. Los formularios impresos, las facturas, los documentos legales
escaneados y los contratos impresos forman parte de los procesos comerciales. Estos
grandes volúmenes de papeleo requieren mucho tiempo y espacio para almacenarse y
administrarse. Si bien la administración de documentos digitales es recomendable,
digitalizar los documentos crea desafíos. E l proceso requiere intervención manual y
puede ser tedioso y lento.

Además, la digitalización del contenido de los documentos crea archivos de imagen con el
texto oculto en su interior. El texto de las imágenes no se puede procesar con
un software de procesamiento de texto de la misma manera que los documentos de texto.
La tecnología OCR resuelve el problema mediante la conversión de imágenes de texto en
datos de texto que pueden ser analizados por otro software empresarial. Entonces, puede
utilizar los datos para llevar a cabo análisis, optimizar operaciones, automatizar procesos
y mejorar la productividad.

¿Cómo funciona el OCR?

El motor de OCR o el software de OCR funcionan mediante los siguientes pasos:

Adquisición de imagen

Un escáner lee los documentos y los convierte en datos binarios. El software de OCR
analiza la imagen escaneada y clasifica las áreas claras como fondo y las áreas oscuras
como texto.

Procesamiento previo

El software de OCR primero limpia la imagen y elimina los errores para prepararla para la
lectura. Estas son algunas de las técnicas de limpieza:

 Se endereza o inclina ligeramente el documento escaneado para solucionar los


problemas de alineación durante el escaneo.
 Se remueven o eliminan manchas de imágenes digitales o se suavizan los
bordes de las imágenes de texto.
 Se limpian los cuadros y las líneas de la imagen.
 Se reconocen guiones para tecnología OCR multilingüe.

Reconocimiento de texto

Los dos tipos principales de algoritmos de OCR o procesos de software que utiliza
un software de OCR para el reconocimiento de texto se denominan coincidencia de
patrones y extracción de características.

Coincidencia de patrones

La coincidencia de patrones aísla una imagen de carácter, llamada glifo, y la compara con
un glifo almacenado de manera similar. El reconocimiento de patrones solo funciona si el
glifo almacenado tiene una fuente y una escala similares a las del glifo de entrada. Este
método funciona bien con imágenes escaneadas de documentos que se han escrito en
una fuente conocida.

Extracción de características

La extracción de características divide o descompone los glifos en características como


líneas, circuitos cerrados, dirección de línea e intersecciones de línea. Luego, utiliza estas
características para encontrar la mejor coincidencia o el vecino más cercano entre los
glifos almacenados.

Procesamiento posterior

Después del análisis, el sistema convierte los datos de texto extraídos en un archivo
computarizado. Algunos sistemas de OCR pueden crear archivos PDF con anotaciones
que incluyen las versiones anteriores y posteriores del documento escaneado.

¿Cuáles son los tipos de OCR?

Los científicos de datos clasifican los diferentes tipos de tecnologías de OCR en función
de sus usos y aplicaciones. A continuación, se mencionan algunos ejemplos:

Software simple de reconocimiento óptico de caracteres

Un motor de OCR simple almacena muchos patrones de imágenes de texto y muchas


fuentes diferentes como plantillas. El software de OCR utiliza algoritmos de coincidencia
de patrones para comparar imágenes de texto, carácter por carácter, con su base de
datos interna. Si el sistema coincide con el texto palabra por palabra, se denomina
reconocimiento óptico de palabras. Esta solución tiene limitaciones, ya que hay fuentes y
estilos de escritura prácticamente ilimitados y no se puede capturar y almacenar en la
base de datos cada uno de los tipos.

Software inteligente de reconocimiento óptico de caracteres

Los sistemas de OCR modernos utilizan tecnología de reconocimiento inteligente de


caracteres (ICR) para leer el texto de la misma manera que lo hacen los humanos.
Utilizan métodos avanzados que entrenan a las máquinas para que se comporten como
humanos mediante el software de machine learning. Un sistema de machine
learning llamado red neuronal analiza el texto en muchos niveles y procesa la imagen
reiteradamente. Busca diferentes atributos de imagen, como curvas, líneas,
intersecciones y circuitos, y combina los resultados de todos estos niveles de análisis
diferentes para obtener el resultado final. Si bien el ICR normalmente procesa las
imágenes de a un carácter a la vez, el proceso es rápido y los resultados se obtienen en
segundos.

Reconocimiento de palabras inteligente

Los sistemas inteligentes de reconocimiento de palabras funcionan con los mismos


principios que ICR, pero procesan imágenes de palabras completas en lugar de procesar
previamente las imágenes en caracteres.

Reconocimiento óptico de marcas

El reconocimiento óptico de marcas identifica logotipos, marcas de agua y otros símbolos


de texto en un documento.

¿Qué beneficios ofrece el OCR?

Los científicos de datos clasifican los diferentes tipos de tecnologías de OCR en función
de sus usos y aplicaciones. A continuación, se mencionan algunos ejemplos:

Software simple de reconocimiento óptico de caracteres

Un motor de OCR simple almacena muchos patrones de imágenes de texto y muchas


fuentes diferentes como plantillas. El software de OCR utiliza algoritmos de coincidencia
de patrones para comparar imágenes de texto, carácter por carácter, con su base de
datos interna. Si el sistema coincide con el texto palabra por palabra, se denomina
reconocimiento óptico de palabras. Esta solución tiene limitaciones, ya que hay fuentes y
estilos de escritura prácticamente ilimitados y no se puede capturar y almacenar en la
base de datos cada uno de los tipos.

Software inteligente de reconocimiento óptico de caracteres

Los sistemas de OCR modernos utilizan tecnología de reconocimiento inteligente de


caracteres (ICR) para leer el texto de la misma manera que lo hacen los humanos.
Utilizan métodos avanzados que entrenan a las máquinas para que se comporten como
humanos mediante el software de machine learning. Un sistema de machine
learning llamado red neuronal analiza el texto en muchos niveles y procesa la imagen
reiteradamente. Busca diferentes atributos de imagen, como curvas, líneas,
intersecciones y circuitos, y combina los resultados de todos estos niveles de análisis
diferentes para obtener el resultado final. Si bien el ICR normalmente procesa las
imágenes de a un carácter a la vez, el proceso es rápido y los resultados se obtienen en
segundos.
Reconocimiento de palabras inteligente

Los sistemas inteligentes de reconocimiento de palabras funcionan con los mismos


principios que ICR, pero procesan imágenes de palabras completas en lugar de procesar
previamente las imágenes en caracteres.

Reconocimiento óptico de marcas

El reconocimiento óptico de marcas identifica logotipos, marcas de agua y otros símbolos


de texto en un documento.

¿Qué beneficios ofrece el OCR?

A continuación, se mencionan los beneficios principales de la tecnología OCR:

Texto consultable

Las empresas pueden convertir sus documentos existentes y nuevos en un archivo de


conocimiento con capacidad de búsqueda completa. También pueden procesar la base de
datos de texto de forma automática mediante el uso de software de análisis de datos para
un mayor procesamiento del conocimiento.

Eficacia operativa

Puede mejorar la eficiencia con el software de OCR para integrar de forma automática los
flujos de trabajo de documentos y los flujos de trabajo digitales dentro de su empresa. A
continuación, se incluyen algunos ejemplos de lo que el software de OCR puede hacer:

 Escanea formularios completados a mano para verificaciones, revisiones,


ediciones y análisis automatizados. Esto ahorra el tiempo necesario para el
procesamiento manual de documentos y la entrada de datos.

 Encuentra los documentos requeridos mediante la búsqueda rápida de un término


en la base de datos para que usted no tenga que ordenar manualmente los
archivos en un cuadro.

 Convierte notas escritas a mano en textos y documentos editables.

Soluciones de inteligencia artificial

El OCR es muchas veces parte de otras soluciones de inteligencia artificial que las
empresas pueden implementar. Por ejemplo, escanea y lee matrículas y señales de
tránsito en vehículos autónomos, detecta logotipos de marcas en publicaciones en redes
sociales o identifica envases de productos en imágenes publicitarias. Esta tecnología de
inteligencia artificial ayuda a las empresas a tomar mejores decisiones operativas y de
marketing que reducen los gastos y mejoran la experiencia del cliente.
¿Para qué se utiliza el OCR?

A continuación, se incluyen algunos casos de uso comunes de OCR en varios sectores:

Banca

El sector bancario utiliza el OCR para procesar y verificar el papeleo de documentos de


préstamo, cheques de depósito y otras transacciones financieras. Esta verificación mejoró
la prevención de fraude y mejoró la seguridad de las transacciones.

Sanidad

El sector de la salud utiliza el OCR para procesar registros de pacientes, incluidos


tratamientos, pruebas, registros hospitalarios y pagos de seguros. El OCR ayuda a
optimizar el flujo de trabajo y reduce el trabajo manual en los hospitales mientras
mantiene los registros actualizados. Por ejemplo, nib Group ofrece seguros médicos y de
salud a más de un millón de australianos y recibe miles de solicitudes médicas al día.

Logística

Las empresas de logística utilizan el OCR para rastrear etiquetas de paquetes, facturas,
recibos y otros documentos de manera más eficiente. Por ejemplo, Foresight Group utiliza
Amazon Textract para automatizar el procesamiento de facturas en SAP.

¿Cómo puede ayudar AWS con el OCR?

AWS ofrece dos servicios que pueden ayudarlo a implementar el OCR en su empresa:

Amazon Textract es un servicio de machine learning (ML) que utiliza el OCR para extraer
de forma automática texto, escritura a mano y datos de documentos escaneados, como
archivos PDF. Puede leer miles de documentos diferentes en varios diseños y formatos a
alta velocidad. Cuando extrae información de los documentos.

También podría gustarte