Reconocimiento de Patrones

Descargar como docx, pdf o txt
Descargar como docx, pdf o txt
Está en la página 1de 9

El RECONOCIMIENTO DE PATRONES

El término de reconocimiento de patrones se refiere a un procesamiento de información


que tiene una gran importancia práctica que da solución a un amplio rango de problemas.
Algunos de estos problemas son resueltos por los humanos sin mucho esfuerzo. Sin
embargo, en muchos casos, la solución a estos problemas, usando computadoras, se
vuelve extremadamente dificultosa [Bishop, 1995]. Reducir estas dificultades,
construyendo métodos y algoritmos, es el objetivo principal del Reconocimiento de
patrones como una disciplina de la Ingeniería de Sistemas.

En términos más concretos, el Reconocimiento de Patrones como una disciplina científica


tiene el objetivo de clasificar objetos en un número específico de categorías o clases.
Dependiendo de la aplicación, estos objetos pueden ser imágenes, sonidos, olores, en
general, señales producto de mediciones que deben ser clasificadas. Estos objetos se
denotan con el término genérico de patrones. [Theodoridis y Koutroumbas, 1999].

La producción industrial se está automatizando y esto ha logrado hacer del


Reconocimiento de Patrones un tema de investigación importante en el campo de la
Ingeniería de Sistemas, como parte integral de los Sistemas Inteligentes.

Introducción
El reconocimiento de patrones —también llamado lectura de patrones, identificación de
figuras y reconocimiento de formas—1 consiste en el reconocimiento de patrones de
señales. Los patrones se obtienen a partir de los procesos de segmentación, extracción de
características y descripción donde cada objeto queda representado por una colección de
descriptores. El sistema de reconocimiento debe asignar a cada objeto su categoría o clase
(conjunto de entidades que comparten alguna característica que las diferencia del resto).
Para poder reconocer los patrones se siguen los siguientes procesos:

 adquisición de datos
 extracción de características
 toma de decisiones

El punto esencial del reconocimiento de patrones es la clasificación: se quiere clasificar


una señal dependiendo de sus características. Señales, características y clases pueden ser
de cualquiera forma, por ejemplo se puede clasificar imágenes digitales de letras en las
clases «A» a «Z» dependiendo de sus píxeles o se puede clasificar ruidos de cantos de los
pájaros en clases de órdenes aviares dependiendo de las frecuencias.

PRINCIPALES APLICACIONES
Visión de máquina.
Esta aplicaciones tienen que ver con la captura de imágenes con ayuda de cámaras
digitales y la interpretación automática de lo que esta en la imagen. Este tipo de
aplicaciones surgen en la industria para automatizar la inspección visual en la línea de
ensamblaje.

Reconocimiento de caracteres
Es otra área importante del Reconocimiento de Patrones, sus aplicaciones están
relacionadas con la transformación de textos impresos o manuscritos a formato digital, lo
que permite una mayor flexibilidad en la manipulación de la información.

Diagnóstico ayudado por computador


yon aplicaciones destinadas a ayudar al experto en el diagnóstico de situaciones. En
especial se han desarrollado sistemas que ayudan a los doctores en el diagnóstico de
enfermedades a partir de datos médicos, tales como las mamografías de Rayos X,
imágenes digitales de la tomografía, ecografías, electrocardiogramas y
electroencefalogramas.

Reconocimiento de voz
La voz es el recurso más natural que los humanos usamos para comunicarnos e
intercambiar información. La aplicación, en este caso, tiene que ver con la construcción
de máquinas que puedan reconocer la información hablada.

Clasificación
La clasificación trata de asignar las diferentes partes del vector de características a grupos
o clases, basándose en las características extraídas. En esta etapa se usa lo que se conoce
como aprendizaje automático, cuyo objetivo es desarrollar técnicas que permitan a las
computadoras aprender.
Utiliza habitualmente uno de los siguientes procedimientos:

 Geométrico (Clustering): Los patrones deben ser graficables. En este


enfoque se emplea el cálculo de distancias, geometría de formas, vectores
numéricos, puntos de atracción, etc.
 Estadístico: Se basa en la teoría de la probabilidad y la estadística, utiliza
análisis de varianzas, covarianzas, dispersión, distribución, etc.
Supone que se tiene un conjunto de medidas numéricas con distribuciones de
probabilidad conocidas y a partir de ellas se hace el reconocimiento.

 Sintáctico‐estructural: se basa en encontrar las relaciones estructurales que


guardan los objetos de estudio, utilizando la teoría de lenguajes formales, teoría
de autómatas, etc. El objetivo es construir una gramática que describa la estructura
del universo de objetos.
 Neuro‐reticular: se utilizan redes neuronales que se ‘entrenan’ para dar una cierta
respuesta ante determinados valores.
 Lógico‐combinatorio: se basa en la idea de que el modelado del problema debe
ser lo más cercano posible a la realidad del mismo, sin hacer suposiciones que no
estén fundamentadas. Se utiliza para conjuntos difusos y utiliza lógica simbólica,
circuitos combinacionales y secuenciales, etc.
 Según tengamos constancia o no de un conjunto previo que
permita al sistema aprender, la clasificación puede ser
supervisada, parcialmente supervisada o no supervisada.
a) Clasificación supervisada: también es conocida como clasificación con
aprendizaje. Se basa en la disponibilidad de áreas de entrenamiento. Se trata de
áreas de las que se conoce a priori la clase a la que pertenecen y que servirán para
generar una signatura espectral característica de cada una de las clases. Se
denominan clases informacionales en contraposición a las clases espectrales que
genera la clasificación no supervisada.
Algunos métodos de la clasificación supervisada:

 Funciones discriminantes: si son dos clases, se busca obtener una función


g tal que para un nuevo objeto O, si g(O) ≥ 0 se asigna a la clase 1 y en
otro caso a la 2. Si son múltiples clases se busca un conjunto de funciones
gi y el nuevo objeto se ubica en la clase donde la función tome el mayor
valor.
 Vecino más cercano: un nuevo objeto se ubica en la clase donde esté el
objeto de la muestra original que más se le parece.
 Redes neuronales artificiales: denominadas habitualmente RNA o en sus
siglas en inglés ANN. Se supone que imitan a las redes neuronales reales
en el desarrollo de tareas de aprendizaje.

b) Clasificación parcialmente supervisada: también conocida como


de aprendizaje parcial. En estos problemas existe una muestra de objetos solo en
algunas de las clases definidas.
c) Clasificación no supervisada: también conocida como clasificación sin
aprendizaje. Se utilizan algoritmos de clasificación automática multivariante en
los que los individuos más próximos se van agrupando formando clases.

 Restringida: el número de clases en la que se estructurará la muestra está


previamente definido.
 Libre: el número de clases en la que se estructurará la muestra depende
exclusivamente de los datos.
Algunos métodos de la clasificación no supervisada:

 Simple Link y Complete Link: parten de grupos unitarios de objetos y van


uniendo los grupos más parecidos en cada etapa, hasta cumplir alguna
condición.
 ISODATA: se van formando grupos que se ajustan iterativamente usando
teoría de probabilidades. En algunas versiones se puede hacer la unión o
división de algún grupo.
 C-means: se define un grupo de semillas, se asocia cada objeto al grupo de la
semilla más parecida, se toman los centroides de cada grupo como nuevas
semillas y se itera hasta que se estabilice.
 Criterios lógico-combinatorios: los criterios que se imponen a los grupos son
tales como ser conexos, completos maximales, compactos, etc.

Algoritmos de Aprendizaje por Corrección del error

Los pesos se ajustan en función de la diferencia entre los valores deseados y los obtenidos
en la salida.
 ∆wij = α xi (dj - xj )
donde:
 ∆wij Variación en el peso de la conexión entre el i-ésimo nodo y el j-ésimo.
 α Umbral en el aprendizaje que regula velocidad y precisión (0 < α ≤ 1)
 xi Salida del i-ésimo nodo
 xj Salida del j-ésimo nodo
 dj Valor de salida deseado del j-ésima unidad de procesamiento

Representar los Patrones en una Matriz


Un artificio muy interesante para representar tanto letras del abecedario como los dígitos
numéricos (A..Z, a..z, 0..9) es usar una matriz de 7 x 6 del modo mostrado en la figura
N.º 10.

El artificio para representar un número en dicha matriz, será poner el valor uno (1) en las
celdas por donde pasa la marca del número y el valor cero (0) en caso contrario. Por
ejemplo el número tres se podría representar tal como muestra la figura N.º 11.

Puntos comunes entre REP y RNA.


Las RNA y las técnicas de REP están muy relacionadas y comparten algunos de los
problemas de diseño. En la comunidad de Redes Neuronales se considera el
reconocimiento de patrones como una de los problemas más desafiantes. Por otro lado,
en la comunidad de reconocimiento de patrones, las RNA se consideran un potente
complemento a las técnicas clásicas. Es difícil estimar el grado de solapamiento entre las
RNA y el REP porque ello requeriría el conocimiento de los límites precisos entre ambas
disciplinas. Werbos[Werb 91], estima que un 80% del trabajo que se realiza con Redes
Neuronales se hace en el campo del reconocimiento de patrones. Alguno de los puntos
comunes entre ambas técnicas se plantean en los campos de representación, extracción de
características y clasificadores.
Representación.

Una buena representación de patrones debería cumplir, al menos, los siguientes


requisitos: - Tasa de compresión de datos alta. - Buena capacidad discriminatoria. -
Invariancia frente a transformaciones de los datos. - Robustez frente al ruido.
En la mayoría de los sistema de REP, los esquemas de representación son desarrollados
por los diseñadores usando su conocimiento y experiencia en el dominio del problema.
Una vez que el sistema de reconocimiento está desarrollado, estos esquemas son
inamovibles. En muchas aplicaciones con RNA se sigue el mismo procedimiento de
forma que la red neuronal lleva a cabo, en esencia, el proceso de clasificación. Sin
embargo, las redes neuronales tienen la propiedad de construir una representación interna
de los patrones (extracción de características), aunque difícilmente visible. Por esta razón,
algunos investigadores alimentan a la red con los datos en bruto (o con un preproceso
mínimo, como normalización) y esperan que la propia red extraiga (aprenda) una
representación a partir de ellos. En cualquier caso, una representación adecuada de los
datos facilita el proceso de toma de decisión y mejora las tasas de generalización. Sin
embargo, el diseño de una buena representación exige un conocimiento profundo de la
naturaleza del problema, lo cual no siempre es posible. La forma de aprender un esquema
de representación partiendo de un conjunto de datos es todavía un problema abierto.
Extracción de características.

El término "extracción de características" tiene un doble significado. Por un lado, se


refiere al proceso de extraer alguna medidas numéricas de los datos en bruto de los
patrones (representación inicial). Por otro lado, se define también como el proceso de
formar un conjunto de características (de dimensión n) partiendo de los datos de entrada
(de dimensión m>n). La extracción de características y la proyección de datos
multivariantes son aspectos importantes en REP. La extracción de características puede
evitar el problema de la dimensionalidad, mejorar la tasa de generalización y reducir los
requisitos computacionales del clasificador. La proyección de datos nos permite
visualizar en 2D o 3D datos de dimensión mayor para facilitar el análisis. Existen alguna
técnicas clásicas para extraer y proyectar datos, que se pueden clasificar en cuatro grupos:

 Lineales no supervisadas: análisis de componentes principales (PCA).


 Lineales supervisadas: análisis discriminante lineal.
 -No lineales, no supervisadas: análisis discriminante no paramétrico.
 No lineales, supervisadas: algoritmo de Sammon.

Para extracción de características y proyección de datos multivariantes existen multitud


de algoritmos basados en RNA, que pueden clasificarse en dos grupos:
-nuevas RNA diseñadas explícitamente con este fin: SOM, NP-SOM, [Koh 94]

- Extracción de reglas de formación partiendo de los pesos de una RNA entrenada.


Esta es una línea de investigación muy activa que trata de encontrar formas de representar
explícitamente el conocimiento almacenado en los pesos de la red. Con ello se
combinarían las ventajas inherentes a las RNA (adaptabilidad, rapidez en la fase de
reconocimiento, etc) con las de las técnicas clásicas (conocimiento explícito del
problema).
Clasificación.
En REP, el objetivo es asignar un patrón de entrada x, de dimensión n a una de las las c
clases o categorías, C1 , C2, ..Cc . Si las densidades condicionales p(x | Ci ) y las c
densidades a priori, p(Ci) se conocen, la estrategia óptima de clasificación es la regla de
Bayes: asignar x a la clase Ck si se cumple la condición:

donde p(Ck | x) se llama la probabilidad a posteriori y se calcula por la ley de Bayes. En


REP una regla de decisión se puede formula a menudo en forma de una función
discriminante gi (x) , i=1...c. Se asigna x a la clase k si gk (x) > gj (x) , "j¹k. Algunas RNA
muy usadas, como el perceptrón multicapa o las funciones de base radial, en realidad,
calculan funciones discriminantes no lineales. En REP la forma de calcular las funciones
discriminantes es bastante más complicada e implica establecer estimaciones de las
densidades condicionales.

El perceptrón multicapa es un clasificador óptimo en el sentido de Bayes si las densidades


condicionales de las clases son gaussianas con matrices de covarianza idénticas.[Pao 89]
. Si estas premisas no se cumplen, el funcionamiento del perceptrón puede ser muy pobre
y es necesario tomar algunas medidas adicionales para mejorarlo. En muchos problemas
de REP no se conoce ni siquiera la forma de las densidades condicionales. En estos casos
o bien se postula una forma, o se diseñan métodos no paramétricos como los
clasificadores de los k vecinos. En el caso de las RNA, existen una serie de redes que
pueden abordar este problema con ciertas garantías de éxito: las redes neuronales
probabilísticas (PNN), la máquina de Boltzmann que aprende las densidades
condicionales con una serie de variantes (máquina de Boltzmann determinista, por
ejemplo).

En los clasificadores de árbol la decisión final se alcanza por una secuencia de decisiones
intermedias (nodos no terminales) siguiendo un camino desde un nodo raíz a un nodo
hoja terminal. En cada nodo, se usa solamente un subconjunto de las características para
decidir. Se ha demostrado que un clasificador de árbol equivale a un perceptrón de tres
capas, aunque no se ha encontrado evidencia de cual de ellos funciona mejor

En las técnicas de agrupamiento (clustering) se ha demostrado que las RNA empleadas


para tal fin (SOM, ART, LVQ) son equivalentes a técnicas de REP (k medias, conductor
secuencial, etc). No obstante, quedan todavía muchos puntos difíciles sin resolver. En
particular la relación entre el tipo de métrica (distancia) empleada y las prestaciones del
clasificador.

La capacidad de generalización de los clasificadores, clásicos o basados en RNA, depende


básicamente de tres factores:

 Número de patrones de entrenamiento.


 Las densidades condicionales presentes en los datos.
 La complejidad del clasificador.
Las relaciones son más o menos conocidas si las distribuciones son gaussianas. En caso
contrario, el problema de determinar las tasa de generalización de un clasificador es
intratable y el método de prueba y error es el único disponible. Intuitivamente, parece
obvio que cuantas más muestras de entrenamiento se utilicen mejor será el clasificador.
Pero no siempre se puede disponer de muchas muestras y por este motivo se están
desarrollando técnicas que mejoren las tasas de generalización de una red neuronal, que
son similares a las empleadas para seleccionar el mejor clasificador de un conjunto dado
en REP Estas técnicas se basan en algunas de las siguientes categorías:

 Compartición de conexiones locales y pesos.


 Podado adaptativo de la red
 Crecimiento adaptativo de la red
 Regularización.

Conclusión.
Las RNA proporcionan una batería de tratamientos nuevos, o complementarios, para
abordar el problema de reconocimiento de patrones. Pero además se han desarrollado
arquitecturas computacionales que pueden emplearse para la implementación de alguno
de los algoritmos de REP. La adaptabilidad de las RNA es crucial para los problemas de
reconocimiento no solamente para mejorar la tasa de generalización sino también para
permitir un buen comportamiento frente a cambios en el entorno o frente a datos de
entrada incompletos o ruidosos. En este sentido, los métodos basados en RNA son
mejores que los clásicos de REP. Sin embargo, las RNA pueden también beneficiarse de
algunos resultados bien conocidos en REP, especialmente en el campo de representación
de patrones, donde se encuentran actualmente los desafíos importantes en el modelado
neuronal. Muy posiblemente ambos campos, RNA y REP, deberán llegar tarde o
temprano a una especie de sinergia que combine las fortalezas de los dos tratamientos a
la hora de abordar problemas de reconocimiento de patrones muy complejos. En esta
sinergia no sólo son importantes los componentes individuales de extracción de
características, toma de decisión y agrupamiento sino que es esencial una buena
metodología de integración de todos ellos. Este punto de vista coincide y es una de las
líneas en que el reconocimiento automático de patrones evolucionará en el futuro.
Bibliografía
Hugo Vega Huerta, A. C. (2009). Reconocimiento de patrones mediante redes
neuronales . Revista de Ingeniería de Sistemas e Informática.
Mayta, R. R. (2009). INTRODUCCION AL RECONOCIMIENTO DE PATRONES.
Fides et Ratio - Revista de Difusión cultural y científica de la Universidad La
Salle en Bolivia.
Peñas, M. S. (2012). RECONOCIMIENTO DE PATRONES PARA IDENTIFICACION
DE USUARIOS. madrid.
Tello, J. C. (2008). Reconocimiento de patrones y el aprendizaje no. Escuela Técnica
Superior de Informática Universidad de Alcalá.

También podría gustarte