Aplicación de Espacios Vectoriales en La Computación
Aplicación de Espacios Vectoriales en La Computación
Aplicación de Espacios Vectoriales en La Computación
ABAD DE CUSCO
Ingenieria Informatica y de sistemas
ÁLGEBRA LINEAL
Docente: Vaidya Ines Carrillo Segura
Estudiante: Código :
Osbaldo Dan Callhua Aldazabal 174838
Denis Omar Cuyo Ttito 182906
Yerson Salinas Atausinchi 171605
Accent Bladimir Ortega Sullcaccori 182926
Juan Manuel Zuniga Auccahuaqui 182942
Elvis Jorge Huaman Mendoza 182914
Hayder Auccaise Ronco 182896
Aplicaciones de Espacios Vectoriales en la Informática Álgebra Lineal
Índice
Introdución 3
Resumen 4
3. Conclusiones 19
4. Bibliografía 19
Índice de figuras
1. Operaciones para la recuperación de documentos . . . . . . . . . . . . . 5
2. Componentes básicos de un sistema de recuperación de Información . . . 6
3. Similaridad de un documento d y la consulta q mediante producto escalar 10
4. El ángulo del coseno . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
5. Fórmula para el cálculo del coeficiente de similaridad de Dice . . . . . 13
6. Fórmula para el cálculo del coeficiente de similaridad de Jaccard . . . . 15
7. Imagen binaria obtenida después del filtrado Canny en zona de patrones
biométricos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
8. Imagen que contiene el rostro humano procedente de un estudio fotográfico 16
9. Patrones biométricos identificados sobre estudio fotográfico (Figura 8)
implementado filtros Canny . . . . . . . . . . . . . . . . . . . . . . . . 17
10. Ejemplo de pixelación . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
11. Ejemplo de imagen vectorial . . . . . . . . . . . . . . . . . . . . . . . . 18
1
Aplicaciones de Espacios Vectoriales en la Informática Álgebra Lineal
Índice de cuadros
1. Representación del vector de un documento . . . . . . . . . . . . . . . . 8
2. Obsérvese el documento1 y una consulta q dada por el usuario con sus
pesos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
3. Producto Escalar de pesos binarios . . . . . . . . . . . . . . . . . . . . 11
4. Producto escalar de pesos TF-IDF . . . . . . . . . . . . . . . . . . . . 12
5. Cálculo del coeficiente de similaridad de Dice . . . . . . . . . . . . . . 14
6. Cálculo del coeficiente de similaridad de Jaccard . . . . . . . . . . . . . 15
2
Aplicaciones de Espacios Vectoriales en la Informática Álgebra Lineal
Introducción
3
Aplicaciones de Espacios Vectoriales en la Informática Álgebra Lineal
Resumen
Para recuperar información es necesario elaborar o contar con una base de datos com-
puestas por documentos.
En el sistema SRI se procesa una serie de operaciones básicas sobre los documentos
almacenados, como son: un método de localización, introducción de nuevos documentos,
modificación de los documentos que ya estén almacenados y eliminación de los mismos.
Cuando queremos acceder a información en una base de datos se consulta, esa consulta
llega a ser comparado con cada elemento de la colección mediante sus pesos TF-IDF,
si se tiene un alto grado de coincidencia y por ende tiene más probabilidades de ser
relevante: nos devuelve lo que buscamos.
4
Aplicaciones de Espacios Vectoriales en la Informática Álgebra Lineal
5
Aplicaciones de Espacios Vectoriales en la Informática Álgebra Lineal
6
Aplicaciones de Espacios Vectoriales en la Informática Álgebra Lineal
Salton fue el primero en proponer los SRI basados en Espacio Vectorial SRI-EV a finales
de los 60, dentro del marco del proyecto SMART. Como bien sabemos podemos representar
los documentos como vectores de términos, siguiendo esa línea los documentos podrán
encontrarse en un espacio vectorial de n dimensiones, es decir, con tantas dimensiones
como elementos tenga el vector. Situado en ese espacio vectorial, cada documento cae
entonces en un lugar determinado por sus coordenadas.
Al igual que en un espacio de tres dimensiones cada objeto queda bien ubicado si se
especifican sus tres coordenadas espaciales. Se crean así grupos de documentos que
quedan próximos entre sí a causa de las características de sus vectores. Estos grupos
o clusters están formados, en teoría, por documentos similares, es decir, por grupos de
documentos que serían relevantes para la misma clase de necesidades de información. En
una base de datos documental organizada de esta manera, resulta muy rápido calcular la
relevancia de un documento a una pregunta (su RSV), y siendo muy rápida también la
ordenación por relevancia, ya que, de forma natural, los documentos ya están agrupados
por su grado de semejanza.
En la fase de la consulta, cuando se formula una pregunta, también se la deja caer en
este espacio vectorial y, así, aquellos documentos que queden más próximos a ella serán,
en teoría, los más relevantes para la misma. La representación de los documentos y las
consultas se realiza mediante la asociación de un vector de pesos no binarios (un peso
por cada término de índice). Por ejemplo, di = (ti1 , ti2 , ti3 , . . . , tin ).
El hecho de que tanto los documentos como las consultas tengan la misma representación
dota al sistema de una gran potencialidad. Y facilita la búsqueda y recuperación de
archivos.
En resumen el modelo de espacio vectorial se basa en el grado de similaridad de una
consulta dada por el usuario con respecto a los documentos de la colección cuyos términos
fueron ponderados mediante TF-IDF. Se basa en tres principios esenciales:
La equiparación parcial, esto es, la capacidad del sistema para ordenar los resultados
de una búsqueda, basado en el grado de similaridad entre cada documento de la
colección y la consulta.
La ponderación de los términos en los documentos, no limitándose a señalar la pre-
sencia o ausencia de los mismos, sino adscribiendo a cada término en cada documento
un número real que refleje su importancia en el documento.
La ponderación de los términos en la consulta, de manera que el usuario puede
asignar pesos a los términos de la consulta que reflejen la importancia de los mismos
en relación a su necesidad informativa.
7
Aplicaciones de Espacios Vectoriales en la Informática Álgebra Lineal
A este conjunto de números reales, que son los pesos, que representan al documento, se
les denomina Vector del documento, permitiendo su representación en el espacio
vectorial y en consecuencia, su tratamiento matemático. Por ello la formulación del vector
se representa de la siguiente forma, véase Cuadro 1.
8
Aplicaciones de Espacios Vectoriales en la Informática Álgebra Lineal
Cuadro 2: Obsérvese el documento1 y una consulta q dada por el usuario con sus pesos
9
Aplicaciones de Espacios Vectoriales en la Informática Álgebra Lineal
10
Aplicaciones de Espacios Vectoriales en la Informática Álgebra Lineal
11
Aplicaciones de Espacios Vectoriales en la Informática Álgebra Lineal
12
Aplicaciones de Espacios Vectoriales en la Informática Álgebra Lineal
Es posible medir cuál es la desviación de un documento con respecto a una consulta, por
el número de grados del ángulo que forman. Esto es posible porque crean una estructura
triangular a la que se aplica el cálculo del ángulo que forma la hipotenusa (en este
caso el vector del documento1) y el adyacente (el vector q de la consulta dada por el
usuario) que resulta ser el coseno del triángulo. En el caso de la Figura 4, se comprueba
visualmente cierta distancia del vector de la consulta con respecto al documento1; cuando
ambos vectores se muestran tan próximos como para superponerse, implicará que el ángulo
que forman será menor y que su nivel de coincidencia será superior. De hecho, un coseno
de 0o implicaría una similaridad máxima.
13
Aplicaciones de Espacios Vectoriales en la Informática Álgebra Lineal
14
Aplicaciones de Espacios Vectoriales en la Informática Álgebra Lineal
15
Aplicaciones de Espacios Vectoriales en la Informática Álgebra Lineal
Figura 7: Imagen binaria obtenida después del filtrado Canny en zona de patrones bio-
métricos
De acuerdo a lo anterior, los bordes de los patrones biométricos de los rasgos locales
y del contorno de las estructuras adicionales de la fotografía se referencian con un uno
lógico, dato que es de interés dado que se asocia con la estructura singular del patrón
biométrico.
16
Aplicaciones de Espacios Vectoriales en la Informática Álgebra Lineal
17
Aplicaciones de Espacios Vectoriales en la Informática Álgebra Lineal
Imagen vectorial:
La imagen vectorial se almacena como una lista que describe cada uno de sus vectores
componentes, su posición y sus propiedades. En cuanto a la resolución, los gráficos
vectoriales son independientes de la resolución ya que no dependen de una retícula
de pixeles dada.
18
Aplicaciones de Espacios Vectoriales en la Informática Álgebra Lineal
3. Conclusiones
Los sub espacios vectoriales en relación a la identificación de personas (llave de cifrado) es
hasta hoy el mejor método para distinguir a las personas, unas de otras. El reconocimiento
facial al igual que el reconocimiento ocular no es tan efectivo ya que hay casos, donde
dos personas puedan tener las mismas características (los mismos subespacios vectoriales).
Por el contrario, el reconocimiento por huella digital es el mas efectivo hasta ahora por
que hasta el momento no existe un caso excepcional. “La conjugación de los nucleótidos
de cada persona es única” y la mejor forma de representarlo es mediante una imagen
vectorial. Y es por eso que es grandioso el uso de espacios y subespacios vectoriales en
este tipo de imágenes.
4. Bibliografía
Referencias
[1] Holger Billhardt. Fusión de modelos vectoriales y contextuales para la recuperación
de información. PhD thesis, Informatica, 2003.
[2] Lluís Codina. Teoría de recuperación de información: modelos fundamentales y aplica-
ciones a la gestión documental. Information World en español, 38:18–22, 1995.
[3] José Antonio Moreiro González. Aplicaciones al análisis automático del contenido
provenientes de la teoría matemática de la información. In Anales de documentación,
volume 5, pages 273–286. Facultad de Comunicación y Documentación y Servicio de
Publicaciones de la . . . , 2002.
[4] María Dolores Olvera Lobo et al. Métodos y técnicas para la indización y la recupe-
ración de los recursos de la world wide web. 1999.
19