Monografia Machine Learning

1.
Introducción
Las tecnología ha estado en constante cambio en los últimos años, se han
logrado avances que en el siglo pasado eran inimaginables para el hombre, con
estos cambios también se han ido creando nuevas disciplinas entre ellas una de
las más populares por la su cantidad de aplicaciones es la Inteligencia Artificial.
Uno de los grandes problemas con los que nos enfrentamos los estudiantes
hispanohablantes de Ingeniería en Sistemas Computacionales es la poca canti-
dad de información que hay en nuestro idioma y esto no es una excepción con la
Inteligencia Artificial. Es por eso que el presente trabajo dará una introducción
a quien este interesado en aprender uno de los principales tipos de Inteligencia
Artificial: el Machine Learning.
Algunas de las razones por las que el Machine Learning es una disciplina
que ha empezado a ser utilizada para solucionar distintos problemas son las
siguientes:
Los procesos modernos cada vez son mas poderosos. El rendimiento de las
computadoras ha mejorado exponencialmente.
El costo de almacenamiento y procesamiento de una gran cantidad de
datos ha bajado. Además los nuevos dispositivos de almacenamiento tienen
la capacidad de analizar en menos tiempo una gran cantidad de datos.
El computo distribuido, a través de los llamados çlusters", ha permitido
el procesamiento de datos con una gran complejidad.
La cantidad de datos que generamos gracias a Internet ha permitido un
mayor soporte para el análisis de los mismos. Algunos de estos están dis-
ponibles en los servicios de la nube y en las llamadas .APIs"(Application
Programming Interfaces).
Los algoritmos de Machine Learning están disponibles gracias a las co-
munidades que se han formado y comparten los mismos de forma .open
source". Además de que hay más recursos, frameworks y librerias para
facilitar las tarea de los desarrolladores.
Gracias a estas razones el Machine Learning es una disciplina que cualquier
estudiante relacionado con las Ciencias Computacionales debe de empezar a
interesarse y aprender sobre ésta. Sin embargo el Machine Learning no es una
disciplina reciente, sus orígenes se remontan a los años 50’s, pero debido a su
complejidad no había mucha evolución en la disciplina hasta años recientes. En
el trabajo se abarca un poco la historia de la Inteligencia Artificial y también
del Machine Learning, además de algunos antecedentes que es indispensable co-
nocer para adentrarse en el Machine Learning debido a que no es una disciplina
aislada, se sustenta de 3 disciplinas que lo ayudan a tener mejores resultados:
la Estadística, el Big Data y la Minería de Datos.
También se tocan los tipos de algoritmos de Machine Learning y se dan

explican algunos algoritmos de clasificación, debido a que son los más utilizados.
Por último se hablan de algunas aplicaciones en el panorama mundial, además
que se da un pequeño énfasis del estatus de la disciplina en México.
1
2. Inteligencia Artificial
Inteligencia Artificial (IA) es un término que en los últimos años ha empeza-
do a popularizarse debido a los avances que se han hecho en el área, sin embargo
es un término acuñado desde los años 50’s. La historia de la IA comienza en
el año de 1943 cuando Waren McCulloch y Walter Pitts desarrollan el primer
modelo de red neuronal, 7 años después uno de los personajes más notables en
las ciencias de la computación, Alan Turing, se pregunta Çan machines think?".
En 1956 IBM organiza el primer congreso sobre inteligencia artificial en el Daur-
mouth College en Estados Unidos, donde es usado por primera vez el termino
ïnteligencia artificial".
La inteligencia artificial refiere a todo sistema o maquinas que puedan "pen-

sar", es decir, que imiten la inteligencia humana. Entre los principales subcon-
juntos se encuentran:
Rasioning".
"Natural Lenguaje Processing (NLP)".
"Planning".
"Machine Learning (ML)".
3. Machine Learning
Cuando se habla de Machine Learning se suele usar para referirse de IA,
si bien todo algoritmo de Machine Learning es Inteligencia Artificial no toda
la Inteligencia Artificial es Machine Learning. Machine Learning se centra en
desarrollar sistemas que aprenden o mejoren el rendimiento, en función de los
datos que consumen.
Una de las frases más citadas para referirse a Machine Learning es la del
creador del término, Arthur Samuel, quien en 1959 dijo: "Machine Learning es
el campo de estudio que da a las computadoras la habilidad de aprender sin
ser programadas explícitamente". 40 años mas tarde Tom Mitchell se refirió al
Machine Learning como: "Se dice que un programa de computadora aprende de
experiencia E, con respecto a alguna tarea T y alguna medida de desempeño P,
mejora con experiencia E".
Algunos años más tarde el propio Mitchell en un articulo titulado "The dis-
cipline of Machine Learning"publicado en el 2016 extendió su definición sobre
el Machine Learning: Machine Learning es la intersección de la Estadística y
las Ciencias de la Computación y principalmente se centra en cómo hacer que
las computadoras se programen a ellas mismas a partir de la experiencia y es-
tructuras iniciales. Si la Estadística se enfoca en las conclusiones que se pueden
inferir a través de los datos, el Machine Learning se enfoca en como los sistemas
computacionales y algoritmos pueden ser usados para optimizar la captura. al-
macenamiento, clasificación, recuperación y unión de los datos.
2
La Estadística no es la única disciplina que sustenta al Machine Learning,
además de ésta la Minería de Datos y el Big Data son indispensable para el
funcionamiento de los sistemas de Machine Learning.
3.1. Estadística
La Estadística es una de las ciencias que más aplicaciones tienen tanto en el
ámbito científico como en la vida cotidiana. Se encarga del análisis de los datos
para después buscar conclusiones con base en éstos. Existen dos vertientes de
la Estadística: la cualitativa que se encarga de la recopilación de información
de medios que no pueden ser medidos y la cuantitativa que se auxilia en la
recopilación y análisis de datos. Además de ayudar al procesamiento de datos la
estadística ayuda a comprobar la validez de los algoritmos de Machine Learning.
3.2. Big Data

Con el nacimiento y desarrollo del Internet la cantidad de datos que generan
los usuarios ha ido en aumento y es aquí donde muchas empresas tecnológicas
han encontrado una oportunidad para sacar provecho de la información median-
te su análisis.
Garnet, una de las consultoras más grandes sobre Tecnologías de la Infor-

mación (TIC’s), definió en el 2011 al Big Data (BD) como "datos que contienen
una mayor variedad y que se presentan en volúmenes crecientes y una veloci-
dad superior". Aunque sea un concepto nuevo el procesamiento de una gran
cantidad de datos es algo que se lleva realizando desde los 60’s. Anteriormente
el Business Intelligence (BI) era la disciplina que se encargaba del análisis de
datos, el problema es que la complejidad de los datos ha ido aumentando, éste
era diseñado para trabajar con datos altamente estructurados, bien entendidos
y en algunos almacenados en un repositorio relacional. A diferencia de BI el Big
Data trabaja con todo tipo de datos, ya sea estructurados, no estructurados y
semi-estructurados provenientes de correos electrónicos, redes sociales, mensa-
jería instantánea, imágenes y sensores de las maquinas.
Para que una "data source"sea considerada como BD tiene que tener por lo
menos una de las llamadas "4 V’s":Volumen, veracidad, velocidad y variedad.
Volúmenes extremadamente largos de datos.
La habilidad de transferir los datos a alta velocidad.
Siempre estar en constante expansión con la variedad de datos que con-
tiene.
Veracidad en los datos para que éstos puedan representar la verdad.
Los analistas de BD requieren tecnología diseñada para reunir, almacenar, ad-
ministrar y manipular grandes cantidades de datos con la velocidad correcta
y en el momento correcto para entender e interpretar de manera correcta los
datos. Gracias a los avances tecnológicos se ha hecho más barato el computo y
almacenamiento de datos y esto ha generado un gran interés e inversión de las
grandes start-ups de software.
3
3.3. Minería de Datos
La Minería de Datos (MD) es la conjunción de la Estadística y el Big Data.
Está basada en los principios de la Estadística, es el proceso de explorar y ana-
lizar grandes cantidades de datos para descubrir patrones entre ellos. A través
de programas de búsqueda e identificación de patrones y relaciones globales,
tendencias, desviaciones y otros indicadores aparentemente caóticos que tienen
una explicación que pueden descubrirse mediante diversas técnicas. El objetivo
fundamental es aprovechar el valor de la información localizada y usar los pa-
trones preestablecidos.
A diferencia del ML la Minería de Datos no se encarga de hacer predicciones

o de respaldar hipótesis, su objetivo es explicar y entender los datos. La MD es
usado para resolver un rango amplio de problemas como pueden ser detección
de fraude, estudio de mercado y un análisis de rotación de clientes. Las empre-
sas de software proveen software que permitan a la Minería de Datos procesar
datos estructurados y datos no estructurados, estas herramientas se encargan
de clasificar los datos en grupos con características similares.
Un ejemplo de la aplicación de la Minería de Datos es el siguiente: Suponga

que un mercadólogo esta interesado en conocer las características de las perso-
nas que respondieron a una promoción contra aquellos que no respondieron a
ésta. La Minería de Datos se utilizaría para extraer de los datos las diferencias
entre las dos clases y analizar cada una de sus características. El mercadólogo
podría querer predecir quien respondería satisfactoriamente a la promoción, sin
embargo como se dijo la MD no se encarga, para realizar esta tarea necesitamos
de la intervención humana. MD solo apoya a las decisiones tomadas por el mer-
cadólogo, aquí es donde entra el ML para realizar un proceso automático sin la
intervención humana.
La Estadística, el Big Data, la Minería de Datos y el Machine Learning todas

son disciplinas que tienen un rol para entender los datos, describir sus caracterís-
ticas y encontrar relaciones y patrones para construir un modelo. Las técnicas y
herramientas pertenecientes a cada disciplina pueden combinarse para resolver
una gran variedad de problemas.
Los algoritmos de Machine Learning y la Minería de Datos están basados

en los métodos utilizados por la Estadística clásica. Los científicos de datos
combinan la tecnología con la experiencia en Estadística, Minería de Datos y
Machine Learning para usar todas en colaboración.
4. Algoritmos de Machine Learning

Los algoritmos son los motores que impulsan el Machine Learning. Depen-
diendo de la naturaleza del problema a resolver se utilizan enfoques diferentes.
Los 3 principales tipos de algoritmos de Machine Learning son:
Aprendizaje supervisado.
Aprendizaje no supervisado.
4
Aprendizaje reforzado.
4.1. Aprendizaje supervisado

Los algoritmos supervisados de aprendizaje automático son los más utili-
zados. Con este modelo, un científico de datos actúa como guía y enseña al
algoritmo las conclusiones que debe hacer. El programa está “entrenado” en un
set pre-definido de “ejemplos de entrenamiento”, lo cual después facilitó su ha-
bilidad de alcanzar una conclusión acertada cuando se le pasa nueva data.
Por ejemplo puede haber millones de imágenes de animales y que incluyan

una explicación de que animal es cada uno, se puede crear una aplicación basada
en Machine Learning para distinguir cada animal de los otros. Después de poner
en marcha la aplicación, el algoritmo etiquetara cada imagen y los clasificará
en miles de categorías. Cuando se han identificado todas las características de
los datos, el usuario podrá identificar los errores que ha tenido la maquina y
corregirlos, en un proceso llamado regresión". La regresión te ayuda a entender
la correlación entre las variables.
Puede ocurrir que los patrones encontrados en una muestra de los datos
de entrenamiento no puedan ser identificados en una muestra de datos mucho
más grande, este problema es conocido como .Overfitting". El Overfitting ocurre
cuando tu algoritmo funciona para la etapa de entrenamiento y no para clasificar
una muestra de datos desconocida. Para proteger contra el overfitting necesitas
realizar la etapa de entrenamiento con datos ïmprevistos.o no etiquetados, así
puedes medir la exactitud de tu modelo para predecir resultados.
Los algoritmos de aprendizaje supervisado se dividen a su vez en dos tipos:

Sistemas de Regresión: Sistemas donde el valor que se predice está en algún
lugar de un espectro continuo. Estos sistemas nos ayudan con preguntas
tipo “¿Cuánto es?” o “¿Cuántos son?”.
Sistemas de Clasificación de Aprendizaje de Máquina: Sistemas en los cua-

les se busca una predicción de sí-o-no, por ejemplo: “¿Este tumor es can-
cerígeno?”, “¿Esta galleta pasó nuestro estándar de calidad?” y preguntas
por el estilo.
El aprendizaje supervisado es el más utilizado debido a que su complejidad

es menor con los otros tipos, además de que tiene una gran aplicación para
resolver distintos problemas, entre los principales se encuentran detección de
fraudes, recomendaciones, reconocimiento de discursos o análisis de riesgo.
4.2. Aprendizaje no supervisado

El aprendizaje automático no supervisado utiliza un enfoque más indepen-
diente, en el que una computadora aprende a identificar procesos y patrones
complejos sin que un ser humano proporcione una guía cercana y constante.
El aprendizaje automático no supervisado implica la capacitación basada en
datos que no tiene etiquetas o un resultado específico definido. En general se
5
utilizan cuando se tiene una gran cantidad de datos que no han sido etiquetados.
Una de las principales aplicaciones del aprendizaje no supervisado es el de

identificar grupos de amigos cercanos en redes sociales. Twitter, Instagram y
Facebook tienen una cosa en común: la gran cantidad de datos no etiquetados
que generan sus millones de usuarios. Entender el significado de todos estos da-
tos no es una tarea fácil, estas grandes empresas utilizan algoritmos capaces de
encontrar patrones y agrupar todos estos datos.
El aprendizaje no supervisado divide en segmentos los datos con característi-

cas similares llamados çlusters". A los datos se les asignan distintos parámetros
para después poder clasificarlos, en este punto se puede decir que se vuelve una
especie de aprendizaje supervisado. Las aplicaciones de este tipo de algoritmos
también es muy variada, pero es menos utilizado porque la complejidad de estos
algoritmos es mayor a la de los algoritmos de aprendizaje supervisado.
Entre sus principales aplicaciones es el filtrar los correos "spam", donde se

toman en cuenta una gran cantidad de variables para poder determinar si la
persona quiere o no recibir cierto tipo de correo, entre ellas están las palabras
utilizadas, el tipo de lenguaje, el asunto y muchas otras. Otro de los sectores
donde es muy utilizado es en el sector salud, recolectando una gran cantidad
de datos de una enfermedad en especifico y con un algoritmo de aprendizaje
no supervisado los doctores pueden tener un diagnostico para sus pacientes
en una cantidad menor de tiempo. En este caso en especifico un algoritmo de
aprendizaje supervisado no sería útil porque el etiquetar todos los datos sería un
proceso muy tardado, en cambio con un algoritmo de aprendizaje no supervisado
el proceso de etiquetado lo hace el sistema y toma menor tiempo hacerlo.
4.3. Aprendizaje reforzado

Los algoritmos de aprendizaje reforzado son algoritmos que reciben retro-
alimentación a partir del análisis de los datos que realiza, así los analistas de
datos pueden guiarlo y asegurarse de obtener mejores resultados. Puede sonar
parecido al aprendizaje supervisado porque al igual que éste tiene intervención
humana, la diferencia radica en que este tipo de algoritmos no esta entrenado
con un conjunto de datos de muestra. El sistema aprende a base de prueba y
error. En cierto punto se puede decir que es una combinación de el aprendizaje
supervisado y el no supervisado, porque tiene intervención humana, pero solo
al final del proceso, durante el proceso el sistema realiza todo sin alguna inter-
vención humana.
El proceso para producir algoritmos de aprendizaje reforzado o también

llamados .agents",o agente, es el siguiente:
1. Los datos de entrada son analizados por el agente.
2. La toma de decisiones es usado para que el agente realice una acción.
3. Luego de realizar la acción el agente recibe retroalimentación o reforza-
miento del usuario.
6
4. La retroalimentación es analizada y almacenada por el programa, después
se repite el proceso hasta llegar al resultado más optimo.
Una de las aplicaciones más conocidas es en la robótica, suponga que ha

construido un robot y quiere hacerlo caminar. En los primeros intentos el robot
caerá y los datos recabados por los sensores del robot serán analizados para
después ser recalibrados, en un proceso de prueba y error su robot aprenderá a
caminar. Los algoritmos de Machine Learning son capaces de encontrar relación
entre el caminar sin caer y la serie de acciones que debe de tomar el robot para
lograrlo.
Otra de las aplicaciones más conocidas es en los automóviles autónomos. A

diferencia del ejemplo anterior esta es una tarea mucho más complicada por la
cantidad de obstáculos con las que se puede encontrar el carro y no solo los
obstáculos sino también los otros chóferes y personas.
5. Algoritmos de clasificación
Una de las principales aplicaciones del aprendizaje de máquina es la clasifi-
cación de objetos. Los algoritmos de clasificación del machine learning buscan
que a partir de cualquier objeto se busca que a partir de un objeto xi , por
ejemplo la cáscara de un plátano, y una serie de clases V1 , V2 , . . . , Vn , por
ejemplo basura orgánica y basura inorgánica, pueda encontrarse una función f ,
o un afunción aproximada fˆ, tal que aplicada al objeto, se le asigne una clase
correcta, es decir f (xi ) = Vk . Pero esto es bastante díficil para una computadora
por sí sola; siguiendo con el ejemplo de la cáscara de plátano, existe el problema
de cómo decirle a la computadora que ésta es una basura orgánica. Es por esto
que una de las técnicas más utilizadas es generar vectores con a partir de las
características del objeto a clasificar, así como tener una serie de vectores, que
sabemos que pertenecen a cada una de las clases en las que clasificaremos los
objetos, con los que hemos de comparar para poder clasificar.
5.1. K - Vecinos más cercanos

Para esta clasificación primero debemos de enseñar al sistema, un conjunto
de vectores (x1 , f (x1 )), (x2 , (f x2 )), . . . , (xn , f (xn )) que conocemos pertenecen
a una clase Vi , del conjunto de clases V = {V1 , V2 , . . . , Vm }. Dichos vectores
serán la base con la que clasificaremos los objetos. Para clasificar un objeto, se
va a comparar con los k vecinos más cercanos a éste, donde k en la mayoría de
los casos es un número impar para evitar tener el mismo número de vecinos que
coinciden con distintas clases. Ya que cada objeto es un vector que denotaremos
como xq , para obtener la distancia entre xq y xi , donde xi es un vector cuya
clasificación es conocida, se utiliza el teorema de pitágoras.
v
u n
uX
d(xq , xi ) = t (ar (xq ) − ar (xj ))2
r=1
donde ar es el valor del r-ésimo atributo de alguno de los vectores xq , xj . [?

] Después de haber obtenido los k vecinos más cercanos a nuestro vector por
7
clasificar, compararemos cada uno de los k vectores, con las m clases entre las
cuales se pueden clasificar, es decir
k
X
fˆ(xq ) = arg max δ(Vi , f (xn ))
Vi ∈V
n=1
donde δ(Vi , f (xn )) = 1, si y sólo si Vi = f (xn ), es decir, que el vector xn

partenece a la clase Vi , de lo contrario es 0. [? ] Una desventaja de este algoritmo,
que es considerado como algoritmo perezoso (lazy lerning), es que cada que se
introduce o se clasifica un objeto se debe de comparar con todos los elementos
que ya han sido clasificados. [? ]
5.2. Máquina de soporte vectorial

Otro método de clasificación es usar una máquina de soporte vectorial (Su-
porter Vectorial Machine (SVM)), en este clasificador se busca aprender un
híperplano que separen los ejemplos que pertenecen a dos1 clases diferentes. Los
ejemplos que usaremos para enseñar a la máquina se ubican en un plano d -
dimensional y se busca encontrar una línea en ese espacio (d - 1 dimensiones)
que separe a los elementos de una clase de los elementos que pertenecen a una
clase distinta. [? ]
Clase 2
6 Clase 1
−1 1 2 3 4 5 6 7
Figura 1: Gráfica de 2 clases de objetos distintos
La figura (1) es una representación gráfica con cada uno de los casos de
ejemplo, luego, a partir de estos puntos se genera el híper plano que divide
ambas clases, así para d = 2 tenemos que el híper plano tiene es de la forma
wx + b = 0, donde w ∈ Rd es un vector de pesos y b el término de sesgo, estas
variables se aprenden a partir del conjunto de datos con los que entrenamos al
sistema, es decir, un conjunto D = {x1 , x2 , . . . , xn }. [? ]
1 Aunque puede extenderse a aún más clases.
8
6
−1 1 2 3 4 5 6 7
Figura 2: Gráfica de 2 clases de objetos distintos
Para clasificar un nuevo ejemplar xq , basta con determinar el lado del híper
plano en el que se localiza xq , esto es, la clase del nuevo objeto estará dada por:
f (xq ) = sign(mx + b)
de tal forma que los objetos que se encuentren por debajo del híper plano, i. e.,
los puntos en los que mx + b < 0, pertenecerán a una clase, y los puntos en los
que mx + b > 0 pertenecen a otra; recordadando que el híperplano es aquel tal
que mx + b = 0. En la SVM el híper plano que separa las clases es aquel que
maximiza el margen de separación entre ejemplos de ambas clases. Para obtener
dicho híper plano se resuelve el siguiente problema de optimización:
1
arg min ||w||2
w 2
sujeto a
yi (φ(xi ) + b) ≥ 1, ∀(xi , yi ) ∈ D
Es decir, el híper plano. Dicho de una manera sintetizada, debe encontrarse un
híper plano, tal que, divida a ambas clases, y además de ésto haya una distancia
equitativa entre los puntos más cercanos al híper plano de distintas clases, y
que ésta distancia sea máxima. El proceso de obtención de dicho híper plano,
conlleva un proceso de análisi matemático más profundo, pero el objetivo de esta
investigación no es ahondar en ese tipo de asuntos sino presentar los algoritmos
existentes. [? ]
5.3. Clasificador Bayesiano Simple

Este es un elemento de clasificación probabilista que asume independencia
entre los atributos descriptivos de los objetos dada la clase. Lo anterior hace
que los parámetros del clasificador puedan estimarse fácil y eficientemente. La
función de decisión que aproxima este clasificador es como sigue:
f (xj ) = arg max P̂ (Vk |xj )
Vk ∈V
donde P̂ (Vk |xj )) es un estimado de la probabilidad de que el objeto Xj per-

tenezca a la clase Vk . La clase para la que se maximice esa probabilidad se le
9
asignará al objeto. La probabilidad anterior puede ser calculada de muchas ma-
neras, en el caso del clasificador Bayesiano simple, sehace uso del teorema de
Bayes como sigue:
d
Y
P̂ (Vk |xj ) ≈ P̂ (xj,i |Vk )P (Vk )
i=1
Esta fórmula cuenta con dos elementos principales; en primera instancia tene-
mos P (Vk ) que denota la probabilidad de que un objeto pertenezca a la clase Vk ,
es decir, la probabilidad, dependiendo de cuantos elementos tenga cada clase de
que un nuevo objeto pertenezca a dicha clase. Por otro lado, se tiene una proba-
bilidad que depende del elemento xj , ésta se encuentra dada por la probabilidad
de que un valor caracerístico xj,i se encuentre en ejemplos del conjunto con el
que adoctrinamos el sistema , D, pertenecientes a la clase Vk . Por ejemplo, si nos
encontrásemos clasificando correos con spam, esta cantidad podría ser estimada
por la probabilidad de que una palabra (por ejemplo prestamo) aparezcan en
correos que son spam. [? ]
wx + b = 0, w ∈ Rn
6. Machine Learning y sus aplicaciones

Debido a la capacidad de tomar decisiones y predecir datos futuros, el ML
tiene muchas posibilidades de aplicación. También se debe considerar que los
avances tecnológicos de los últimos años, han modificado la forma de vida de
las personas y ha aumentado, en gran manera, la información que producen y
con la que interactúan. Los causantes de esto son redes sociales como Facebook,
Instagram, WhatsApp; y servicios en la web como marketplaces, transferencias
bancarias, servicios de streaming etc. los cuales generan una cantidad masiva
de datos, que es procesada día con día. La cantidad aproximada de datos ge-
nerados diariamente es de 2.5 billones de gigabytes, que contienen información
sobre nuestra actividad en la red, nuestros gustos y preferencias comerciales. [2]
Estos datos, son utilizados por diferentes empresas y organizaciones, para

alimentar las diversas técnicas de ML y poder realizar predicciones, brindar
información de utilidad, personalizar productos y servicios, procesar datos com-
plejos y poder determinar patrones y tendencias. Los resultados obtenidos, pue-
den servir para tomar decisiones en las empresas, mejorar productos e incluso
para realizar investigaciones.
Los datos que estas técnicas arrojan, pueden ser utilizados de diversas ma-
neras y en distintos campos de la industria. McKinsey & Company, es un asesor
de compañías, enfocada en la administración estratégica. Esta empresa realizó
un estudio en el cual miden el potencial del ML en distintos sectores de la indus-
tria. La investigación tiene como objetivo motivar a las empresas a adentrarse
en este tipo de métodos para el manejo de sus empresas. La información obte-
nida es bastante interesante, a continuación, se muestran algunos de los datos
que obtuvieron. [3]
Para la realización de la investigación, identificaron distintos casos de uso,

en los que se puede aplicar ML. Luego, mediante una encuesta a expertos de
10
la misma empresa, clasificaron el potencial del ML en los distintos casos de uso
para cada sector de la industria. Finalmente midieron la cantidad de informa-
ción y algoritmos que se pueden utilizar actualmente en cada uno de los casos
de uso. A continuación, se muestran los resultados obtenidos por la empresa.
Figura 3: Impacto potencial
11
Figura 4: Información utilizable
De la información anterior, se puede observar que los problemas del tipo

“optimización estratégica” son los que tienen un mayor impacto potencial en
los distintos sectores. Sin embargo, este tipo de problema no tiene un índice
muy alto en la información disponible para resolver estos problemas. A pesar
de esto, el uso del ML en las empresas no deja de ser una propuesta interesante.
De manera que, esta investigación consolidó ambos resultados por cada sector,
mostrando casos de uso en los que se puede aplicar ML. A continuación, se
muestra una tabla con un ejemplo de cada sector.
12
Tipo de Información
Sector Casos de uso Impacto
Problema disponible
Identificar caminos
Procesar
y obstáculos en
Automotriz datos no 1.5 2.0
tiempo real para
estructurados
autos autónomos
Predecir fallas y
recomendar
Mantenimiento
Manufactura mantenimiento 1.3 1.0
predictivo
preventivo en líneas
de producción
Personalizar la
oferta de productos Personalización
Finanzas 1.2 1.7
con base en datos radical
multimodales
Personalizar
técnicas de
Personalización
Agricultura mejoramiento a 1.1 1.3
radical
parcelas
específicas
Predecir fallas y
recomendar
mantenimiento Mantenimiento
Energía 1.6 0.7
preventivo para predictivo
explotación y
perforación
Diagnosticar
enfermedades con
Análisis
Salud escaneos, biopsias, 1.4 0.3
predictivo
audio y otro tipo de
datos
Optimizar los
Optimización
estudios clínicos
de
Farmacéutico incluyendo la 1.3 0
precios y
selección de
productos
pacientes
Personalizar
publicidad y
Medios de Personalización
recomendaciones 1.9 1.3
comunicación radical
con base en datos
multimodales
Predecir el tiempo
Telecomu- de vida y el riesgo Análisis
1.3 1.3
nicaciones de cancelación de predictivo
los clientes
Optimizar precios y Optimización
horarios con base de
Logística 1.7 1.3
en la demanda en precios y
tiempo real productos
13
En la tabla se puede observar un caso de uso, en el que es posible la aplicación
del ML, por cada sector. Sin embargo, estos no son los únicos, cada sector cuenta
con más casos de usos. De manera que podemos observar que el ML tiene un
gran potencial de aplicación dentro de la industria.
Con estos datos, podemos ver el potencial que el ML representa para las em-
presas. Incluso, en la actualidad muchas empresas ya se encuentran utilizando
estas técnicas.
Un ejemplo de ello es Intel, esta empresa utiliza el ML para resolver pro-

blemas que se presentan. Un caso fue cuando de los foros más grandes de Intel
era invadido por hasta 10 mil publicaciones basura por día; la empresa deci-
dió utilizar el aprendizaje automático para resolver este problema. Mediante
un algoritmo de reconocimiento de patrones lograron disminuir la cantidad de
correo basura que recibían. El servicio de filtrado de correo basura bloqueaba
automáticamente los mensajes no deseados y el análisis de texto le permitía
detectar contenido objetable en 75 idiomas, además, un motor de reputación
monitoreaba los perfiles de usuario para discernir si es probable que una fuente
dada esté enviando mensajes basura. [4]
Otra empresa utilizando ML es McDonald’s, quien compró Dynamic Yield,

una empresa que utiliza el ML para la toma de decisiones. Su objetivo es uti-
lizar el ML, en combinación con la IA, para personalizar sus menús McAuto
o McDrive. Utilizando diversos factores como la hora del día, clima, eventos
locales, comida ya seleccionada; se actualizará el menú para ofrecer combos y
comida que podría agradar al usuario y de esta manera brindar un servicio más
personalizado y atractivo para los clientes. [5]
Facebook, también utiliza ML con el objetivo de ayudar a sus usuarios a

descubrir nuevo contenido que sea de su agrado y conectarlos con historias y
personas que más les importan. Sus algoritmos están enfocados en ordenar pu-
blicaciones, anuncios y búsquedas dependiendo de las características del usuario.
[6]
Google, otro gigante de la tecnología, también reconoce la importancia del

ML. Algunos de sus productos que utilizan ML son el buscador de Google, el
cual filtra la información más atractiva para los usuarios; Google Translator,
el cual identifica textos a partir de imágenes y los traduce; reconocimiento de
voz en diversas aplicaciones de Google; Google Assistant, el cual también hace
uso del reconocimiento de voz; en los videos recomendados de YouTube; Google
Lens, la cual utiliza algoritmos de reconocimientos de imágenes; entre muchas
otras aplicaciones de Google. La empresa también ofrece su sistema Google
Cloud Platform, la cual cuenta con diversas herramientas para el desarrollo de
sistemas utilizando ML, IA y Big Data. [7]
Además de estas empresas, muchas otras utilizan ML para mejorar sus ser-
vicios. Algunos ejemplos dentro de nuestro país son los siguientes. BBVA Ban-
comer es el primer banco en utilizar técnicas de ML e IA a través de WhatsApp
en México. A través del uso de datos y de ML, crearon un Asistente Personal
capaz de procesar texto y voz para ayudar a sus clientes con sus necesidades
financieras. El asistente cuenta con medidas de seguridad, de manera que no so-
14
licita información confidencial como NIP, CCV, entre otra información delicada.
El asistente ayuda en la búsqueda de cajeros automáticos y sucursales, además
brinda información sobre el tipo de cuentas y tarjetas de crédito que maneja el
banco. Gracias a la implementación de IA, el asistente aprende las diferentes
interacciones con los clientes e identifica sus necesidades, lo cual permitirá al
proyecto ir evolucionando y aumentando sus capacidades. [8]
Otra compañía utilizando asistentes similares, también conocidos como chat-

bots, es Aeroméxico. Su chatbot Yalo, permite consultar información sobre los
viajes, precios e incluso la posibilidad de check-in desde el celular utilizando
WhatsApp. [9]
SkyAlert es una aplicación orientada a prevenir a sus usuarios de riesgos na-

turales. Su objetivo es minimizar impacto ocasionado por terremotos, alertando
a las personas, para que puedan tomar las medidas necesarias; esto mediante
alertas anticipadas con información de la intensidad del sismo y las áreas afec-
tadas. La aplicación utiliza Azure Machine Learning, que es una herramienta
para la implementación del ML en proyectos, basada en Windows. [10]
El Hospital Ángeles, utiliza la supercomputadora Watson de IBM, que, me-

diante IA y algoritmos de ML, extrae de más de 300 revistas médicas, de más
de 200 libros de texto y de casi 15 millones de páginas de texto, información
novedosa para que los oncólogos analicen los tipos de tratamientos existentes, y
les de opciones sobre si usar medicamentos o quimioterapia. [11]
Estos son solo algunos ejemplos de cómo las empresas utilizan ML para la
mejora de sus productos y servicios. Sin embargo, aún tiene un gran potencial
de crecimiento.
“Estados Unidos es el país que mayores avances tiene en Machine Learning

y se estima que sólo está trabajando el 25 % de lo que puede desarrollar. Hoy en
día solamente 1,500 compañías están haciendo algo con Inteligencia Artificial,
lo que significa que menos del 1 % de las compañías medianas y grandes están
adoptando esta tecnología disruptiva.” [12]
Aunque México no está cerca de ser uno de los líderes en ML e IA, el avan-
ce de estas ciencias representa una gran oportunidad para desarrolladores de
software, quienes son reconocidos a nivel mundial por sus capacidades. Además,
México cuenta con muy pocos científicos de datos, por lo que esta rama es una
gran oportunidad para los jóvenes estudiantes. Con todo lo anterior es fácil com-
prender la importancia del ML. Esta ciencia, permite a las máquinas “actuar
de manera inteligente”, brindándoles la capacidad de aprender y de generar in-
formación útil. Además, el ML deriva de la IA, la cual está considerada como
la segunda tecnología más disruptiva, solo después del Internet de las Cosas. [13]
Además, el ML ofrece una posibilidad que ningún otro software puede. Un

software convencional, no puede ser modificado una vez que el problema ha sido
compilado, lo cual lo limita en ciertos aspectos. Esto debido a que las situaciones
para las que fue diseñado originalmente el software se van modificando con el
tiempo, mientras que el software es incapaz de adaptarse a estos cambios. Es en
15
este aspecto en el que el ML brinda una opción muy interesante, ya que brinda
de adaptabilidad al software, permitiéndole aprender y adaptarse a las nuevas
situaciones que se le presentan.
Finalmente “los principales beneficios de Machine Learning es que potencia

un producto o servicio, así como la operación de una empresa; lo que se traduce
en mayores ingresos y menores costos, razones por las que hemos visto como se
ha extendido su uso en aplicaciones que abarcan desde servicios al consumidor
hasta herramientas sofisticadas.” [12]
7. El Machine Learning en México

A pesar de que el aprendizaje máquina es una de las herramientas más ver-
sátiles para la simulación y manejo de datos, además de brindar grandes avances
y minimizar los errores humanos al momento de interpretar datos, en México
aún nos encontramos lejos de ser una potencia tecnológica. Según el rector de
la UNAM (Universidad Nacional Autónoma de México, Enrique Graue Wie-
chers, el estado mexicano sólo destina 0,5 % del PIB de la nación para ciencia,
tecnología e innovación (CTI), mientras que para las naciones integrantes de la
OCDE (Organización para la Cooperación y el Desarrollo Económicos) destinan
en promedio 2,34 %, lo cual nos habla de que tan atrasados nos encontramos en
este ámbito. [? ]
Actualmente las únicas instituciones que imparten carreras relacionadas con el
aprendizaje máquina son:
ITAM (Instituto Tecnológico Autónomo de México) en cuyas instalaciones
ofrecen la Maestría en Ciencia de Datos. Uno de los principales lńeas de
aplicación de esta maestría es el aprendizaje máquina mediante el cual se
busca elaborar modelos matemáticos capaces de predecir valores en casos
desconocidos, a partir de una muestra de entrenamiento. [? ]
UNAM, en donde se puede estudiar la Maestría en Inteligencia Artificial,
que cuenta con asignaturas optaivas tales como Aprendizaje Automati-
zado, Computación Evolutiva, Sistemas Basados en el Conocimiento y
Administración del Conocimiento, Sistemas Expertos. [? ]
CIC - IPN (Centro de Investigación en Computación - Instituto Politéc-
nico Nacional) en cuyas instalaciones se ofrece la carrera de Maestría en
Ciencias en Ingeniería de Cómputo,
Por otro lado, en la iniciativa privada se cuenta con diversos proyectos y herra-
mientas que hacen uso de este paradigma de resolución de problemas que son
una muestra de qué tanto puede ayudar a las personas el aprendizaje máquina.
A continuación se presentan algunas de estos proyectos y herramientas.
7.1. Centro de Tecnología Cognitiva Hospitales Angeles

(CTC HA)
Actulmente resulta imposible para un médico leer, evaluar y analizar toda
la información existente sobre oncología. Es por esta razón que el CTC HA en
conjunto con el sistema de IBM Watson for Oncology ayudan a los médicos
16
mexicanos a realizar diagnósticos de pacientes que padecen cáncer. Watson for
Oncology es una tecnología cognitiva que procesa información de manera simi-
lar a un ser humano, cuando se le hace una pregunta se basa en generación
y evaluación de hipótesis para analizar rápitamente la información, y con el
uso repetido, Watson se vuelve cada vez más listo, con la retroalimentación de
aquellos que lo usan y aprendiendo de los diagnósticos exitosos y los que falla-
ron. Esta tecnología es un claro ejemplo del aprendizaje máquina y sus grandes
virtudes para la predicción y el procesamiento de datos, ya que busca de entre
un gran acervo de información dentro del cual se pueden encorntrar reportes de
prácticas, artículos de journals, libros, etc., y con base en estos datos, muestra
dónde puede encontrarse información para un diagnóstico o un tratamiento que
Watson genera. [? ]
7.2. Asistente virtual BBVA

BBVA Bancomer es el primer banco en México que implementa un asistente
virtual por WhatsApp con IA. Este asistente es capaz de procesar texto y audio
gracias a estar integrado a WhatsApp por lo que los usuarios de esta herramien-
ta pueden usar cualquiera de estos dos medios para poder comunicarse con el
asistente. A través del aprendizaje máquina el asistente virtual puede procesar
y utilizar la información y convertirla en interacciones precisas sobre las necesi-
dades financieras que los clientes tengan, ésto ayuda a que el asistente entienda
y aprenda los requerimientos y consultas de los clientes lo cual permite que las
capacidades del asistente se amplien con el paso del tiempo. [? ]
17

Monografia Machine Learning

Cargado por

Información del documentohacer clic para expandir la información del documento

Copyright:

Formatos disponibles

Monografia Machine Learning

Cargado por

Información del documento

Descripción original:

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Monografia Machine Learning

Cargado por

Copyright:

Formatos disponibles

1.

También se tocan los tipos de algoritmos de Machine Learning y se dan

La inteligencia artificial refiere a todo sistema o maquinas que puedan "pen-

3.2. Big Data

Garnet, una de las consultoras más grandes sobre Tecnologías de la Infor-

A diferencia del ML la Minería de Datos no se encarga de hacer predicciones

Un ejemplo de la aplicación de la Minería de Datos es el siguiente: Suponga

La Estadística, el Big Data, la Minería de Datos y el Machine Learning todas

Los algoritmos de Machine Learning y la Minería de Datos están basados

4. Algoritmos de Machine Learning

4.1. Aprendizaje supervisado

Por ejemplo puede haber millones de imágenes de animales y que incluyan

Los algoritmos de aprendizaje supervisado se dividen a su vez en dos tipos:

Sistemas de Clasificación de Aprendizaje de Máquina: Sistemas en los cua-

El aprendizaje supervisado es el más utilizado debido a que su complejidad

4.2. Aprendizaje no supervisado

Una de las principales aplicaciones del aprendizaje no supervisado es el de

El aprendizaje no supervisado divide en segmentos los datos con característi-

Entre sus principales aplicaciones es el filtrar los correos "spam", donde se

4.3. Aprendizaje reforzado

El proceso para producir algoritmos de aprendizaje reforzado o también

Una de las aplicaciones más conocidas es en la robótica, suponga que ha

Otra de las aplicaciones más conocidas es en los automóviles autónomos. A

5.1. K - Vecinos más cercanos

donde ar es el valor del r-ésimo atributo de alguno de los vectores xq , xj . [?

donde δ(Vi , f (xn )) = 1, si y sólo si Vi = f (xn ), es decir, que el vector xn

5.2. Máquina de soporte vectorial

Figura 1: Gráfica de 2 clases de objetos distintos

Figura 2: Gráfica de 2 clases de objetos distintos

5.3. Clasificador Bayesiano Simple

donde P̂ (Vk |xj )) es un estimado de la probabilidad de que el objeto Xj per-

6. Machine Learning y sus aplicaciones

Estos datos, son utilizados por diferentes empresas y organizaciones, para

Para la realización de la investigación, identificaron distintos casos de uso,

Figura 3: Impacto potencial

De la información anterior, se puede observar que los problemas del tipo

Un ejemplo de ello es Intel, esta empresa utiliza el ML para resolver pro-

Otra empresa utilizando ML es McDonald’s, quien compró Dynamic Yield,

Facebook, también utiliza ML con el objetivo de ayudar a sus usuarios a

Google, otro gigante de la tecnología, también reconoce la importancia del

Otra compañía utilizando asistentes similares, también conocidos como chat-

SkyAlert es una aplicación orientada a prevenir a sus usuarios de riesgos na-

El Hospital Ángeles, utiliza la supercomputadora Watson de IBM, que, me-

“Estados Unidos es el país que mayores avances tiene en Machine Learning

Además, el ML ofrece una posibilidad que ningún otro software puede. Un

Finalmente “los principales beneficios de Machine Learning es que potencia

7. El Machine Learning en México

7.1. Centro de Tecnología Cognitiva Hospitales Angeles

7.2. Asistente virtual BBVA

También podría gustarte