Trabajo de Grado
Trabajo de Grado
Trabajo de Grado
Tutores
Sandra Belalcazar Rey, MD
Shirley Rosenstiehl, MD
Investigador principal: Sandra Belalcazar Rey, MD. Oscar Julian Perdomo, PhD.
Investigadores asociados: Vanessa Carpio Rosso Delgado, Hernán Andrés Ríos , Shirley
Rosenstiehl Colon
Resultados:
El algoritmo de aprendizaje no supervisado evaluó 689 fotos a color de polo posterior,
clasificadas como con nervio óptico sano (sin daño) y con daño leve, moderado y severo.
Posteriormente un clasificador K-means, agrupó las características extraídas en los cuatro
grupos mencionados y se obtuvo un coeficiente kappa de Cohen de 0.037. Cuando se
clasificaron las imágenes en dos grupos, sanos y con daño, se evidenció un estadístico kappa
para la clasificación dicotómica de 0.03.
Conclusión:
El Algoritmo de aprendizaje no supervisado usado para la clasificación de daño del nervio
óptico en fotos a color de polo posterior, mostró una mala concordancia con la realizada por
el especialista en glaucoma según el sistema de clasificación de Armaly.
Palabras claves:
Algoritmo de aprendizaje no supervisado, fotos a color de polo posterior, daño del nervio
optico.
Abstract
Results: The Unsupervised Learning Algorithm evaluated 689 color optic disc images
classified as: healthy (no damage), mild, moderate and severe damage. A k-means classifier
clustered the extracted features in four groups and obtained a Cohen's kappa coefficient of
0.037 While classifying the images in two groups: Healthy and with damage, we found a
Cohen's kappa coefficient of 0.03.
Conclusion: The Unsupervised Learning Algorithm for the classification of optic disc
damage on color fundus photos showed a bad concordance with the one done by the
glaucoma specialist, using Armaly`s cup/disc ratio classification.
Key Word: Unsupervised Learning Algorithm, color fundus photos, optic disc damage.
1. Introducción
1.2. Justificación
2. Marco Teórico
El glaucoma es una neuropatía óptica degenerativa crónica que afecta específicamente a las
células ganglionares y sus axones, dando lugar a un adelgazamiento progresivo de la capa de
fibras nerviosas, lo cual se acompaña de un adelgazamiento del anillo neuroretiniano y un
aumento difuso o focal de la excavación, desplazamiento y variación del calibre de los vasos
retinianos, hemorragias del nervio óptico, defectos de la capa de fibras nerviosas y atrofia
peripapilar (22).
Esta patología es la causa principal de ceguera irreversible a nivel global. En el año 2010 se
estimó que 60.5 millones de personas fueron diagnosticadas con glaucoma, en el 2013 el
numero total de personas con este diagnóstico fué de 64.3 millones y para el año 2020 se
estimó que habría un incremento del 18.3% a 76 millones y del 74% a 111.8 millones de
personas en el 2040 (13).
Según una revisión realizada por Flaxman y colaboradores en la cual se analizaron 288
estudios con sujetos de 98 países, se observó que 216.6 millones de personas presentaron
discapacidad visual moderada a severa en el 2015, siendo el glaucoma responsable de 4
millones de casos en promedio Así mismo se estimó que para el año 2020, 237 millones de
personas presentarían una discapacidad visual moderada a severa y que casi el 2% se debería
al glaucoma; finalmente se calcuó que 38.5 millones de individuos quedarían ciegos y que
3.2 millones de ellos lo serían debido al glaucoma (16).
En un estudio realizado por Quigley y colaboradores se hizo una evaluación histológica del
número de fibras nerviosas en 5 discos ópticos de sujetos sanos y 3 discos ópticos de sujetos
con glaucoma, lo cuales tenían un campo visual normal; obteniendo como resultado un
número promedio de 964 mil axones en los discos ópticos sanos en comparación con 744 mil
axones presentes en los discos ópticos con daño glaucomatoso (29), evidenciando que hasta
un 33% de las fibras nerviosas se pueden perder a pesar de tener un buen campo visual.
Por otro lado el uso de la tomografía de coherencia óptica es de alto costo y se ha reportado
que presenta un sensibilidad y especificidad diagnóstica similar a las fotos a color de polo
posterior (30).
Una evaluación cuidadosa del nervio óptico usualmente puede identificar el daño
glaucomatoso temprano antes de que se produzca una alteración funcional. La apariencia del
nervio óptico se puede usar como un monitor sensible de daño, particularmente en los
estadíos tempranos de la enfermedad (19). Las fotos del nervio óptico han probado ser
herramientas muy útiles para su documentación permitiendo una evaluación mas minuciosa
y su comparación con otras fotografías pueden ayudar a determinar la progresión del daño
glaucomatoso (21)
Se han realizado algunos estudios para determinar la exactitud, sensibilidad y especificidad
en la identificación del daño glaucomatoso en fotos a color de polo posterior. La Agencia
para la Investigación de la Asistencia y Calidad Médica evaluó múltiples técnicas de tamizaje
incluyendo fotos a color de nervio óptico y encontró una sensibilidad del 65 al 77% y una
especificidad del 59 al 98% en la identificación de glaucoma (31). Por otro lado, el Ensayo
Europeo para la Evaluación del Disco Óptico encontró una exactitud del 80% en la
identificación de discos ópticos sanos y con glaucoma (30).
Por lo anterior, la evaluación del nervio óptico para identificar su daño y extensión es de gran
importancia.
Desde 1960, la clasificación cuantitativa más comúnmente usada para determinar el daño del
nervio óptico ha sido la proporción excavacion/area de disco de Armaly. En ella se describe
el diámetro de la copa como un porcentaje del diámetro total del disco. Por tanto esta
proporción, especialmente la vertical, representa una medida significativa en la
cuantificación de la neuropatía óptica glaucomatosa (3) y es precisamente esta técnica de
medición la utilizada en nuestro trabajo.
3. Pregunta de investigación
4. Objetivos
5.2. Población
5.5. Variables
Tabla 1. Definición de variables
DEFINICIÓN
VARIABLE TIPO DE VARIABLE ESCALA
OPERATIVA
Presencia de daño
del nervio óptico Proporción
Cualitativa nominal 0: Sin daño
detectado por un excavación/disco
dicotómica 1: Daño
especialista en aumentada
glaucoma
Presencia de daño
del nervio óptico
Proporción
detectado por un Cualitativa nominal 0: Sin daño
excavación/disco
algoritmo de dicotómica 1: Daño
aumentada
aprendizaje no
supervisado
0. Sin daño
Clasificación de
1: Daño leve
daño del nervio Resultado de la
2: Daño
óptico por un prueba realizada por Ordinal
moderado
especialista en el especialista
3: Daño
glaucoma
severo
Clasificación de 0. Sin daño
daño del nervio 1: Daño leve
Resultado de la
óptico por 2: Daño
prueba realizada por Ordinal
algoritmo de moderado
el especialista
aprendizaje no 3: Daño
supervisado severo
La evaluación de la base de datos por parte del sistema de aprendizaje no supervisado fue
llevado a cabo por una sola persona, con el fín de evitar su manipulación y variabilidad en el
procesamiento de la información.
Los datos obtenidos por los investigadores, tomados de las fotos a color de polo posterior, se
registraron en una base de datos electrónica en Excel que incluía las variables de nervio
óptico sin daño y con daño leve, moderado y severo.
La recolección de datos estuvo a cargo del especialista en glaucoma. Se verificó que todas
las imágenes cumplieran con los criterios de inclusión.
6. Aspectos éticos
El estudio se realizó dentro de los principios éticos para las investigaciones médicas en seres
humanos según la Declaración de Helsinki - 59ª Asamblea General, Seúl, Corea, Octubre
2008 (39)
Se tuvo en cuenta las regulaciones locales del Ministerio de Salud de Colombia Resolución
8430 de 1993 en lo concerniente al Capítulo I “De los aspectos éticos de la investigación en
seres humanos” (40)
La presente investigación es clasificada dentro de la categoría Investigación sin riesgo: Son
estudios que emplean técnicas y métodos de investigación documental retrospectivos y
aquellos en los que no se realiza ninguna intervención o modificación intencionada de las
variables biológicas, fisiológicas, sicológicas o sociales de los individuos que participan en
el estudio, entre los que se consideran: revisión de historias clínicas, entrevistas, cuestionarios
y otros en los que no se le identifique ni se traten aspectos sensitivos de su conducta.
Se limitará el acceso de los instrumentos de investigación únicamente a los investigadores
según Artículo 8 de la Resolución 008430 de 1993 del Ministerio de Salud.
Será responsabilidad de los investigadores el guardar con absoluta reserva la información
contenida en las historias clínicas y a cumplir con la normatividad vigente en cuanto al
manejo de la misma reglamentados en los siguientes: Ley 100 de 1993, Ley 23 de 1981,
Decreto 3380 de 1981, Resolución 008430 de 1993 y Decreto 1995 de 1999.
Todos los integrantes del grupo de investigación estarán prestos a dar información sobre el
estudio a entes organizados, aprobados e interesados en conocerlo siempre y cuando sean de
índole académica y científica, preservando la exactitud de los resultados y haciendo
referencia a datos globales y no a pacientes o instituciones en particular.
Se mantendrá absoluta confidencialidad y se preservará el buen nombre institucional
profesional.
El estudio se realizará con un manejo estadístico imparcial y responsable.
No existe ningún conflicto de interés por parte de los autores del estudio que deba declararse.
7.1. Cronograma
ETAPAS Y
ACTIVIDADES
1 2 3 4 5 6 7 8 9 10 11 12
Preparación y
aprobación del X
proyecto
Sometimiento y
X
aprobación CEI
Análisis de la base de
X
datos
Análisis de resultados X
Informe de resultados
y entrega final de X
investigación
7.2. Presupuesto
Publicación $1.500.000
TOTAL $8.300.000
8. Resultados
El algoritmo de aprendizaje no supervisado evaluó 612 fotos a color de polo posterior de las
bases de datos públicas Drishti – GS y RIM – ONE y 77 fotos a color de polo posterior de la
base de datos de la Fundación Oftalmológica Nacional, las cuales fueron clasificadas como
con nervio óptico sin daño (sano) y con daño leve, moderado y severo según el especialista
en glaucoma.
Posteriormente un clasificador K – means agrupó las características extraídas de los cuatro
grupos mencionados y al comparar la interpretación realizada por el especialista y la
propuesta por el modelo, se observó una concordancia en la identificación de 212 nervios
ópticos sin daño, 10 nervios ópticos con daño leve, 21 nervios ópticos con daño moderado y
17 nervios ópticos con daño severo.
Los resultados se describen en la Tabla 1.
TABLA 1. Matrix de Confusión de cuatro clases
Observación del Especialista
Observación Sin daño Daño Moderado Severo Total
del Modelo leve
Sin daño 212 53 127 104 496
Daño leve 24 10 12 20 66
Moderado 25 9 21 15 70
Severo 25 4 11 17 57
Total 286 76 171 156 689
Por otro lado al analizar la concordancia para dos clases: nervios ópticos sin daño (sanos) y
nervios ópticos con daño (leve, moderado y severo), se observó que el algoritmo fué capaz
de identificar 212 nervios ópticos sin daño y 119 nervios ópticos con daño. Obteniendo una
exactitud de 48.04% y un estadístico kappa para la clasificación dicotómica de 0.03.
En el presente estudio se desarrolló una arquitectura que combinó internamente dos modelos,
un primer modelo de red neuronal convolucional llamado VGG, entrenado con un conjunto
de imágenes de dominio natural con el fín de extraer las características del nervio óptico y
un segundo modelo compuesto por un algoritmo de agrupamiento llamado K-means, que
agrupó estos caracteres según su mayor similitud para clasificar el nervio óptico como sano,
con daño leve, moderado o severo.
Estudios previos ya han descrito el uso de la inteligencia artificial en la valoración de fotos a
color de polo posterior para determinar el daño del nervio óptico (43). Ting y col. propusieron
un algoritmo de aprendizaje profundo para realizar el tamizaje de glaucoma en 125,189 fotos
a color de polo posterior de pacientes diabéticos, las cuales fueron clasificadas
subjetivamente por los oftalmologos como “referibles” durante la fase de entrenamiento,
obteniendo en la fase de prueba un área bajo la curva (AUC) de 0.942 con una sensibilidad
del 96.4% y especificidad del 87.2% (41). En otro estudio Li y col. clasificaron también de
manera subjetiva 48,116 fotos a color de polo posterior como “referibles o no” para
glaucoma, obteniendo un área bajo la curva, sensibilidad y especificidad de 0.986, 95.6% y
92% respectivamente (42). Medeiros y col. desarrollaron un sistema más complejo de
identificación de daño del nervio óptico, en el que un algoritmo de aprendizaje profundo fue
entrenado con fotos a color de polo posterior que fueron clasificadas de acuerdo al grosor de
la capa de fibras nerviosas medida por un tomógrafo de coherencia óptica Spectral Domain
(SD-OCT) obteniendo una buena área bajo la curva para discriminar nervios ópticos sanos
de los glaucomatosos (35). En estos trabajos se puede usar el aprendizaje profundo
supervisado como herramienta para la clasificación de daño de esta estructura o algoritmos
de aprendizaje no supervisado como el presente estudio. Al realizar una busqueda sistemática
de estos trabajos se encontró que su uso es menos frecuente que el aprendizaje profundo
supervisado en el que se desarrolla una etapa de entrenamiento y otra de prueba y que sobre
todo estos intentan identificar patrones de daño en el campo visual o en la tomografia de
coherencia óptica de nervio óptico (44,45). En este estudio se realizó una clasificación
subjetiva del daño del nervio óptico por parte de un especialista en glaucoma y
posteriormente se analizó la concordancia con un algoritmo de aprendizaje no supervisado,
obteniendo un coeficiente de Kappa de Cohen de 0.037 al clasificar los nervios ópticos como
sin daño, con daño leve, moderado y severo. Así mismo, se obtuvo un estadístico Kappa para
la clasificación dicotómica de nervios ópticos con y sin daño de 0.03, mostrando una mala
concordancia en ambos casos. También se analizó el rendimiento del algoritmo en la
clasificación de las 4 clases (nervio óptico sin daño, con daño leve, moderado y severo) y la
dicotómica (nervio óptico sin y con daño) obteniendo una exactitud de 37.73 % y 48.04%
respectivamente, con lo cual se evidenció un bajo rendimiento del algoritmo. Esto podría
explicarse por la limitada longitud de valores (4096) correspondientes a la capa 15 de la red
convolucional VGG, la cual permite el agrupamiento de las características con mayor
similitud y la exclusión de las que presentan mayores diferencias y con la que finalmente se
identifican los nervios ópticos sin daño y con daño leve, moderado y severo. Por otra parte
también se ha descrito que los algoritmos de aprendizaje no supervisado requieren de grandes
bases de datos para poder identificar patrones de daño subyacentes y que la información
suministrada debe ser variada en sus clases (10); en este trabajo se usaron 689 fotos a color
de polo posterior y el número de fotos correspondiente a cada clase no fué uniforme,
presentando la mayoría de los nervios ópticos un daño moderado, con lo cual podría
explicarse también la inadecuada concordancia entre el especialista en glaucoma y el
algoritmo.
Dentro de las limitaciones en este estudio se puede citar el limitado número de fotos a color
de polo posterior que fueron analizadas y que de acuerdo a lo anteriormente descrito podría
haber dificultado la identificacion de cada clase (nervio óptico sin daño, con daño leve,
moderado y severo) por parte del algoritmo de aprendizaje no supervisado.
Se recomienda ampliar el número de la muestra de fotos a color de polo posterior con el fín
de identificar todos los patrones de daño y obtener clases más uniformes.
En conclusión, el algoritmo de aprendizaje no supervisado no presentó una adecuada
concordancia en la clasificación del daño del nervio óptico en las fotos a color de polo
posterior. Es posible que se requiera una mejor selección de las variables de entrenamiento
para lograr el desarrollo de un algoritmo más eficiente. Actualmente los sistemas de
inteligencia artificial están dando buenos resultados con respecto a clasificación,
segmentación y detección objetiva de las imágenes oftalmológicas, proyectandose como una
herramienta muy útil en el tamizaje de patologías como el glaucoma.
10. Referencias