Secuenciacion Masiva Paralela (NGS)

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 18

Secuenciación masiva paralela (NGS):

conceptos básicos y aplicaciones

Next-Generation Sequencing (NGS):


basic concepts and applications
ROL DE NGS EN
Jauk F. PATOLOGÍA
Laboratorio de Secuenciación, Hospital Italiano de Buenos Aires MIELOIDE

[email protected]

HEMATOLOGÍA
Volumen 23 Numero Extraordinario
XXIV Congreso Argentino
de Hematología: 21-38
Octubre 2019

Palabras claves: NGS, Keywords: NGS,


secuenciación, sequencing,
ADN. DNA.

Resumen ceptos fundamentales de NGS, contemplando desde


El desarrollo que se ha producido en los últimos la historia que enmarca su nacimiento hasta la apli-
años en el campo de la genómica ha contribuido a cación en ámbitos clínicos y académicos.
comprender tanto enfermedades hereditarias como
neoplasias. Hoy en día, gracias al auge de la medici- Abstract
na de precisión, el diagnóstico, pronóstico y trata- The rise of genomics in recent years has contrib-
miento de gran parte de estas patologías está basado uted to understand not only hereditary diseases but
en la detección de alteraciones en el genoma. Las also neoplasms. Today, as precision medicine plays
técnicas de secuenciación masiva paralela del ADN, a major role, the diagnosis, prognosis and treatment
conocida también como secuenciación de segunda of most of these conditions is based on the detection
generación (next-generation sequencing o NGS), of genomic alterations. Massive parallel sequencing
han sido un pilar fundamental para este tipo de of DNA, also known as next-generation sequencing
avances. El perfeccionamiento de las tecnologías, or NGS, has been the cornerstone of these devel-
la estandarización de las técnicas y la reducción opments. Improvements in technology, standardiza-
progresiva de los costos han hecho que este tipo de tion of techniques and costs reduction allowed NGS
herramientas sean utilizadas cada vez con mayor to be used as a routine tool.
frecuencia. En esta revisión se abordarán los con- In this review, basic concepts about NGS will be

HEMATOLOGÍA • Volumen 23 Número Extraordinario XXIV Congreso Argentino de Hematología: 21-38, 2019 21
ROL DE NGS EN PATOLOGÍA MIELOIDE

approached: from the history of DNA sequencing tidos de una molécula de ADN con relativa senci-
to the application of massive parallel sequencing in llez. Sin embargo, esta técnica utilizaba químicos
both clinical and academic fields. tóxicos y grandes cantidades de ADN marcado con
fósforo radioactivo, por lo que finalmente ha que-
Introducción dado en desuso(10). El método publicado por Sanger
Desde el descubrimiento de la estructura del ADN en 1975, conocida como “secuenciación por termi-
hasta el día de hoy han ocurrido muchos cambios nadores” fue reemplazando a la de Maxam y Gil-
en lo que respecta al estudio y conocimiento de esta bert, y se popularizó rápidamente(10,11). Aún hoy se
molécula y de la genómica aplicada. En particular, utilizan los mismos fundamentos, aunque que con
la secuenciación, entendida como la determinación algunas modificaciones. La técnica fue evolucio-
del orden de nucleótidos de una cadena de ADN, nando paulatinamente, y hacia fines de los años 80
ha sido fundamental en gran parte de este proceso. surgieron los primeros secuenciadores automatiza-
La secuenciación de segunda generación (conoci- dos utilizando electroforesis capilar que, a su vez,
da como next-generation sequencing o NGS por su fueron perfeccionados hasta llegar al día de hoy.
acrónimo en inglés), se trata de un tipo de secuen- La secuenciación capilar, la versión actual de la se-
ciación masiva paralela que ha surgido hace algo cuenciación por terminadores de Sanger, se sigue
más de una década y ha revolucionado este campo, utilizando como técnica de referencia para muchos
permitiendo obtener información genómica de cien- ensayos, ya que muestra una exactitud incluso supe-
tos de miles de moléculas de ADN en un solo en- rior a las nuevas tecnologías. Sin embargo, existen
sayo. La utilización de esta herramienta se encuen- limitaciones que en ciertos contextos la hacen poco
tra en constante expansión en ámbitos académicos costo-efectiva: sólo permite secuenciar una hebra
y asistenciales gracias al auge de la medicina de por reacción, con una longitud en general no mayor
precisión: un nuevo paradigma de atención médica a 1000-1200 pares de bases, con dificultades para
orientada a un rédito máximo en lo que respecta a detectar variantes en baja frecuencia y con un costo
diagnóstico y tratamiento para cada paciente. relativamente superior comparada con técnicas de
mayor rendimiento(12).
Doble hélice, secuenciación y genoma humano Un método también importante, aunque quizás me-
Técnicas de secuenciación nos difundido en nuestro medio, es la pirosecuen-
Desde la descripción de la estructura del ADN por ciación. Descripta en 1985 por Pål Nyrén, la técnica
James Watson, Francis Crick, Maurice Wilkins y consta de una serie de pasos enzimáticos y basa su
Rosalind Franklin en 1953, la ciencia ha entrado en detección en cuantificar la señal luminosa emitida
una carrera por el estudio de esta molécula, parti- tras la incorporación de un nucleótido a la cadena a
cularmente en el campo de la medicina, tratando de secuenciar y la consecuente liberación de pirofosfa-
encontrar mediante su estudio una respuesta al ori- to inorgánico. Esta técnica fue utilizada en los pri-
gen del ser humano y develar los misterios sobre las meros secuenciadores NGS(13,14).
dolencias que lo aquejan(1-4). Eventos posteriores, Si bien la secuenciación capilar o la pirosecuen-
como la aceptación entre la comunidad científica ciación parecen haber llegado al punto final de su
del llamado dogma central de la biología molecular, evolución, las tecnologías de NGS y TGS (third ge-
sentaron las bases del flujo de la información entre neration sequencing en inglés) continúan evolucio-
las macromoléculas ADN, ARN y proteínas(5). El nando y en los últimos años han acaparado gran par-
desarrollo de otras técnicas, como el ADN recom- te del mercado, tanto en ámbitos académicos como
binante (clonado molecular), el uso de enzimas de asistenciales(15).
restricción o la reacción en cadena de la polimerasa
(PCR por su acrónimo en inglés) han sido conse- El proyecto genoma humano (PGH)
cuencia del avance del estudio del ADN y han con- Oficialmente fundado en 1990 con el objetivo de
tribuido a potenciar el mismo(6-8,9). conocer la secuencia completa del ADN del ser hu-
El desarrollo de técnicas de “secuenciación quími- mano, este proyecto fue quizás uno de los puntos de
ca” por Maxam y Gilbert en 1973 hizo que por fin inflexión más grandes en el campo de la biología, y
se pudiera conocer la secuencia ordenada de nucleó- con un rol fundamental en el desarrollo de las cien-

22 HEMATOLOGÍA • Volumen 23 Número Extraordinario XXIV Congreso Argentino de Hematología: 21-38, 2019
SECUENCIACIÓN DE SEGUNDA GENERACIÓN (NGS): CONCEPTOS BÁSICOS Y APLICACIONES

cias de la salud humana. Fue dirigido inicialmente después de la descripción de la doble hélice como
por James Watson, quien fue reemplazado por Fran- estructura aceptada del ADN, se concluyó el Pro-
cis Collins luego de dos años. Se sostuvo princi- yecto Genoma Humano, cubriendo el 99% de las
palmente con fondos del Departamento de Energía 3.000 millones de bases del genoma haploide con
(DOE, por su acrónimo en inglés) y el Instituto Na- una precisión del 99,99%, haciéndose público el ac-
cional de la Salud (NIH, por su acrónimo en inglés) ceso al mismo(21). Fue notable el desarrollo de la tec-
de Estados Unidos. En el proyecto ha participado nología y los conocimientos adquiridos en ciencias
un consorcio de 20 laboratorios de 5 países, y la es- biológicas y médicas.
trategia elegida fue utilizar cromosomas bacterianos A partir del PGH se han realizado muchos otros pro-
artificiales (BACs por su acrónimo en inglés) con- yectos relacionados, cuyos objetivos van desde co-
teniendo insertos correspondientes a fragmentos del nocer la función de los genes, evaluar variabilidad
genoma, para secuenciar de un modo organizado y entre individuos, estudiar relaciones entre variantes
efectivo la totalidad del genoma humano. El costo de secuencia y enfermedades, etc., etc. Podríamos
total se estima en aproximadamente 3.000 millones citar algunos de ellos: Encode, HapMap, The Can-
de dólares de ese entonces (alrededor de 5.000 mi- cer Genome Atlas, 1000 Genomes Project, etc(22-25).
llones de dólares actuales ajustados por inflación) Sin dudas, este tipo de iniciativas internacionales a
(16)
. Algunas de las metas más importantes directa o gran escala fueron primordiales para el desarrollo,
indirectamente logradas por el PGH fueron: obtener perfeccionamiento y acceso de técnicas de secuen-
la secuencia de ADN completa del genoma humano, ciación masiva de alto rendimiento.
desarrollar la tecnología disponible para secuenciar
ADN y realizar ensayos de genómica funcional, Secuenciación de segunda generación
obtener información sobre polimorfismos obser- El conocimiento creciente del genoma humano, del
vados en la población, obtener secuencia de ADN funcionamiento de genes y de la asociación entre
completa de genomas de organismos utilizados en alelos patogénicos y diverso tipo de enfermedades
modelos de estudio de enfermedades (E. coli, S. ce- hizo que la tecnología disponible hasta el momento
revisiae, C. elegans, D. melanogaster, M. musculus, no pudiera suplir en tiempo y forma las necesida-
etc.), trabajar aspectos éticos y legales relacionados des académicas y asistenciales crecientes. El con-
a la secuenciación, desarrollo de la bioinformática texto que hemos revisado previamente llevó a los
y la biología computacional, formación de recursos principales actores de la industria biotecnológica a
humanos calificados (no sólo ligados a las ciencias desarrollar técnicas e instrumentos con los cuales se
biológicas o el campo de la medicina, si no también logre la secuenciación paralela de miles de millones
a otras disciplinas: ciencia de datos, ingeniería, ma- de moléculas de ADN, consumiendo menor canti-
temática, física, química y ciencias sociales)(17,18). dad de tiempo y dinero.
En 1998, paralelamente al consorcio del PGH, una La secuenciación denominada NGS, es considerada
asociación entre las empresas privadas Celera y la segunda generación en lo que respecta a la secuen-
Applied Biosystems decidió ir por el mismo objeti- ciación del ADN (la primera generación se refiere a
vo en un plazo de tan sólo 5 años, con la esperanza la secuenciación Sanger). Veremos que, en realidad,
de concluir el proyecto antes que el consorcio públi- se trata un conjunto de técnicas de alto rendimiento
co y patentar el genoma humano. Este grupo utilizó que comparten fundamentos básicos, en las cuales
una estrategia conocida como shotgun sequencing se obtienen grandes cantidades de información ge-
(en inglés), que consiste en la fragmentación al azar nómica para responder en última instancia a inte-
del ADN en hebras de tamaño corto, para luego ser rrogantes que se generan desde la investigación o el
secuenciados y ensamblados al final utilizando he- diagnóstico clínico.
rramientas bioinformáticas de punta para ese enton-
ces. Historia
En el año 2001, tanto el consorcio público como el El nacimiento y desarrollo de NGS se tradujo en un
equipo privado presentaron un borrador, mostrando cambio de paradigma en el ámbito de la secuencia-
una cobertura de aproximadamente un 90% del ge- ción: lo que al consorcio público del PGH le costó
noma humano(19,20). Y finalmente en 2003, 50 años 10 años y 5.000 millones de dólares, en algo más

HEMATOLOGÍA • Volumen 23 Número Extraordinario XXIV Congreso Argentino de Hematología: 21-38, 2019 23
ROL DE NGS EN PATOLOGÍA MIELOIDE

que una década se pudo lograr en un flujo de trabajo compañía fundada en Reino Unido en 1998(31). la
de tan sólo algunos días por algo menos de 1000 de misma consistía en la secuenciación por síntesis con
dólares(26). A continuación se mencionan las técnicas terminadores fluorescentes reversibles. Las biblio-
más relevantes vinculadas a la historia de la tecno- tecas eran amplificadas en una celda de flujo me-
logía de NGS. diante un proceso llamado PCR puente (bridge-PCR
El secuenciador GS20 de 454 Life Sciences, lanza- en inglés) formando grupos o clusters. Al momento
do al mercado en 2005, se podría considerar como el de secuenciar, dada la adición de nucleótidos ter-
primer secuenciador NGS con éxito comercial. Su minadores fluorescentes reversibles durante cada
flujo de trabajo se basaba en amplificación clonal flujo, se genera una señal al tiempo que la cadena
de la biblioteca basada en PCR en emulsión para se elonga (ver luego). En 2007, Illumina adquirió
generar el templado, y luego múltiples reacciones Solexa y, adoptando el mismo fundamento, desarro-
paralelas tipo pirosecuenciación. La emisión de luz lló secuenciadores de mayor escala, más veloces y
resultante era captada, procesada y convertida en in- capaces de leer fragmentos de mayor tamaño(13,27,32).
formación genómica. Con este instrumento se logró, Con el correr de los años, otras compañías desa-
por ejemplo, concluir la secuenciación del genoma rrollaron plataformas de secuenciación NGS con
de James Watson en 2007 y el Proyecto del Genoma fundamentos similares a algunas de las descriptas
del Neandertal en 2009. Esta compañía fue poste- previamente, aunque hoy en día el mercado está do-
riormente adquirida por Roche, y con el tiempo dejó minado por secuenciadores Illumina, seguidos por
de producir unidades(13,27,28). Ion Torrent. Las plataformas de NGS de otros fabri-
Utilizando un concepto similar, aunque reemplazan- cantes se encuentran menos representadas.
do la detección vinculada a emisión lumínica por Podemos ver, entonces, que dentro de lo que deno-
detección de cambio de pH en un semiconductor minamos NGS se encuentran diferentes tecnologías
(chip), se ideó la técnica extendida por Ion Torrent con un concepto similar. Los grandes avances en
desde 2010. Esta tecnología, desarrollada por el la bioinformática y en la capacidad de cálculo de
ex-fundador de 454 Life Sciences, utiliza también computadoras y servidores ha sido un respaldo muy
PCR en emulsión para amplificación clonal del tem- importante para el desarrollo de secuenciadores de
plado, pero basa su etapa de secuenciación en la mayor escala y más rápidos. Un dato muy interesan-
medición de la reducción de pH que se origina en te, de la mano de la mejora continua en el desarrollo
cada pocillo del chip semiconductor al adicionarse de NGS, indica que entre 2005 y 2010, el costo de
un nucleótido y liberarse un protón (ion hidrógeno, la secuenciación (costo por base) se ha ido reducien-
H+) (ver luego). Este tipo de equipos tienen la ca- do a la mitad cada 5 meses(26). Esta tendencia se ha
pacidad para secuenciar de un modo muy veloz y desacelerado en los últimos años, aunque continúa
eficaz aunque, al igual que las plataformas 454, pre- descendiendo (ver Figura 1). Esto favorecería el ac-
sentan dificultades para interpretar homopolímeros ceso a este tipo de tecnologías alrededor del mundo.
de cierta longitud(13,27,29).
La técnica desarrollada por Life Technologies desde Utilidad en la clínica e investigación
2006 fue denominada SOLiD (acrónimo de Sequen- La secuenciación NGS es por sí sola una herra-
cing by Oligonucleotide Ligation and Detection). mienta, y desde su nacimiento se ha empleado con
Como su nombre lo indica, se basaba en reacciones distintos objetivos. Existen diferentes abordajes uti-
de ligación y no en polimerización como los otros lizados comúnmente para el estudio de numerosas
métodos. El costo de esta tecnología era relativa- patologías, ya sea desde el punto de vista académico
mente bajo comparado con las otras disponibles a o asistencial.
la fecha. Sin embargo, las lecturas eran demasiado A nivel del ADN, se pueden estudiar el genoma
cortas, y el tiempo de secuenciación y procesamien- completo, exoma completo o paneles de genes. Se-
to de los datos muy extenso. Posteriormente la téc- gún el diseño del ensayo, existe la posibilidad de
nica quedó en desuso(13,27,30). obtener información sobre variantes de nucleótido
Por último, una técnica de secuenciación masiva único (sustituciones, single nucleotide variants o
muy importante y distinta a las citadas anteriormen- SNVs en inglés), inserciones o deleciones (también
te fue la utilizada y popularizada por Solexa, una llamadas indels), y grandes rearreglos (deleciones,

24 HEMATOLOGÍA • Volumen 23 Número Extraordinario XXIV Congreso Argentino de Hematología: 21-38, 2019
SECUENCIACIÓN DE SEGUNDA GENERACIÓN (NGS): CONCEPTOS BÁSICOS Y APLICACIONES

Figura 1. Costos de secuenciación cruda (por megabase). Con permiso de: Wetterstrand KA.
DNA Sequencing Costs: Data from the NHGRI Genome Sequencing Program (GSP).
Disponible en: www.genome.gov/sequencingcostsdata. Consultado 6 de julio de 2019.

duplicaciones o amplificaciones de grandes frag- ral, baja comparada con la secuenciación dirigida(35).
mentos de genes, copy number variation o CNV en Sin embargo, gracias a este tipo de ensayos durante
inglés). las etapas de iniciales del desarrollo de la tecnolo-
gía NGS, se han generado numerosas asociaciones
Secuenciación del genoma completo entre variantes de secuencia en genes y patologías,
El estudio de todas las regiones codificantes y no ya se trate de enfermedades de herencia mendeliana,
codificantes dentro del genoma se denomina se- mitocondriales, neoplasias, etc(34,35).
cuenciación del genoma completo (Whole genome
sequencing o WGS en inglés). Una de sus ventajas Secuenciación del exoma
es que la preparación de las bibliotecas es relativa- La secuenciación del exoma completo (whole exome
mente simple ya que no requiere pasos de enrique- sequencing o WES en inglés) es un tipo de secuen-
cimiento(33). ciación dirigida donde se enriquece aproximada-
Si bien intuitivamente la secuenciación del geno- mente 1 al 2% del genoma humano. Está orientado
ma completo parece ser la estrategia más completa, a obtener la información genómica de los exones
hoy por hoy es poco costo-efectiva, dado que por un (las regiones codificantes) de los casi 20.000 genes,
lado no brinda mucha más información clínicamen- cubriendo aproximadamente un 85% de las varian-
te relevante que la secuenciación del exoma (ver tes que causan enfermedades hereditarias, principal-
luego), se obtienen una inmensa cantidad de infor- mente monogénicas(34).
mación (dificultosa de analizar y almacenar), brinda El exoma clínico (clinical exome sequencing o CES
un sinnúmero de variantes de significado incierto, y en inglés) también es muy utilizado hoy en día. Se
el costo es más elevado que los abordajes dirigidos estudia la región codificante de alrededor de 5.000
debido a la cantidad de bases secuenciadas(34). A esto genes con relevancia clínica, aunque en ocasiones
se suma la dificultad en el mapeo en regiones del resulta insuficiente para algunos pacientes, debido a
genoma de referencia debido a la gran cantidad de la representación incompleta del exoma(36,37).
secuencias repetitivas que presenta el genoma hu- La secuenciación del exoma es de utilidad para la
mano. La profundidad de secuenciación es, en gene- detección de variantes conocidas en genes relacio-

HEMATOLOGÍA • Volumen 23 Número Extraordinario XXIV Congreso Argentino de Hematología: 21-38, 2019 25
ROL DE NGS EN PATOLOGÍA MIELOIDE

nados a enfermedades genéticas y también en el zados de un modo habitual, ya que cubren regiones
descubrimiento de nuevas variantes asociadas con en las que se pueden observar mutaciones recurren-
patologías(35). Tanto es así que, utilizando técnicas tes. Además, al ser acotados, permiten una profundi-
de WGS y WES, se ha aumentado la cantidad de ge- dad de secuenciación muy elevada con el objeto de
nes asociados a enfermedades en casi un 90% sólo reconocer variantes somáticas en baja frecuencia, a
desde 2007 a 2013 (ver Tabla 1)(38). Estas estrategias la vez que agilizan el procesamiento bioinformático
fueron también importantes en el descubrimiento de y la posterior interpretación de los resultados(35). El
mutaciones recurrentes en el estudio de neoplasias, objetivo de los paneles en oncología es brindar valor
tanto en tumores sólidos como hematológicos, y diagnóstico, pronóstico, predictivo, y de seguimien-
han contribuido significativamente en la detección to(40-42).
de mutaciones conductoras (driver mutations en in- Los paneles comerciales destinados al estudio de
glés) y en el desarrollo de terapias dirigidas, y pos- neoplasias pueden focalizarse en la secuenciación
teriormente en el diseño de paneles de genes según de ADN, ARN (ver luego) o una combinación de
patologías(34). ambos, y exhiben técnicas de enriquecimiento di-
versas.
Paneles de genes
Otro abordaje de secuenciación dirigida popular- Otras técnicas basadas en ADN
mente empleado es el estudio de paneles de genes. Algunos abordajes menos frecuentes, utilizados
En general se estudia un número acotados de genes fundamentalmente en investigación son los estudios
o regiones de genes importantes asociados a la pa- de metilación (dirigida vs. metiloma completo),
tología en cuestión. En el estudio de enfermedades estudio de unión proteína-ADN (ChIP-Seq), entre
hereditarias se utilizan cuando las patologías son re- otros(43-45).
lativamente frecuentes y cuyo fenotipo puede estar
explicado por variantes de secuencia en un número Secuenciación del ARN
limitado de regiones genómicas. Existen gran can- Existen también métodos de estudio del ARN por
tidad de paneles comerciales basados en distintas NGS. En estos casos, el ARN es convertido a ADN
estrategias de enriquecimiento, e incluso muchas copia (denominado cDNA en inglés) por medio de
compañías ofrecen opciones personalizables don- una retrotranscripción, antes de poder ser secuen-
de el usuario escoge las regiones de genes deseadas ciado. Los métodos de secuenciación del transcrip-
para su propósito(39). toma completo brindan información útil para obte-
El estudio de tumores en búsqueda de mutaciones ner un perfil de expresión de virtualmente todos los
somáticas suele ser algo más complejo que la pato- transcriptos de ARN (ARN mensajero), estudiar la
logía germinal, ya que en el tejido tumoral coexisten secuencia codificante (similar al exoma, pero res-
células tumorales con células normales. A su vez, tringido a genes expresados en ese tejido en particu-
las células tumorales pueden presentar trastornos de lar), o bien para evaluar empalmes alternativos en la
la ploidía, coexistencia de mutaciones conductoras muestra en cuestión(43).
o mutaciones pasajeras, subclones tumorales, etc. Otra opción es la secuenciación de ARN dirigida,
Para el estudio de neoplasias, los paneles son utili- donde se enriquece la muestra para representar los
Tabla 1. Fenotipos para los cuales existe una base molecular conocida (base de datos OMIM, 2007 y
2013). Adaptado de: Koboldt DC, Steinberg KM, Larson DE y cols. The next-generation sequencing
revolution and its impact on genomics. Cell. 2013;155:27-38.
Patrón de herencia Enero 2007 Julio 2013
Autosómica 1851 3525
Ligada al cromosoma X 169 277
Ligada al cromosoma Y 2 4
Mitocondrial 26 28
Total 2048 3834

26 HEMATOLOGÍA • Volumen 23 Número Extraordinario XXIV Congreso Argentino de Hematología: 21-38, 2019
SECUENCIACIÓN DE SEGUNDA GENERACIÓN (NGS): CONCEPTOS BÁSICOS Y APLICACIONES

transcriptos de interés y así evaluar su expresión en formalina e incluido en bloques de parafina cuan-
relativa. Los perfiles de expresión de ARN, pueden do se trata de tumores sólidos. En los últimos años
brindar información valiosa acerca de activación se ha experimentado un incremento del estudio de
de vías de señalización. Un tipo de estudio que ha lo que se denomina biopsia líquida, donde se puede
cobrado relevancia es el perfil de expresión de los obtener ADN tumoral a partir de cualquier fluido,
microARNs (llamado miRNoma), con especial foco siendo el estudio de ADN libre de células en plasma
en regulación de vías de señalización en el cáncer(43). el más frecuente, seguido por células tumorales cir-
Otra estrategia muy utilizada tomando como punto culantes y exosomas o pequeñas vesículas(39).
de partida el ARN es aquélla que se utiliza para de-
terminar presencia de fusiones génicas (transloca- Flujo de trabajo de NGS
ciones) en aquellos casos que la misma genera una Habiendo repasado los conceptos básicos de NGS,
proteína quimérica. Debido a que generalmente los se describirán las cuestiones operativas. De forma
puntos de ruptura y empalme entre genes fusiona- esquemática, se mencionan a continuación distintas
dos se encuentran en regiones intrónicas profundas formas de enriquecimiento del blanco de estudio, el
y son muy variables, se han desarrollado estrategias concepto general de preparación de bibliotecas, y
a partir de ARN para poder detectar uniones exón- por último la amplificación del templado y secuen-
exón entre dos genes (ej: BCR-ABL1, EML4-ALK, ciación en las plataformas más prevalentes en el
etc.)(46-48). mercado: Illumina y Ion Torrent.

Microorganismos Preparación de bibliotecas (library preparation en


El uso de NGS en el ámbito de la salud humana no inglés)
se ha limitado sólo a la secuenciación del genoma Un punto que se ha mencionado previamente, pero
humano o alguna de sus regiones. La herramienta que merece ser explicado con cierto detalle, es la
puede ser también utilizada para secuenciar prácti- preparación de las bibliotecas. Ya sea para la se-
camente todo tipo ADN y/o ARN de microorganis- cuenciación del genoma completo o técnicas de se-
mos en muestras de origen humano (sangre, colec- cuenciación dirigida, el objetivo está orientado a la
ciones, heces, tumores, etc.). obtención de fragmentos cortos de ADN, que varían
El reconocimiento de agentes infecciosos puede ser según las plataformas utilizadas, pero habitualmente
útil para el diagnóstico y tratamiento. Otra aplica- rondan entre 150 y 400 pares de bases. Dependien-
ción importante es el estudio del genoma de la mi- do de la estrategia, la preparación de las bibliotecas
crobiota residente en intestino, piel y otras localiza- puede realizarse antes o después del enriquecimien-
ciones (microbioma), pudiendo reconocer presencia to. La misma consiste en la adición de adaptadores
y abundancia relativa de diversos microorganismos, a ambos extremos de cada uno de los millones de
lo que en ocasiones está asociado al desarrollo de fragmentos de ADN a secuenciar (conocidos con el
ciertas patologías(49). nombre de inserto). Además, en esta etapa se pue-
den añadir etiquetas (secuencias establecidas de
Tipos de muestra ADN para diferenciar cada muestra, llamados ha-
Habitualmente, el ADN obtenido para estudiar en- bitualmente códigos de barra de la muestra [sample
fermedades hereditarias (patología germinal) pro- barcodes en inglés]), por lo que en un mismo en-
viene de leucocitos de sangre periférica, represen- sayo se pueden combinar múltiples muestras sin
tando el genoma del individuo. Sin embargo, las riesgo de entrecruzamiento entre las mismas(39). Los
muestras pueden ser diversas y se puede obtener adaptadores son específicos para cada plataforma
ADN de cualquier tejido o fluido corporal: hisopa- de secuenciación: se trata de fragmentos de ADN
dos bucales, líquido amniótico, vellosidades corió- de doble cadena con secuencias consenso donde se
nicas, líquido cefalorraquídeo, muestras de tejido alinean los cebadores para las etapas de amplifica-
fresco, etc. En el caso de estudio de patología somá- ción del templado (ya sea por PCR-puente o PCR en
tica (en neoplasias), frecuentemente se utiliza ADN emulsión, según plataforma) y los cebadores para la
y/o ARN extraído de sangre periférica o médula secuenciación propiamente dicha(35).
ósea en tumores hematológicos, o de tejido fijado Este punto probablemente sea una de las claves de

HEMATOLOGÍA • Volumen 23 Número Extraordinario XXIV Congreso Argentino de Hematología: 21-38, 2019 27
ROL DE NGS EN PATOLOGÍA MIELOIDE

NGS: la obtención de fragmentos flanqueados por de error de entre 5x10-4 y 5,3x10-7 bases(40,53).
adaptadores con secuencias específicas permite que En cuanto a las técnicas de PCR multiplex (ver Fi-
sea posible realizar millones de reacciones a la vez gura 3), se utilizan múltiples cebadores (primers)
para obtener la secuencia de cada inserto(40). específicos en una misma reacción para enriquecer
Enriquecimiento del blanco (target enrichment en las regiones de interés generando amplicones de ta-
inglés) maño corto. Posteriormente se completa la prepara-
Como se ha mencionado anteriormente, las técnicas ción de bibliotecas. Éste es un método costo-efecti-
de WGS no requieren enriquecimiento, pero sí frag- vo, menos laborioso, se obtienen menos secuencias
mentación. Dicho proceso puede ser por medio de mapeadas fuera de la región de interés (denomina-
sonicación o bien enzimático. Una vez fragmentado das off-target en inglés) y requiere menos tiempo
el ADN, se seleccionan aquellas hebras de un rango que el anterior. Por otro lado, cuenta con pasos de
de tamaño adecuado según la estrategia de secuen- amplificación por PCR, y su potencial fuente de
ciación. errores, como también la posibilidad de caída o falta
En cambio, para desarrollar cualquier protocolo de de la amplificación (allele-dropout o null allele en
secuenciación dirigida, es necesario enriquecer las inglés) cuando se encuentren mutaciones o variantes
regiones de interés a la vez que se separa el resto de secuencia en las regiones de apareamiento de los
del ADN genómico. A lo largo de los años se han cebadores(54). Esta última falencia puede mejorarse
perfeccionado una serie de métodos para aislar posi- e incluso eliminarse con modificaciones en el dise-
tivamente regiones de interés. Estos se podrían eng- ño de los amplicones, teniendo en cuenta variantes
lobar en dos grupos mayoritarios: enriquecimiento habituales en las regiones de interés. Por otra parte,
basado en captura y enriquecimiento basado en la utilización de los denominados “códigos de barra
PCR(40,50). Aunque existen numerosas variantes de moleculares” (molecular barcodes, unique identi-
cada uno de ellos, se describirán a continuación de fiers o primer IDs en inglés; no confundir con los
un modo general. códigos de barra de la muestra -sample barcodes- de
En cuanto al enriquecimiento basado en captura (ver las bibliotecas) en la etapa de enriquecimiento hace
Figura 2), se fragmenta el ADN de la muestra (ya sea que las lecturas con errores vinculados a la polime-
por sonicación o por métodos enzimáticos) para ob- rasa puedan eliminarse bioinformáticamente, y que
tener fragmentos de ADN cortos. Luego de preparar además se filtren duplicaciones de lecturas(40,55-57).
las bibliotecas con dichos fragmentos, ésta se hibri- En los últimos años también se han desarrollado téc-
da con sondas de ADN o ARN complementarias a nicas basadas en microfluídica asociada a PCR en
las regiones de interés. En un principio se utilizaron emulsión para el enriquecimiento de regiones genó-
micromatrices (microarrays) donde las sondas con micas de interés. Este tipo de método está también
secuencias complementarias se encontraban en una basado en PCR, pero en la práctica funciona como
fase sólida, pero posteriormente fueron reemplaza- millones de reacciones independientes y paralelas,
das por sondas en solución líquida, que han ganado en contraposición con la PCR multiplex(40,50,58).
en última instancia mayor popularidad(51,52). Cabe En ocasiones, según la interpretación, se puede in-
mencionar que las sondas en solución se encuentran cluir a un tercer grupo, llamado de captura por cir-
marcadas (con biotina, por ejemplo) y, por lo tanto, cularización, donde el principal exponente son las
pueden capturarse (con perlas magnéticas con avi- sondas moleculares invertidas (molecular inversion
dina, por ejemplo), para terminar descartando todas probes en inglés). Se trata de una estrategia de hi-
las secuencias indeseadas que no se han hibrida- bridación combinada posteriormente con PCR para
do(52). Este método suele ser un poco más costoso amplificar y enriquecer el blanco(57,59).
y consumir más tiempo que los que se describirán
luego, pero tiene la ventaja de ser capaz de enrique- Amplificación del templado y secuenciación masiva
cer mayor cantidad de regiones (mejor funcionali- paralela
dad en exomas o grandes paneles de genes), además Tanto las plataformas de Illumina como de Ion
de eliminar la amplificación por PCR, un paso que Torrent utilizan las bibliotecas como templado de
podría introducir errores en la amplificación, ya que secuenciación, y necesitan de la amplificación del
las polimerasas habitualmente cuentan con una tasa mismo para alcanzar la cantidad de señal necesaria

28 HEMATOLOGÍA • Volumen 23 Número Extraordinario XXIV Congreso Argentino de Hematología: 21-38, 2019
SECUENCIACIÓN DE SEGUNDA GENERACIÓN (NGS): CONCEPTOS BÁSICOS Y APLICACIONES

Figura 2. Enriquecimiento del blanco basado en captura: El ADN es fragmentado en segmentos cortos
(A). Posteriormente se añaden adaptadores (rojo y verde) (B) que se unen a los fragmentos de ADN para
lograr la construcción de la biblioteca (C). Luego se hibrida la biblioteca con sondas complementarias
a las regiones de interés (azul) (D). Las sondas se encuentran marcadas con biotina (amarillo) y pueden
ser capturadas por medio de perlas magnéticas recubiertas con avidina (unión avidina-biotina) (E). Por
último, mediante un imán se capturan las perlas magnéticas y se obtiene una biblioteca que contiene sólo
fragmentos de ADN representando regiones de interés (F).

Figura 3. Enriquecimiento del blanco basado en amplicones (PCR multiplex): Las regiones de interés son
amplificadas a partir de ADN genómico (doble hebra, color negro) por medio de cebadores específicos
(flechas de color azul, rojo, verde) (A). Se obtienen así múltiples copias de las regiones amplificadas (do-
ble hebra color azul, rojo, verde) (B). Luego se añaden los adaptadores para la construcción de la bibliote-
ca (amarillo y violeta) (C). Posteriormente, la biblioteca es purificada para eliminar ADN genómico y los
dímeros de adaptadores (D).

HEMATOLOGÍA • Volumen 23 Número Extraordinario XXIV Congreso Argentino de Hematología: 21-38, 2019 29
ROL DE NGS EN PATOLOGÍA MIELOIDE

Figura 4. Secuenciación en plataformas Illumina.


Luego de la preparación de la biblioteca se realiza amplificación de grupos (clusters) en celda de flujo (A
a D). La biblioteca es diluida y cargada en la celda de flujo de modo que cada hebra de ADN se une a la
celda de flujo por medio de hibridación de los adaptadores (verde y violeta) con oligonucleótidos com-
plementarios a los mismos (unidos al soporte sólido). Mediante una reacción de polimerización se genera
una copia del inserto desde el oligonucleótido unido al soporte sólido (A). Posteriormente se genera la
PCR-puente: el fragmento se curva y el adaptador del extremo libre se une a un oligonucleótido comple-
mentario anclado al soporte sólido. Mediante otra reacción de polimerización (B) se obtiene una segunda
hebra complementaria a la inicial (C). El proceso se repite hasta generar un grupo (cluster) a partir de la
hebra primaria. La generación del grupo facilita la detección por medio de fluorescencia.
La secuenciación propiamente dicha (secuenciación por síntesis) (E a H) se genera a partir de cebadores
específicos para los adaptadores (flecha verde). En cada flujo, los nucleótidos marcados con fluorescencia
(terminadores reversibles) compiten por elongar la cadena de ADN (E) y se une a ella sólo aquel com-
plementario a la hebra molde (F). El resto de los nucleótidos es eliminado, y una fuente lumínica excita
el fluoróforo del nucleótido añadido (G). La señal es recolectada por un dispositivo CCD para luego ser
analizada. El ciclo vuelve a repetirse con un nuevo flujo para incorporar otro nucleótido a la cadena (H).

según la sensibilidad del método de detección. la presencia de terminadores, sólo se puede añadir
En plataformas Illumina (ver Figura 4), las bibliote- un nucleótido por ciclo. El nucleótido incorporado
cas son cargadas en una celda de flujo. es excitado y su emisión lumínica es registrada por
Cada inserto de la biblioteca es amplificado clonal- un dispositivo óptico. Luego, el fluoróforo y el ter-
mente por medio de una PCR-puente, para generar minador se clivan y comienza un nuevo ciclo. Pos-
un grupo o cluster unido al soporte sólido, que se teriormente, las imágenes obtenidas de cada grupo
utilizará como templado. Posteriormente se produce (cluster) son procesadas para generar el llamado de
la secuenciación por síntesis con terminadores re- bases (base calling en inglés) y obtener la secuencia
versibles, donde en cada flujo sucesivo de nucleóti- de cada una de las lecturas. El proceso de secuen-
dos terminadores (marcados con fluorescencia), los ciación se realiza en ambos sentidos (desde ambos
mismos compiten para elongar la cadena. Debido a adaptadores), por lo que se obtienen lecturas de ex-

30 HEMATOLOGÍA • Volumen 23 Número Extraordinario XXIV Congreso Argentino de Hematología: 21-38, 2019
SECUENCIACIÓN DE SEGUNDA GENERACIÓN (NGS): CONCEPTOS BÁSICOS Y APLICACIONES

Figura 5. Secuenciación en plataforma Ion Torrent.


La PCR en emulsión (A a D) consiste en millones de reacciones de PCR ocurriendo simultáneamente en micelas
contenidas en una emulsión. En cada micela se disponen sólo una hebra de ADN (inserto - color negro) flan-
queada por adaptadores (verde claro y rojo), y una perla con secuencias complementarias a uno de los adapta-
dores (verde oscuro) (A). La hebra de ADN se une por complementariedad a la perla (B). Mediante cebadores
específicos complementarios al adaptador libre (rojo claro) se generan ciclos de amplificación clonal (C) para
obtener una perla con múltiples copias del mismo fragmento de ADN inicial (D).
La secuenciación por semiconductor (E a H) se realiza luego de romper la emulsión, enriquecer las perlas am-
plificadas clonalmente y cargarlas en el chip semiconductor. Cada una de las perlas alcanza un pocillo en el chip
(E). A partir de cebadores complementarios al adaptador del extremo libre se realizan flujos de un nucleótido en
particular (en el ejemplo se observa una adenina) (F). Si el nucleótido correspondiente a ese flujo es añadido a la
cadena por complementariedad con la hebra molde, se libera un protón (H+) al generarse la reacción de polime-
rización (G). La liberación de protones en el pocillo causa un cambio de pH que luego se traduce a un cambio
de voltaje y genera la señal cruda de secuenciación (H). Si existiesen homopolímeros, la adición de más de un
nucleótido incrementaría el cambio de voltaje de manera proporcional.

tremos pareados (o paired-end reads en inglés)(39). es el dato crudo necesario para obtener la secuencia
En las plataformas Ion Torrent (ver Figura 5), se ge- de cada lectura. La secuenciación en plataformas
nera una PCR en emulsión con perlas para amplificar Ion Torrent genera lecturas en un solo sentido (lla-
clonalmente cada hebra de la biblioteca. Luego de madas single-end reads)(39).
romper la emulsión y enriquecer las perlas recubier- Tanto Illumina como Ion Torrent presentan una se-
tas de ADN clonalmente amplificado (templado), rie de secuenciadores de distinta escala y capacidad
éstas son cargadas en un chip (semiconductor) que de procesamiento. Además, cada uno de los instru-
contiene millones de pocillos. De un modo óptimo, mentos tiene capacidad para distintas celdas de flujo
cada perla se alojará dentro de un pocillo. Durante o chips semiconductores. De esta forma, se puede
la reacción de secuenciación por semiconductor se elegir la estrategia más adecuada para cada inten-
observan flujos secuenciales de cada uno de los nu- ción de uso(39).
cleótidos sobre el chip. Al incorporarse un nucleóti-
do a la cadena, se genera la liberación de un protón Procesamiento de datos
(ion hidrógeno). El cambio de pH se traduce a una Una parte primordial del flujo de trabajo en NGS es
señal eléctrica (cambio de voltaje), indicando que el procesamiento bioinformático de los datos de se-
en ese flujo fue añadido el nucleótido en cuestión. cuenciación. Comienza con la señal cruda obtenida
Si durante un flujo no se adiciona un nucleótido, no por el secuenciador y finaliza con la interpretación
existe diferencia de pH y por lo tanto tampoco señal de las variantes según el objetivo que persiga el en-
eléctrica. La señal eléctrica captada de cada pocillo sayo.

HEMATOLOGÍA • Volumen 23 Número Extraordinario XXIV Congreso Argentino de Hematología: 21-38, 2019 31
ROL DE NGS EN PATOLOGÍA MIELOIDE

Aunque a priori puede parecer sencillo, este tipo de madas todas las variantes que muestran alguna di-
procesamiento y análisis consume una cantidad va- ferencia con el genoma de referencia, sin que esto
riable de tiempo (de horas a días), a la vez emplea signifique estrictamente patogenicidad(33,39).
gran cantidad de recursos en computadoras y servi- El análisis terciario se realiza a partir del llamado
dores. Los archivos intermedios y finales del pro- de variantes. Consiste en la anotación y el filtrado
cesamiento ocupan un espacio de almacenamiento de cada una de las variantes según el objetivo del
considerable (desde MB a varios GB). Para el estu- análisis. La anotación se basa en la utilización de
dio de variantes puntuales (SNVs) e inserciones o bases de datos y puede incluir información genómi-
deleciones (indels) a nivel de ADN, el mismo consta ca (gen, exón, variante en secuencia codificante y en
de una serie de procesos concatenados denomina- la proteína, etc.), información funcional, frecuencia
dos análisis primario, secundario y terciario. A este poblacional de la variante, predicciones bioinfor-
flujo de trabajo bioinformático se lo denomina habi- máticas de patogenicidad, información fenotípica
tualmente tubería o pipeline bioinformático (por su o clínica vinculada a la variante, etc. (ver Tabla 2)
nombre en inglés). (33,39)
. Por último, el filtrado de las variantes se puede
El análisis primario consta de la conversión de la se- realizar a partir de los elementos anotados, de esta
ñal cruda obtenida por el secuenciador en millones forma se le asigna un valor clínico a cada una de
de secuencias cortas de ADN, correspondientes a ellas. Existen algunos criterios y recomendaciones
las llamadas lecturas (reads en inglés). Las lecturas internacionales para interpretar y reportar variantes
pasan a ser la unidad de análisis del procesamiento germinales y somáticas(63-66). En nuestro país existe
bioinformático y cada una de ellas se corresponde un consenso para reportar variantes asociadas a cán-
con un inserto de la biblioteca. Por lo general este cer hereditario(67).
paso es generado por el instrumento de forma au- Dos conceptos importantes de ser aclarados son la
tomática, y su archivo resultante es habitualmente cobertura y la profundidad de un ensayo. La cober-
un archivo FASTQ. Este tipo de archivos contie- tura (también entendida como cobertura horizontal
nen la secuencia de cada una de las lecturas obte- o coverage breadth en inglés) se refiere a la cantidad
nidas, con un valor de calidad para cada nucleótido de información genómica representada por las lec-
(Phred score)(33,39,60,61). turas obtenidas en el ensayo contra una referencia.
El análisis secundario consta de una serie de pasos La referencia depende de la estrategia utilizada y
de control de calidad, recorte o eliminación de lec- puede ser el genoma completo, exoma, paneles de
turas de baja calidad, mapeo de cada lectura a la genes, etc. En general la cobertura se expresa como
secuencia de referencia, alineamiento local y llama- el porcentaje de lecturas mapeadas contra la refe-
do de variantes. El mapeo de las lecturas emite un rencia esperada. Mientras mayor sea el porcentaje,
archivo llamado SAM (Sequence Alignment/Map) mejor representado está el blanco de nuestro ensayo.
que luego es comprimido en forma binaria a BAM Sin embargo, a lo largo del genoma humano existen
(Binary Alignment/Map). La información contenida ciertas zonas dificultosas de enriquecer o secuen-
en estos archivos puede ser visualizada por el pro- ciar, y la cobertura puede reducirse. El concepto de
grama IGV (Integrative Genomic Viewer) u otra he- fuera de diana (off-target) se interpreta como el por-
rramienta de visualización genómica, mostrando la centaje de las lecturas que se encuentran fuera del
secuencia, mapeo y alineamiento de cada una de las blanco de enriquecimiento. Es ADN secuenciado no
lecturas(62). informativo para el ensayo. En general el fuera de
A partir de este tipo de archivos intermedios y lue- diana es mayor en estrategias de captura(68).
go de aplicar ciertos algoritmos por parte de una La profundidad (también interpretada como cober-
serie de herramientas bioinformáticas, se logra tura vertical o coverage depth en inglés) se refiere
por fin el llamado de variantes en archivo VCF a la cantidad de lecturas mapeadas que representan
(Variant Call Format), un archivo de texto delimi- un mismo locus, o vulgarmente hablando: muestra
tado por tabulaciones que incluye: genoma de re- cuántas veces fue secuenciado un locus en particu-
ferencia, coordenadas cromosómicas de la variante, lar. La profundidad de expresa en x (ej: 50x significa
tipo de cambio de secuencia, valores de calidad del que el locus en particular fue cubierto por 50 lec-
llamado de variantes, etc. En este archivo son lla- turas). La secuenciación de patología somática en

32 HEMATOLOGÍA • Volumen 23 Número Extraordinario XXIV Congreso Argentino de Hematología: 21-38, 2019
SECUENCIACIÓN DE SEGUNDA GENERACIÓN (NGS): CONCEPTOS BÁSICOS Y APLICACIONES

Tabla 2. Bases de datos habitualmente utilizadas para anotación e interpretación de variantes.


Tipo de base de Nombre Sitio WEB
datos
NCBI Genome http://www.ncbi.nlm.nih.gov/genome
RefSeqGene http://www.ncbi.nlm.nih.gov/refseq/
rsg
Referencias genó-
micas UCSC table browser https://genome.ucsc.edu/cgi-bin/hgTa-
bles
Ensemble BioMart http://useast.ensembl.org/biomart/mar-
tview
Exome Aggregation Consortium http://exac.broadinstitute.org/
(ExAC)
Poblacionales gnomAD browser http://gnomad.broadinstitute.org/
1000 genomes http://www.internationalgenome.org/
Exome server project http://evs.gs.washington.edu/EVS/
ClinVar https://www.ncbi.nlm.nih.gov/clinvar/
dbSNP https://www.ncbi.nlm.nih.gov/pro-
jects/SNP/
NCBI genetic testing registry https://www.genetests.org
Leiden Open Variant Database (LOVD) http://www.lovd.nl/3.0/home
Patología heredita- Online Mendelian Inheritance in Man https://www.omim.org/
ria (OMIM)
Locus Specific Mutation Databases http://grenada.lumc.nl/LSDB_list/ls-
dbs
Human Gene Mutation Database http://www.hgmd.cf.ac.uk/ac/index.
(HGMD) php
Ensemble Variant Effect Predictor http://www.ensembl.org/info/docs/
tools/vep/index.html
Catalogue of Somatic Mutations in Can- http://cancer.sanger.ac.uk/cosmic
cer (COSMIC)
The Cancer Genome Atlas (TCGA) http://cancergenome.nih.gov/
OncoKB http://oncokb.org/#/
My Cancer Genome https://www.mycancergenome.org/
Oncología Clinical Interpretations of Variants in https://civicdb.org/home
Cancer (CiVIC)
Personalized cancer therapy, MD An- https://pct.mdanderson.org
derson Cancer Center
Pediatric Cancer Genome Project (St. http://explorepcgp.org
Jude Children’s Research Hospital)

HEMATOLOGÍA • Volumen 23 Número Extraordinario XXIV Congreso Argentino de Hematología: 21-38, 2019 33
ROL DE NGS EN PATOLOGÍA MIELOIDE

general requiere mayor profundidad que la germinal de rechazo de muestras, etc. Se recomienda realizar
debido a la frecuencia alélica esperada de las va- controles de calidad externos (External Quality As-
riantes: a mayor profundidad, mayor confianza en la sessment o EQA en inglés) periódicamente para los
detección de variantes en baja frecuencia(68). tests ofrecidos. Algunos de los EQA más comunes en
Dado que el rendimiento de las celdas de flujo o los nuestro medio provienen de organizaciones interna-
chips semiconductores es fijo, se podría decir que cionales como CAP, EMQN, UKNEQAS, EuroGen-
a mayor cobertura de un ensayo, obtenemos menor test, etc(73-76).
profundidad, y viceversa. Las cuestiones éticas ligadas a la secuenciación ma-
Para cierto tipo de patologías, el valor de la detec- siva son muchas, y aún hoy varias de ellas siguen en
ción de grandes deleciones, duplicaciones o ampli- discusión. Podríamos mencionar diversos tópicos
ficaciones, es muy importante. Este tipo de altera- como: la indicación médica de test genético, reque-
ciones, englobadas bajo el nombre de variación del rimiento de un test genético por parte del paciente
número de copias (Copy Number Variation o CNV (directo al consumidor o DTC), calidad de los tests
en inglés) puede también evaluarse por medio de di- diagnósticos, consentimiento informado, testeo ge-
versos métodos bioinformáticos siempre y cuando nético en menores de edad, reanálisis y seguimiento
el diseño del ensayo lo permita(38,39). de variantes de significado incierto, reporte de ha-
A nivel del ARN el procesamiento bioinformático llazgos incidentales, etc(40,77).
de las lecturas puede detectar presencia de fusiones
génicas, y también puede cuantificar las lecturas co- Próxima generación de secuenciadores
rrespondientes a un transcripto, expresarla de forma Si bien NGS es una herramienta novedosa y pro-
absoluta o relativa, etc. (expresión génica)(68). metedora, se han desarrollado nuevos secuenciado-
res con un concepto diferente. Se los denomina de
Calidad y cuestiones éticas en el diagnóstico clíni- tercera generación: son capaces de secuenciar sin
co: amplificación (secuenciación de molécula única), es
Como en cualquier otra práctica diagnóstica, se debe decir que carecen de pasos de amplificación. Al día
asegurar la calidad de los procesos preanalíticos, ana- de hoy están mayormente en etapas experimentales.
líticos y postanalíticos de la secuenciación NGS. Por Las ventajas de este tipo de secuenciadores radican
un lado, los laboratorios deben estar acreditados por en la posibilidad de secuenciar en tiempo real (sin
organismos (nacionales o internacionales) que garan- necesidad de pausas entre los flujos de nucleótidos),
ticen las buenas prácticas de trabajo y el correcto mo- y en leer hebras de ADN de miles de bases de longi-
nitoreo de los procesos(33,69). Por otro lado, a la hora tud. Por otro lado, la precisión de estos métodos es
de poner en marcha un ensayo de NGS para el diag- algo menor que NGS(15,78).
nóstico clínico, debemos conocer que existen reque-
rimientos y recomendaciones para ofrecer ensayos de Conclusión
NGS tanto para patologías germinales como somáti- La secuenciación masiva paralela, conocida como
cas(35,70-72). Podemos dividir el proceso en familiariza- secuenciación de segunda generación o NGS inclu-
ción, puesta a punto, validación e implementación. ye a un conjunto de técnicas con un concepto simi-
Un punto particularmente importante es la validación lar. La capacidad y rapidez de los secuenciadores y
de los ensayos. Se trata de analizar la funcionalidad el desarrollo continuo de estrategias de testeo más
de un test utilizando muestras conocidas (controles eficaces son parte de la revolución que atravesó la
de calidad externos, controles comerciales) o tes- genómica en los últimos años.
teadas por una técnica ortóloga considerada patrón Como herramienta, NGS brinda la capacidad de
oro, y obtener una serie de parámetros mensurables secuenciar a gran escala, con gran versatilidad. Se
y auditables: sensibilidad, especificidad, exactitud, pueden abordar desde genomas completos hasta
repetibilidad intra- e interensayo, rango reportable, paneles reducidos de genes, estudio de fusiones y
límite de detección, etc(33,70,71). Esto brinda una visión perfiles de expresión génica por ARN, etc. Las so-
del desempeño del ensayo, a la vez que alerta so- luciones bioinformáticas permiten analizar los datos
bre posibles eventualidades a tener en cuenta, como genómicos de forma eficaz.
sesgos, errores sistemáticos, interferencias, criterios Algo que cabe destacar es que NGS, como cualquier

34 HEMATOLOGÍA • Volumen 23 Número Extraordinario XXIV Congreso Argentino de Hematología: 21-38, 2019
SECUENCIACIÓN DE SEGUNDA GENERACIÓN (NGS): CONCEPTOS BÁSICOS Y APLICACIONES

otra técnica, tiene sus ventajas y limitaciones, y no nómicos es un estándar de cuidado, la utilización de
necesariamente sustituye a técnicas tradicionalmen- este tipo de diagnóstico es de gran utilidad. El costo
te establecidas como patrón oro (gold standard) en decreciente para la implementación de estas tecno-
el estudio de ciertas patologías. Por el contrario, la logías hace pensar que en algunos años este tipo de
información genómica que se aporta desde la secuen- testeos se realizará de forma rutinaria.
ciación masiva paralela es complementaria a la de La utilización de herramientas como NGS involucra
otras técnicas, sobre todo en patologías complejas. directa o indirectamente a pacientes, médicos, inves-
A lo largo de los años hemos visto cómo el creci- tigadores, gobiernos, instituciones y seguros de sa-
miento y desarrollo de las técnicas de NGS estu- lud, industria farmacéutica y biotecnológica, etc. Es
vieron asociadas con generación exponencial de importante garantizar la calidad de los procesos prea-
conocimiento en el campo de la genómica, lo que en nalíticos, analíticos y postanalíticos ligados a NGS,
ciertos casos fue llevado al ámbito asistencial por sobre todo en ámbitos asistenciales, por lo tanto se re-
su valor en la clínica. En los últimos años, con el quiere estandarización y regulación en su utilización,
auge de la medicina de precisión, donde el estudio fomentando el trabajo de grupos interdisciplinarios y
de un número cada vez mayor de biomarcadores ge- la formación continua de recursos humanos.

Conflictos de interés: El autor declara no poseer conflictos de interés.

Bibliografía Erlich H. Specific enzymatic amplification of DNA


in vitro: the polymerase chain reaction. Cold Spring
1. Watson JD y Crick FHC. Genetical Implications of
Harb Symp Quant Biol. 1986;51:263-273.
the Structure of Deoxyribonucleic Acid. Nature.
1953;171:964-967. 10. Gilbert W y Maxam A. The nucleotide sequence of the
lac operator. Proc Natl Acad Sci USA. 1973;70:3581-
2. W
atson JD y Crick FHC. Molecular Structure of
3584.
Nucleic Acids: A Structure for Deoxyribose Nucleic
Acid. Nature. 1953;171:737-738. 11. Sanger F. The Croonian Lecture, 1975. Nucleotide
sequences in DNA. Proc R Soc Lond. B Biol Sci.
3. W
ilkins MHF, Stokes AR y Wilson HR. Molecu-
1975;191:317-333.
lar structure of deoxypentose nucleic acids. Nature.
1953;171:738-740. 12. Zhang J, Chiodini R, Badr A y Zhang G. The impact
of next-generation sequencing on genomics. J. Genet.
4. Franklin RE y Gosling RG. Molecular configuration
Genomics 2011;38:95-109.
in sodium thymonucleate. Nature. 1953;171:740-741.
13. Kchouk M, Gibrat JF y Elloumi M. Generations of
5. Crick F. Central Dogma of Molecular Biology. Na-
Sequencing Technologies: From First to Next Gener-
ture. 1970;227:561-563.
ation. Biology and Medicine 2017;09:3.
6. Jackson DA, Symons RH y Berg P. Biochemical
14. Nyrén P y Lundin A. Enzymatic method for continu-
method for inserting new genetic information into
ous monitoring of inorganic pyrophosphate synthesis.
DNA of Simian Virus 40: circular SV40 DNA mol-
Anal Biochem. 1985;151:504-509.
ecules containing lambda phage genes and the galac-
tose operon of Escherichia coli. Proc Natl Acad Sci 15. van Dijk EL, Jaszczyszyn Y, Naquin D y Thermes
USA. 1972;69:2904-2909. C. The Third Revolution in Sequencing Technology.
Trends Genet. 2018;34:666-681.
7. Cohen SN, Chang AC, Boyer HW y Helling RB. Con-
struction of biologically functional bacterial plasmids 16. Human Genome Project FAQ. Disponible en: https://
in vitro. Proc Natl Acad Sci USA. 1973;70:3240- www.genome.gov/human-genome-project/Comple-
3244. tion-FAQ. (Consultado: 12 julio 2019).
8. Nathans D Smith HO. Restriction endonucleases in 17.
Collins FS, Patrinos A, Jordan E. New goals for
the analysis and restructuring of DNA molecules. the U.S. Human Genome Project: 1998-2003. Sci-
Annu Rev Biochem. 1975;44:273-293. ence1998;282:682-689.
9. Mullis K, Faloona F, Scharf S, Saiki R, Horn G y 18. Collins F y Galas D. A new five-year plan for the U.S.

HEMATOLOGÍA • Volumen 23 Número Extraordinario XXIV Congreso Argentino de Hematología: 21-38, 2019 35
ROL DE NGS EN PATOLOGÍA MIELOIDE

Human Genome Project. Science1993;262:43-46. sequencing: a report of the Association for Molecular
Pathology. J Mol Diagn. 2012;14:525-540.
19. Lander ES, Linton LM, Birren B. Initial se-
quencing and analysis of the human genome. Na- 34. Majewski J, Schwartzentruber J, Lalonde E, Montpe-
ture2001;409:860-921. tit A y Jabado N. What can exome sequencing do for
you? J Med Genet. 2011;48:580-589.
20. Venter JC, Adams MD, Myers EW. The sequence of
the human genome. Science2001;291:1304-1351. 35. Rehm HL, Bale SJ, Bayrak-Toydemir P y col. ACMG
clinical laboratory standards for next-generation se-
21. 2003: Human Genome Project Completed. Disponible
quencing. Genet Med. 2013;15:733-747.
en: https://www.genome.gov/25520492/online-edu-
cation-kit-2003-human-genome-project-completed. 36. Lee H, Deignan JL, Dorrani N y col. Clinical exome
(Consultado: 12 julio 2019). sequencing for genetic identification of rare Mende-
lian disorders. JAMA. 2014;312:1880-1887.
22. Weinstein JN. The Cancer Genome Atlas Research
Network, Collison EA y col. The Cancer Genome 37. Bodian DL, Kothiyal P y Hauser NS. Pitfalls of clin-
Atlas Pan-Cancer analysis project. Nature Genetics. ical exome and gene panel testing: alternative tran-
2013;45:1113-1120. scripts. Genet Med. 2019;21:1240-1245.
23. The ENCODE Project Consortium. The ENCODE 38. Koboldt DC, Steinberg KM, Larson DE, Wilson RK
(ENCyclopedia Of DNA Elements) Project. Science. y Mardis ER. The next-generation sequencing revolu-
2004;306:636-640. tion and its impact on genomics. Cell2013;155:27-38.
24. Delaneau O. The 1000 Genomes Project Consortium y 39. Yohe S y Thyagarajan B. Review of Clinical
Marchini J. Integrating sequence and array data to cre- Next-Generation Sequencing. Arch Pathol Lab Med.
ate an improved 1000 Genomes Project haplotype ref- 2017;141:1544-1557.
erence panel. Nature Communications. 2014;5:3934.
40. Bosch JRT, ten Bosch JR y Grody WW. Current Mas-
25. The International HapMap Consortium. The Interna- sively Parallel Sequencing Technologies: Platforms
tional HapMap Project. Nature. 2003;426:789-796. and Reporting Considerations. Genomic Applications
in Pathology. Netto G, Kaul K. 2019, p 11-21. Sping-
26. Stein LD. The case for cloud computing in genome
er, Cham.
informatics. Genome Biol. 2010;11:207.
41.
Gundry M y Vijg J. Direct mutation analysis
27. Heather JM y Chain B. The sequence of sequenc-
by high-throughput sequencing: from germline
ers: The history of sequencing DNA. Genomics.
to low-abundant, somatic variants. Mutat Res.
2016;107:1-8.
2012;729:1-15.
28. Wheeler DA, Srinivasan M, Egholm M y col. The
42. Ding L, Wendl MC, Koboldt DC y Mardis ER. Analy-
complete genome of an individual by massively par-
sis of next-generation genomic data in cancer: accom-
allel DNA sequencing. Nature. 2008;452:872-876.
plishments and challenges. Human Molecular Genet-
29. Rothberg JM, Hinz W, Rearick TM y col. An inte- ics2010;19:R188-R196.
grated semiconductor device enabling non-optical ge-
43. Sastre L. Exome sequencing: what clinicians need
nome sequencing. Nature. 2011;475:348-352.
to know. Advances in Genomics and Genetics.
30. Shendure J, Porreca GJ, Reppas NB y col. Accurate 2014;4:15-27.
multiplex polony sequencing of an evolved bacterial
44. Park PJ. ChIP-seq: advantages and challenges of a
genome. Science. 2005;309:1728-1732.
maturing technology. Nat Rev Genet. 2009;10:669-
31. History of Illumina Sequencing and Solexa Technolo- 680.
gy. Disponible en: https://www.illumina.com/science/
45. Soto J, Rodriguez-Antolin C, Vallespin E, de Cas-
technology/next-generation-sequencing/illumina-se-
tro Carpeño J y Ibanez de Caceres I. The impact of
quencing-history.html. (Consultado: 12 julio 2019).
next-generation sequencing on the DNA methyla-
32. Bentley DR, Balasubramanian S, Swerdlow HP y col. tion-based translational cancer research. Transl Res.
Accurate whole human genome sequencing using re- 2016;169:1-18e1.
versible terminator chemistry. Nature. 2008;456:53-
46. Heyer EE, Deveson IW, Wooi D y col. Diagnosis of
59.
fusion genes using targeted RNA sequencing. Nature
33. Schrijver I, Aziz N, Fakras DH. Opportunities and Communications. 2019;10:1388.
challenges associated with clinical diagnostic genome

36 HEMATOLOGÍA • Volumen 23 Número Extraordinario XXIV Congreso Argentino de Hematología: 21-38, 2019
SECUENCIACIÓN DE SEGUNDA GENERACIÓN (NGS): CONCEPTOS BÁSICOS Y APLICACIONES

47. Wang Q, Xia J, Jia P, Pao W y Zhao Z. Application pert Rev Mol Diagn. 2016;16:357-372.
of next generation sequencing to human gene fusion
60. Ewing B, Hillier L, Wendl MC y Green P. Base-call-
detection: computational tools, features and perspec-
ing of automated sequencer traces using phred. I. Ac-
tives. Briefings in Bioinformatics. 2013;14:506-519.
curacy assessment. Genome Res. 1998;8:175-185.
48. Kumar S, Razzaq SK, Vo AD, Gautam M y Li H.
61. Ewing B y Green P. Base-calling of automated se-
Identifying fusion transcripts using next generation
quencer traces using phred. II. Error probabilities. Ge-
sequencing. Wiley Interdiscip Rev RNA. 2016;7:811-
nome Res. 1998;8:186-194.
823.
62. Thorvaldsdottir H, Robinson JT y Mesirov JP. Inte-
49. Chiu CY y Miller SA. Clinical metagenomics. Nature
grative Genomics Viewer (IGV): high-performance
Reviews Genetics. 2019;20:341-355.
genomics data visualization and exploration. Brief-
50. Mamanova L, Coffey AJ, Scott CE y col. Target-en- ings in Bioinformatics. 2013;14:178-192.
richment strategies for next-generation sequencing.
63. Richards S, Aziz N, Bale S y col. Standards and
Nat. Methods. 2010;7:111-118.
guidelines for the interpretation of sequence variants:
51. Okou DT, Steinberg KM, Middle C, Cutler DJ, Albert a joint consensus recommendation of the American
TJ y Zwick ME. Microarray-based genomic selec- College of Medical Genetics and Genomics and the
tion for high-throughput resequencing. Nat Methods. Association for Molecular Pathology. Genet Med.
2007;4:907-909. 2015;17:405-424.
52. Gnirke A, Melnikov A, Maguire J y col. Solution 64. Li MM, Dato M, Duncavage EJ. Clinical Implementa-
hybrid selection with ultra-long oligonucleotides for tion of the Standards and Guidelines for the Interpre-
massively parallel targeted sequencing. Nat Biotech- tation and Reporting of Sequence Variants in Cancer:
nol. 2009;27:182-189. A Joint Consensus Recommendation of AMP, ASO
and CAP. Cancer Genetics. 2017;26:214-215.
53. Potapov V y Ong JL. Examining Sources of Error
in PCR by Single-Molecule Sequencing. PLoS One. 65. ACMG Board of Directors. ACMG policy statement:
2017;12:e0169774. updated recommendations regarding analysis and re-
porting of secondary findings in clinical genome-scale
54. Ikegawa S, Mabuchi A, Ogawa M y Ikeda T. Al-
sequencing. Genet Med. 2015;17:68-69.
lele-specific PCR amplification due to sequence iden-
tity between a PCR primer and an amplicon: is direct 66. Hehir-Kwa JY, Claustres M, Hastings RJ. Towards
sequencing so reliable? Hum Genet. 2002;110:606- a European consensus for reporting incidental find-
608. ings during clinical NGS testing. Eur J Hum Genet.
2015;23:1601-1606.
55. Peng Q, Vijaya Satya R, Lewis M, Randad P y Wang
Y. Reducing amplification artifacts in high multiplex 67. Consenso sobre Informes de Estudios Moleculares
amplicon sequencing by using molecular barcodes. en Cáncer Hereditario. Instituto Nacional de Cánc-
BMC Genomics. 2015;16:589. er, Ministerio de Salud, República Argentina. Dis-
ponible en: http://www.msal.gob.ar/images/stories/
56. Hamady M, Walker M, Harris M, Gold NJ y Knight R.
bes/graficos/0000001143cnt-20180409-consenso-in-
Error-correcting barcoded primers for pyrosequenc-
formes-estudios-moleculares-cancer-hereditario.pdf.
ing hundreds of samples in multiplex. Nat Methods.
(Consultado: 12 julio 2019).
2008;5:235-237.
68. Netto GJ y Kaul KL. Genomic Applications in Pathol-
57. Hiatt JB, Pritchard CC, Salipante SJ, O’Roak BJ
ogy. 2018. Springer, Cham.
& Shendure J. Single molecule molecular inver-
sion probes for targeted, high-accuracy detection of 69. Deignan JL. Clinical Implementation of Next-Gener-
low-frequency variation. Genome Res. 2013;23:843- ation Sequencing (NGS) Assays. Genomic Applica-
854. tions in Pathology. Netto G, Kaul K. 2019, p 113-118.
Spinger, Cham.
58. Tewhey R, Warner JB, Nakano M y col. Microdrop-
let-based PCR enrichment for large-scale targeted se- 70. Jennings LJ, Arcilla ME, Corless C y col. Guidelines
quencing. Nat Biotechnol. 2009;27:1025-1031. for Validation of Next-Generation Sequencing-Based
Oncology Panels: A Joint Consensus Recommen-
59. Ballester L Y, Luthra R, Kanagal-Shamanna R y Singh
dation of the Association for Molecular Pathology
RR. Advances in clinical next-generation sequencing:
and College of American Pathologists. J Mol Diagn.
target enrichment and sequencing technologies. Ex-
2017;19:341-365.

HEMATOLOGÍA • Volumen 23 Número Extraordinario XXIV Congreso Argentino de Hematología: 21-38, 2019 37
ROL DE NGS EN PATOLOGÍA MIELOIDE

71. Santani A, Murrell J, Funke B y col. Development and sultado: 12 julio 2019).
Validation of Targeted Next-Generation Sequencing
75. UKNEQAS for Molecular Genetics. Disponible en:
Panels for Detection of Germline Variants in Inherited
https://www.ukneqas-molgen.org.uk/. (Consultado:
Diseases. Arch Pathol Lab Med. 2017;141:787-797.
12 julio 2019).
72. Aziz N, Zhao Q, Bry L y col. College of American Pa-
76. Home - EMQN. Disponible en: https://www.emqn.
thologists’ Laboratory Standards for Next-Generation
org/. (Consultado: 12 julio 2019).
Sequencing Clinical Tests. Archives of Pathology &
Laboratory Medicine 2015;139:481-493. 77. Greely HT. Ethical Issues in Clinical Genetics and
Genomics. Genomic Applications in Pathology. Netto
73.
College of American Pathologists. Disponible en:
G, Kaul K. 2019, p 135-146. Spinger, Cham.
https://www.cap.org/. (Consultado: 12 julio 2019).
78. Anderson MW. Emerging Next-Generation Sequenc-
74. EuroGentest: EQA Scheme Molecular. Disponible en:
ing Technologies. Genomic Applications in Patholo-
http://www.eurogentest.org/index.php?id=706. (Con-
gy. Netto G, Kaul K. 2019, p 23-31. Spinger, Cham.

Atribución – No Comercial – Compartir Igual (by-nc-sa): No se permite un uso comercial de la obra original ni de las
posibles obras derivadas, la distribución de las cuales se debe hacer con una licencia igual a la que regula la obra original.
Esta licencia no es una licencia libre.

38 HEMATOLOGÍA • Volumen 23 Número Extraordinario XXIV Congreso Argentino de Hematología: 21-38, 2019

También podría gustarte