P.6 Bioinformatica
P.6 Bioinformatica
P.6 Bioinformatica
PRÁCTICA 4
BIOINFORMÁTICA - NCBI
1
BIOLOGÍA MOLECULAR
2
BIOLOGÍA MOLECULAR
Además, podemos realizar una búsqueda avanzada (indicado debajo de la barra del
buscador) en la que podemos incluir términos específicos para campos concretos de
la base de datos de PubMed consiguiendo así una búsqueda más específica y
precisa: autor, fecha de publicación, idioma de la publicación, etc.
3
BIOLOGÍA MOLECULAR
Imaginemos que queremos buscar la secuencia del mensajero del gen PTP-1B usando
el procedimiento de búsqueda avanzada. Introduciremos sucesivamente los términos
“Mus musculus” y “protein tyrosine phosphatase 1B” en los campos de “organism” y
“protein name” respectivamente.
4
BIOLOGÍA MOLECULAR
El formato FASTA es una de los más utilizados para mostrar una secuencia. Cada
secuencia comienza con una línea de descripción. Esta línea se distingue porque
siempre comienza con el signo > (“mayor que”) seguida de un identificador único. Tras
un espacio, puede incluir un texto descriptivo. A continuación, sigue la secuencia
(nucleótidos o aminoácidos) propiamente dicha en texto sin formato, y el ancho de
cada línea de la secuencia es la misma (con la posible excepción de la última línea).
5
BIOLOGÍA MOLECULAR
Uno de los pasos fundamentales antes de llevar a cabo una PCR es el diseño de primers
o cebadores. Estos se tratan de oligonucleótidos monocatenarios cuya secuencia es
complementaria a las regiones que flanquean el fragmento a amplificar. Un buen
diseño nos permite llevar a cabo un procedimiento con la mejor calidad y cantidad del
producto de amplificación posible.
6
BIOLOGÍA MOLECULAR
Gracias a los distintos recursos básicos que aporta la bioinformática, podemos diseñar
y analizar primers específicos para amplificar una región determinada.
7
BIOLOGÍA MOLECULAR
CUESTIONARIO
Diseña una pareja de primers para la secuencia de PTP-1B con la aplicación NCBI.
Indica las secuencias de dichos primers, su tamaño, Tm y porcentaje de GC. Por último,
indica el tamaño de amplicón que obtendríamos con este par de primers.
8
BIOLOGÍA MOLECULAR
El término ORF se refiere a una parte de una secuencia nucleotídica con la capacidad
de codificar un péptido o una proteína y que contiene, por tanto, un codón o triplete
de iniciación y un codón de terminación.
9
BIOLOGÍA MOLECULAR
Se abre una pestaña que nos permite introducir nuestra secuencia, en formato FASTA,
para llevar a cabo su estudio. Para ello escribimos en la primera línea del cuadro en
blanco una línea de identificación de nuestra secuencia problema, la cual empieza
siempre con el símbolo “mayor que” (>) y a continuación un texto descriptivo. En las
siguientes líneas irá la secuencia de nucleótidos propiamente dicha. No importa que
vayan números al principio de las líneas, ni que haya espacios en blanco. Una vez que
se haya pegado la secuencia hacemos click en submit para ejecutar el programa.
El resultado del programa nos muestra 7 posibles marcos de lectura abiertos: 5 para la
hebra positiva y 2 para la hebra negativa. Nos centramos en ORF2 ya que presenta
10
BIOLOGÍA MOLECULAR
mayor longitud (600nt – 199aa). Si pinchamos en ella, aparecerá una nueva pantalla
con la ORF seleccionada aislada y con su traducción a proteína.
>ORF +1 601-1200
M K W V W A L A L L A A W A A
A E R D C R V S S F R V K E N
F D K A R F S G T W F A L A K
K D P E G L F L Q D N F V A E
F S V D E T G Q M S A T A K G
R V C L L N N W D V C A D K V
G T F T D T E D P A K F K M K
Y W G V A S F L Q K G N D D H
W I V D T D Y D T Y A V Q Y S
C R L L N L D G T C A D D Y S
F V F S R D P N G L P P E A Q
K I V R Q R Q E E L C L A R Q
Y R L I G H N G Y C D G R S E
R N L L
Hasta ahora tenemos una secuencia de proteína, pero no sabemos cual es su función,
su familia o la homología que guarda con otras proteínas de la misma o distintas
especies. Las bases de datos nos permiten conocer este tipo de información.
Uno de los programas más utilizados para buscar parecidos u homologías es BLAST
(Basic Local Alignment Search Tool). Este programa compara una secuencia de
proteína o de nucleótidos con una base de datos (de proteínas o de nucleótidos). La
aplicación BLAST permite:
11
BIOLOGÍA MOLECULAR
Nosotros vamos a utilizar la variante BLASTP que compara una proteína con una base
de datos de proteínas. Este BLAST lo podemos hacer directamente en la página web en
la que hemos realizado la búsqueda de ORF’s seleccionando “Blastp” como programa y
como base de datos seleccionamos “Swissprot”.
Dado que se trata de una proteína, utilizamos la opción “Protein blast”. Copiamos la
secuencia problema en la ventana en blanco y seleccionamos una base de datos de
proteínas con la que la podamos comparar. En este caso elegimos la base de datos
Refseq de proteínas, aunque podríamos haber utilizado otra distinta. Refseq tiene la
ventaja de que se trata de una colección exhaustiva de secuencias de proteínas no
redundantes y bien anotadas.
Una vez incluida la secuencia de trabajo pincharemos en el botón BLAST que aparecerá
más abajo en la misma página. De esta forma, se iniciará el proceso de búsqueda de
secuencias similares a la nuestra.
El proceso de búsqueda puede tardar varios minutos. Después, nos aparece una
pantalla que nos indica de qué tipo de proteína se trata nuestra proteína problema.
12
BIOLOGÍA MOLECULAR
Cada proteína homóloga aparece marcada en azul, si pinchamos en los enlaces que
aparecen bajo la columna “Accession” podremos ver la información sobre esa
proteína, la secuencia, quién la secuenció y otras bases de datos que tengan
información sobre esa proteína.
Por lo tanto, podemos concluir de este análisis, que nuestra secuencia se trata de una
lipocalina que pertenece al grupo de las Proteínas que unen retinol (Retinol Binding
Proteins). De esta forma, es muy probable que nuestra secuencia corresponda a una
proteína que también transporte retinol.
13
BIOLOGÍA MOLECULAR
6. VISUALIZACIÓN TRIDIMENSIONAL
Una vez que obtenemos todas las proteínas con las que tiene homología nuestro ORF
podemos visualizarlas en 3 dimensiones, para ello, debemos pulsar en su “accession” y así no
llevará a la parte dedicada a las proteínas del portal NCBI:
14
BIOLOGÍA MOLECULAR
7. ACTIVIDADES
cttcctgtccaatcgctgcctcaagctggcttaagtcctgctgagattcagcagttatggaaagaagtga
ctggagttcacagtatggaagacaatggcattaaacatggagggctagacctcactactaacaattcctc
ctcgactacctcctccaacacttccaaagcatcaccaccaataactcatcattccatagtgaatggacag
tcttcagttctaagtgcaagacgagacagctcgtcacatgaggagactggggcctctcacactctctatg
gccatggagtttgcaaatggccaggctgtgaaagcatttgtgaagattttggacagtttttaaagcacct
taacaatgaacacgcattggatgaccgaagcactgctcagtgtcgagtgcaaatgcaggtggtgcaacag
15