Práctica 3
Práctica 3
Práctica 3
I. Objetivos
1. Descargar secuencias para comparar mediante alineamientos
2. Conocer los distintos parámetros de BLAST
order(25,37..41) UniProtKB/Swiss-Prot
(P01112.1)"
/site_type="active"
/note="effector
interaction site order(12..18,28..30,32,
[active]" 35,60,116..117,119..120
,145..146)
/db_xref="CDD:133338
/site_type="other"
/note="GTP/Mg2+ binding
site [chemical
binding]"
/db_xref="CDD:133338"
Tanto en dotpath como en dotmatcher se muestra también la relación entre las secuencias
pero mostrando los gaps o donde no haya coincidencia en las secuencias, es por eso que la
línea no se observa continua y con espacios en blanco.
4.3 Alineamiento global y local con EMBOSS
esta disponible multiple sequence alignment como clustal omega, muscle, cons, etc.
para pairwise sequence alignment esta needle, water, matcher, stretcher, etc.
7. Explore EMBOSS needle y EMBOSS water, probar los formatos pair, fasta,
score, MSF, mark10, clustalX, nexus.
formato pair:
# Commandline: needle
# -auto
# -stdout
# -asequence
emboss_needle-I20240605-200007-0448-35745863-p1m.asequence
# -bsequence
emboss_needle-I20240605-200007-0448-35745863-p1m.bsequence
# -datafile EBLOSUM62
# -gapopen 10.0
# -gapextend 0.5
# -endopen 10.0
# -endextend 0.5
# -aformat3 pair
# -sprotein1
# -sprotein2
# Align_format: pair
# Report_file: stdout
########################################
#=======================================
#
# Aligned_sequences: 2
# 1: CAA80675.1
# 2: NP_005334.1
# Matrix: EBLOSUM62
# Gap_penalty: 10.0
# Extend_penalty: 0.5
#
# Length: 189
# Identity: 157/189 (83.1%)
# Similarity: 171/189 (90.5%)
# Gaps: 1/189 ( 0.5%)
# Score: 804.0
#
#
#=======================================
CAA80675.1 1 MTEYKLVVVGACGVGKSALTIQLIQNHFVDEYDPTIEDSYRKQVVIDGET
50
|||||||||||.||||||||||||||||||||||||||||||||||||||
NP_005334.1 1 MTEYKLVVVGAGGVGKSALTIQLIQNHFVDEYDPTIEDSYRKQVVIDGET
50
CAA80675.1 51 CLLDILDTAGQEEYSAMRDQYMRTGEGFLCVFAINNTKSFEDIHHYREQI
100
||||||||||||||||||||||||||||||||||||||||||||.|||||
NP_005334.1 51 CLLDILDTAGQEEYSAMRDQYMRTGEGFLCVFAINNTKSFEDIHQYREQI
100
#---------------------------------------
#---------------------------------------
formato fasta:
formato score:
CAA80675.1 NP_005334.1 189 (804.0)
#---------------------------------------
#---------------------------------------
formato MSF
//
1 50
CAA80675.1 MTEYKLVVVGACGVGKSALTIQLIQNHFVDEYDPTIEDSYRKQVVIDGET
NP_005334.1 MTEYKLVVVGAGGVGKSALTIQLIQNHFVDEYDPTIEDSYRKQVVIDGET
51 100
CAA80675.1 CLLDILDTAGQEEYSAMRDQYMRTGEGFLCVFAINNTKSFEDIHHYREQI
NP_005334.1 CLLDILDTAGQEEYSAMRDQYMRTGEGFLCVFAINNTKSFEDIHQYREQI
101 150
CAA80675.1 KRVKDSEDVPMVLVGNKCDLPSRTVDTKQAQELARSYGIPFIETSAKTRQ
NP_005334.1 KRVKDSDDVPMVLVGNKCDLAARTVESRQAQDLARSYGIPYIETSAKTRQ
151 189
CAA80675.1 GVDDAFYTLVREIRKHK.EKMSKDGKKKKKKSRTRCTVM
NP_005334.1 GVEDAFYTLVREIRQHKLRKLNPPDESGPGCMSCKCVLS
formato mark10:
# Commandline: needle
# -auto
# -stdout
# -asequence
emboss_needle-I20240605-200851-0398-11896253-p1m.asequence
# -bsequence
emboss_needle-I20240605-200851-0398-11896253-p1m.bsequence
# -datafile EBLOSUM62
# -gapopen 10.0
# -gapextend 0.5
# -endopen 10.0
# -endextend 0.5
# -aformat3 markx10
# -sprotein1
# -sprotein2
# Align_format: markx10
# Report_file: stdout
########################################
#=======================================
#
# Aligned_sequences: 2
# 1: CAA80675.1
# 2: NP_005334.1
# Matrix: EBLOSUM62
# Gap_penalty: 10.0
# Extend_penalty: 0.5
#
# Length: 189
# Identity: 157/189 (83.1%)
# Similarity: 171/189 (90.5%)
# Gaps: 1/189 ( 0.5%)
# Score: 804.0
#
#
#=======================================
#---------------------------------------
#---------------------------------------
formato clustalX:
CLUSTAL W (1.83) multiple sequence alignment
CAA80675.1
MTEYKLVVVGACGVGKSALTIQLIQNHFVDEYDPTIEDSYRKQVVIDGETCLLDILDTAG
NP_005334.1
MTEYKLVVVGAGGVGKSALTIQLIQNHFVDEYDPTIEDSYRKQVVIDGETCLLDILDTAG
CAA80675.1
QEEYSAMRDQYMRTGEGFLCVFAINNTKSFEDIHHYREQIKRVKDSEDVPMVLVGNKCDL
NP_005334.1
QEEYSAMRDQYMRTGEGFLCVFAINNTKSFEDIHQYREQIKRVKDSDDVPMVLVGNKCDL
CAA80675.1
PSRTVDTKQAQELARSYGIPFIETSAKTRQGVDDAFYTLVREIRKHK-EKMSKDGKKKKK
NP_005334.1
AARTVESRQAQDLARSYGIPYIETSAKTRQGVEDAFYTLVREIRQHKLRKLNPPDESGPG
CAA80675.1 KSRTRCTVM
NP_005334.1 CMSCKCVLS
formato nexus:
begin data;
dimensions ntax=2 nchar=189;
format interleave datatype=DNA missing=N gap=-;
matrix
CAA80675.1 MTEYKLVVVGACGVGKSALTIQLIQNHFVDEYDPTIEDSYRKQVVIDGET
NP_005334.1 MTEYKLVVVGAGGVGKSALTIQLIQNHFVDEYDPTIEDSYRKQVVIDGET
CAA80675.1 CLLDILDTAGQEEYSAMRDQYMRTGEGFLCVFAINNTKSFEDIHHYREQI
NP_005334.1 CLLDILDTAGQEEYSAMRDQYMRTGEGFLCVFAINNTKSFEDIHQYREQI
CAA80675.1 KRVKDSEDVPMVLVGNKCDLPSRTVDTKQAQELARSYGIPFIETSAKTRQ
NP_005334.1 KRVKDSDDVPMVLVGNKCDLAARTVESRQAQDLARSYGIPYIETSAKTRQ
CAA80675.1 GVDDAFYTLVREIRKHK-EKMSKDGKKKKKKSRTRCTVM
NP_005334.1 GVEDAFYTLVREIRQHKLRKLNPPDESGPGCMSCKCVLS
;
end;
begin assumptions;
options deftype=unord;
end;
4.4 Alineamiento con BLAST
8. Ingresa a BLAST del NCBI y utiliza las secuencia CAA80675.1
a) 1ra iteración
• Glycine soja – soja silvestre
• Sphenostylis stenocarpa - ñame africano
• Vigna umbellata – frijol arroz
• Ononis spinosa – hierba toro
• Glycyrrhiza uralensis – planta angiosperma
b) 2da iteración
• Psophocarpus tetranogonolobus – Frijol alado
• Cajanus cajan – frijol chícharo
• Abrus precatorius – Coralillo asiático o regaliz americano
• Phaseolus vulgaris – frijol silvestre
• Galega orientalis - galega o ruda cabruna,
c) 3ra iteración
• Medicago sativa – alfalfa
• Onobrychis viciifolia – esparceta
• pisum sativum – chicharo
• Vicia villosa – vezo piloso
• Trifolium repens – trébol blanco
5. Preguntas Extra
1. Defina oncogene.
Un oncogén es un gen que, cuando está mutado o expresado en niveles elevados, tiene el
potencial de causar cáncer. Estos genes normalmente juegan un papel en la regulación del
crecimiento y la división celular. En su forma normal, se conocen como proto-oncogenes y
están involucrados en funciones esenciales para el desarrollo y mantenimiento celular. Sin
embargo, cuando se alteran (por mutación o sobreexpresión), pueden promover la
transformación de una célula normal en una célula cancerosa.
El virus del sarcoma de Rous (RSV) es un retrovirus que fue el primer virus identificado que
causa cáncer en animales. Su descubrimiento ha sido fundamental para el entendimiento de
la oncogénesis viral y la biología del cáncer. La importancia clínica del RSV incluye:
4. ¿Qué es EMBOSS?.
Los alineamientos globales y locales son métodos para comparar secuencias de ADN, ARN
o proteínas:
● Alineamiento global:
○ Compara dos secuencias en su totalidad, desde el inicio hasta el final.
○ Es útil cuando las secuencias son de longitud similar y se espera que sean
similares en toda su extensión.
○ Algoritmo típico: Needleman-Wunsch.
● Alineamiento local:
○ Busca regiones de similitud dentro de las secuencias, sin considerar la
longitud completa.
○ Es útil para encontrar dominios o motivos conservados dentro de secuencias
más largas y diversas.
○ Algoritmo típico: Smith-Waterman.
El valor de expectación (E-value) en BLAST (Basic Local Alignment Search Tool) es una
medida que describe el número de alineamientos esperados por casualidad en una base de
datos dada. Un E-value bajo indica que la similitud entre las secuencias es significativa y no
se debe al azar. En otras palabras, el E-value permite evaluar la significancia estadística de
un alineamiento.
6. Referencias
Altschul, S. F., Gish, W., Miller, W., Myers, E. W., & Lipman, D. J. (1990). Basic local
alignment search tool. Journal of Molecular Biology, 215(3), 403-410.
Needleman, S. B., & Wunsch, C. D. (1970). A general method applicable to the search for
similarities in the amino acid sequence of two proteins. Journal of Molecular Biology, 48(3),
443-453.
Malumbres, M., & Barbacid, M. (2003). RAS oncogenes: the first 30 years. Nature Reviews
Cancer, 3(6), 459-465.