Tema 1 - Representación de La Información
Tema 1 - Representación de La Información
Tema 1 - Representación de La Información
TEMA 1:
REPRESENTACIÓN DE LA INFORMACIÓN
1
2
ÍNDICE
1. Números
2. Texto
3. Señales Analógicas
4. Sonido digital
5. Imágenes digitales
6. Vídeos digitales
3
1. NÚMEROS:
◼ Sistema de numeración
Conjunto de símbolos y reglas de generación que permiten
construir todos los números válidos.
◼ Pueden clasificarse en:
No-posicionales: el valor del símbolo no depende de la
posición que ocupan dentro del número.
◼ Por ejemplo, el sistema de numeración Maya, Egipcia, Chino
o Romano (I, II, III, IV, V, VI, VII, VIII, IX, X, ...)
Posicionales (ponderados): el valor de un dígito depende tanto
del símbolo como de la posición que ese símbolo ocupa en el
número.
◼ Base de numeración: Número de símbolos diferentes
utilizados en el Sistema para representar los números.
◼ Dígito: Cada uno de los símbolos del sistema
Sistema de Base de Nº de
Dígitos usados
numeración numeración dígitos
Decimal Base 10 10 0, 1, 2, 3, 4, 5, 6, 7, 8, 9
4
1. NÚMEROS:
... 23 22 21 20 Potencias de 2
... 8 4 2 1
Más significativo Menos significativo
Suma: y Producto:
0+0=0 00=0
0+1=1 01=0
1 + 1 = 10 11=1
Operaciones aritméticas binarias → similares a las del sistema
decimal 1 1 0
Acarreo
1 1 1 1
1 0 0 1 0 1 1 1 1 0
+ 1 1 0 0 0 1 0 1 1 0
1 0 1 0 1 1 0 1 1 0 0 1 0
7
Signo Magnitud
1 bit N-1 bits
El campo ‘Magnitud’ corresponde al valor absoluto del número en binario natural.
Ejemplos: -3 → 1011 -4 → 1100 -7 → 1111
+3 → 0011 +4 → 0100 +7 → 0111
Ventaja:
◼ Representación intuitiva y fácil.
Inconvenientes:
+0 0 00 ... 0
◼ Existen dos representaciones del 0
–0 1 00 ... 0
◼ El signo se trata de un modo diferente en las sumas y restas → Mayor
complejidad del Hardware del computador (por ello no suele usarse).
9
Signo Magnitud
1 bit N-1 bits
◼ Rango de valores:
Con N bits en Ca2 puede representarse números del rango:
[–2N−1, 2N−1–1]
◼ Ejemplo con 8 bits: puede representarse los valores [–27, 27–1] → [-128,127]
◼ Extensión de bits:
Para convertir el Ca2 de N bits en otro de M bits siendo M>N se añaden
bits de signo (extensión de signo) hasta que su tamaño sea de M bits.
◼ Ejemplo: Extender a 8 bits el número ‘1001’ en Ca2 → se obtiene ‘11111001’
1. NÚMEROS: Hexadecimal
◼ En ciencias de la computación, la base hexadecimal se utiliza para
representar números binarios (de cualquier formato) de forma
compacta.
La sucesión de bits representada por el número en hexadecimal puede
ser interpretada como cualquier codificación binaria: binario natura, signo-
magnitud, Complemento A2,…
Símbolo Símbolo
Binario Decimal Binario Decimal
Hexadecimal Hexadecimal
0 0000 0 8 1000 8
1 0001 1 9 1001 9
2 0010 2 A 1010 10
3 0011 3 B 1011 11
4 0100 4 C 1100 12
5 0101 5 D 1101 13
6 0110 6 E 1110 14
7 0111 7 F 1111 15
13
1. NÚMEROS: Hexadecimal
◼ Conversión de Hexadecimal a binario y viceversa.
Cada dígito hexadecimal se corresponde con 4 dígitos binarios (pues 24 = 16)
Requiere extender los bits (según la codificación empleada) a múltiplo de 4
Ejemplo: convertir el número 111010101 que está en Signo-Magnitud a Hexadecimal
111010101 → 1000 1101 0101 → 8D4
8 D 4
◼ Conversión de Hexadecimal a Decimal (codificado en binario natural)
Mediante la suma de los productos de cada dígito por su peso
Ejemplo: F 8 E(16 = F*162 + 8*161 + E*160 = 15*256 + 8*16 + 14*1 = 3982(10
◼ Conversión de Decimal a Hexadecimal (codificado en binario natural)
Realizando divisiones entre 16 y tomando el resto:
3982 16
E 14 248 16
3982(10 = F8E(16
8 15 F
◼ Conversión de Decimal a Hexadecimal (no codificado en binario natural)
Convertir previamente el decimal a la codificación binaria especificada.
Ejemplo: convertir el -182 a Hexadecimal codificado en Ca2
-182(10 → 1 0100 1010 en Ca2 → 1111 0100 1010 en Ca2 → F4A(16
F 4 A
14
1. NÚMEROS: Reales
◼ Mecanismo: extender los pesos para incluir pesos negativos
221 … 22 21 20 2-1 2-2 … 2-10
X X X X X . X X X X
1. NÚMEROS: Reales
◼ Coma fija: conversión decimal-binario, binario-decimal
Sup. notación (p,q)
valor en coma fija = parte_entera (valor original × 2q)
◼ Asegurarse antes de que la parte entera del valor original cabe en p bits.
Ejemplo: 38.146 en coma fija (8,24)
◼ 38.146 x 224 = 639983681.536 639983682
◼ Paso a binario: 639983682(10 = 00100110.001001010110000001000010(2
◼ Coma Flotante:
Codificación basada en la notación científica por lo que el número de
decimales variable → mayor rango y flexibilidad
El valor se representa como: (–1) signo × 1.frac_mantisa × 2 exponente
Cada campo (signo, frac.mantisa y exponente) se codifica en binario
por separado. Esto permite representar grandes números (exponente
alto) sin perder la precisión de los dígitos más significativos.
16
Mebibytes (MiB) = 220 bytes = 1024 KB Megabits/seg (Mbps) = 106 bits = 1024 Kbps
Gibibytes (GiB) = 230 bytes = 1024 MB Gigabits/seg (Gbps) = 109 bits = 1024 Mbps
Tebibytes (TiB) = 240 bytes = 1024 GB Terabits/seg (Tbps) = 1012 bits = 1024 Gbps
Pebibytes (PiB) = 250 bytes = 1024 TB Petabits/seg (Pbps) = 1015 bits = 1024 Tbps
17
2. TEXTO
◼ Carácter:
Unidad de información mínima e indivisible de la escritura como pueden ser
letras, números, signos de puntuación, símbolos especiales, códigos de control…
Ejemplos de caracteres: a A ? ñ : ú ë 9 ╚ = € ∞ [ ﮖRet]
◼ Codificación de caracteres:
Cada carácter se corresponde en un valor numérico (código) que lo
identifica según el formato de codificación empleado.
Los estándares de codificación de caracteres disponen de tablas de
caracteres que relacionan cada carácter con su código.
◼ Un texto es guardado en un computador almacenando la lista de valores
numéricos de los caracteres que componen el texto.
Ejemplo: la palabra “Hola” se representa con la lista de valores {72, 111, 108, 97}
y se guardará como: 01001000 01101111 01101100 01100001
2. TEXTO: Unicode
◼ Surge con el propósito de reemplazar todos los estándares de codificación de
caracteres por un sistema que contenga todos los símbolos de cualquier lengua.
◼ Es el sistema de codificación más utilizado actualmente y completo que abarca
más de 100 mil caracteres procedentes de multitud de alfabetos actuales
(griegos, latín, cirílico, árabe, chino…), de lenguas muertas (fenicio, rúnico…),
sistemas de escritura como braille, multitud de símbolos (matemáticos,
musicales, iconos…) y su número sigue creciendo en cada recisión del
estándar.
◼ Cada código Unicode (conocido como punto de código) se representa con el
prefijo ‘U+’ seguido un valor en hexadecimal de 4 o más dígitos.
◼ Posee un mecanismo para la composición de caracteres: Un carácter base se
complementa con marcas: signos diacríticos, de puntuación o marcos.
3. SEÑALES ANALÓGICAS
◼ En la naturaleza hay multitud de formas de energía cuyas magnitudes físicas son
de gran interés como la luz, el sonido o la temperatura que varían de forma
continua en el tiempo y toma infinitos valores.
Por ejemplo, la variación de la temperatura durante un día puede variar entre un 0ºC y
40ºC alcanzando infinitos valores en ese intervalo de temperatura y de tiempo.
◼ Señal Analógica: Señal de carácter electromagnético cuya intensidad y
variación en el tiempo es continua (no discreta, podría representarse mediante
una función matemática continua) de resolución infinita que corresponde a alguna
forma de energía de la naturaleza.
◼ Los sensores (o transductores) son sistemas electrónicos que generan señales
analógicas en función del tipo de energía que pueden captar.
Por ejemplo, un micrófono es un transductor que convierte las ondas de sonido (ondas
de presión de aire) en señales eléctricas analógicas (señal de audio).
◼ Los circuitos analógicos trabajan directamente sobre las señales analógicas (con
tensiones o corrientes que actúan como variables continuas).
◼ Señal digital: aquella formada por un conjunto de valores discretos codificados
(generalmente en binario) que corresponden al nivel de intensidad de una serie
de muestras tomadas periódicamente de la señal analógica.
V(t) 8 20 6 -7
t 001000 010100 000110 111001 …
3. SEÑALES ANALÓGICAS
◼ Los sistemas digitales como el computador, sólo interpretan señales digitales lo exige
convertir previamente la señal analógica a digital → Proceso de Digitalización
◼ El proceso de digitalización más común es el PCM, y consta de:
Muestreo: Tomar muestras de la tensión de la señal cada tiempo T (periodo de
muestreo). Este periodo puede indicarse también con la frecuencia de muestreo
f=1/T, que indica el número de muestras tomadas por segundo (Hz).
Retención: Mantener su valor cierto tiempo para poder cuantizar cada muestra.
Cuantización: El rango de amplitudes está dividido en un número de intervalos de
cuantificación. A cada muestra se le asigna un valor según el intervalo en que esté.
Codificación: codificar el valor de cada muestra en binario. Profundidad: número de
bits dedicados a codificar cada muestra así que determina la precisión de la medida.
T
Muestreo Cuantización 12
11
-
-
V11
10 -
9 -
8 - V7
7 -
6 - V5
5 -
4 -
3 -
Retención Codificación 2
1
-
-
0 -
0100 0100 0111 1011… t
La calidad de la señal dependerá de la frecuencia de muestreo y de la resolución de
las muestras (precisión de la medida de las muestras).
Ejemplo: Señal de 2 minutos con valores entre -100 y 100 mili voltios con una
frecuencia de muestreo de 50Hz.
◼ Para cubrir de -100 a 100 puede utilizarse 8 bits en complemento a 2. Rango [-128 a 127]
◼ Tamaño= 120 seg * 50 muestras/seg * 8 bits = 48000 bits en total.
◼ Precisión: con una profundidad de 8 bits se obtiene una precisión de 1mili-voltio.
23
4. AUDIO
¿Cómo se procesa audio en un computador?
◼ 1.- Sistema de codificación MIDI (Musical Instrument Digital Interface)
Interfaz para comunicar Instrumentos musicales electrónica y computadores.
Este sistema se basa en mensajes que codifica el instrumento, la nota, tono, el
tiempo… pero no el sonido en sí.
◼ Ejemplo: clarinete tocando la nota ‘Sol’ durante 2 segundos (3 bytes)
◼ 2.- Señal Digital
Se obtienen de la digitalización de señales analógicas de ondas de sonido por
modulación PCM (modulación por pulsos codificados).
La calidad del sonido digital dependerá de la calidad de la señal analógica original,
de la frecuencia de muestreo y de la profundidad del sonido empleada en la
digitalización.
◼ La calidad del audio es aceptable si se muestrea a frecuencias de al menos el doble de la
frecuencia máxima (Teorema de Nyquist) audible por el ser humano (2*20KHz = 40 KHz).
Algunos estándares de calidad en las señales de audio digital:
Estándar Canales Muestreo (Hz) Resolución (bits) Tasa de bits (bps)
Teléfono 1 8000 16 bits 128 Kbps
Radio FM 1 22000 16 bits 352 Kbps
CD 2 44100 16 bits > 1Mbps
Tamaño de la señal de audio por segundo:
TamAudio(bits/segundo) = NºCanales * FrecMuestreo(muestras/segundo) * Profundidad (bits/muestra)
Ejemplo: Una canción de 5 minutos con calidad de CD ocuparía:
TamAudio = 5min* 60seg/min* 2canales* 44100muestras/seg * 16bits/muestra y canal) = 423.360 * 106 bits
24
4. AUDIO DIGITAL
◼ Formatos de audio digital: existen diversos formatos para almacenar archivos
de audio con y sin compresión…
◼ 1.- Formatos de audio sin compresión:
El formato .wav es el más utilizado de los formatos sin compresión y fue desarrollado
por Microsoft. Otros formatos de este tipo son .aiff (Como wav pero para los
Macintosh) y .cda (pistas de audio grabadas en CDs).
◼ 2.- Formatos de audio con compresión:
Debido al gran tamaño que pueden llegar a ocupar, las señales digitales de audio se
suelen comprimir para reducir su espacio en memoria.
Aunque hay algoritmos de compresión con y sin pérdidas (por ejemplo, flac), los
algoritmos con pérdidas son los más habituales en el ámbito doméstico.
La compresión con pérdidas se basan reducir la tasa de bits (bits por segundo)
eliminando toda información no perceptible por el oído humano.
◼ La tasa de bits es un indicador de la calidad del audio dentro del mismo formato
de compresión
Formatos de compresión con pérdidas más habituales:
◼ mp3 (MPEG-1 Audio Layer 3) : estándar de compresión más usado por sus
altas compresiones sin muchas pérdidas pero tiene patentes.
◼ aac: permite mayor compresión que el mp3 (MPEG-1) sin mayores pérdidas de
calidad. Es el candidato más probable a suceder al mp3.
◼ Vorbis: De similares características al mp3 pero sin patentes.
◼ Otros formatos: adpcm, atrac, AC3, dts, mp2, Musepack, Vorbis, wma…
25
5. IMÁGENES DIGITALES
◼ Una imagen digital se compone de una matriz bidimensional (filas x columnas)
de puntos denominados píxeles.
Resolución de la imagen: cantidad de detalles o calidad que posee. Puede definirse
indicando el nº de columnas x nº de filas en píxeles (ancho x alto) o mediante el número
total de píxeles que posee en Megapíxeles (Megapíxel = 106 píxeles)
Relación de aspecto: proporción entre el ancho y el alto. Se expresa como X:Y
◼ Ejemplo: Una imagen de 1280x1024 tiene una relación de aspecto de 5:4
◼ Cada pixel posee una serie de bits que determina la representación de un puntos
de la imagen. El formato de estos bits viene especificado por el tipo de imagen.
Profundidad de color: número de bits empleados para representar cada pixel.
◼ Tipos de imágenes:
Binarias (monocromáticas):
◼ Cada pixel contiene un sólo bit para representar el blanco o el negro.
En escala de grises:
◼ Los píxeles representan una grama de grises.
◼ Los bits del pixel indicarán el nivel de gris (intensidad) del pixel.
Ejemplo: 256 valores en escala de grises (8 bits).
Color:
◼ Utiliza varios bits para representar el color.
◼ Hay varios formatos según el modelo de color empleado (véase páginas sucesivas)
◼ Tamaño de una imagen: Tamaño(bits) = NºPíxelesImagen * TamañoPixel(bits)
26
5. IMÁGENES: RGB
◼ Ejemplo de descomposición del color en RGB:
0 255
5. IMÁGENES: CMYK
◼ CMYK es un modelo basado en la síntesis sustractiva del color y se usa
especialmente en artes gráficas e impresión ya que la mezcla de pigmentos
es sustractiva, esto es, las tintas absorben la luz que
incide sobre ellas restando longitudes de ondas a
medida que se añaden más pigmentos (oscurecen el
papel) hasta no reflejar luz alguna (color negro).
◼ Los colores primarios son el Cyan, Magenta y
Amarillo, obteniéndose de su mezcla dos a dos
los colores secundarios: Azul, Verde y Rojo.
◼ Además de los 3 primarios (CMY) se añade al
modelo el color negro (por ello la K final de CMYK)
pues si mezclaran los 3 primarios para obtener el negro:
Se conseguiría un marrón oscuro en la
práctica debido a las impurezas de las tintas.
El papel se humedecería al tener que aplicar
3 colores.
La tinta negra es más económica lo que podría
suponer un gran ahorro si se usa mucho el
color negro.
29
6. VÍDEO DIGITAL
◼ Consiste en una secuencia de imágenes (frames o campos) digitalizadas que
representan a escenas en movimiento que pueden llevar o no audio.
◼ Muchas características de un vídeo (resolución, codificación, aspecto,
profundidad de color, etc…) son heredadas del tipo de imágenes y sonidos que
lo componen.
◼ Tasa de refresco (o fps, frame per second): velocidad a la que se muestran las
imágenes para formar el movimiento. Se mide en imágenes por segundo.
A partir de 12 imágenes por segundo el cerebro humano percibe las imágenes como
movimiento, aunque suele utilizarse tasas de 24 fps (NTSC) o 25 fps (PAL).
◼ Tamaño del vídeo sin audio (sin comprimir):
Tam(bits) = Duración(seg)* TasaRefresco(fps)* Resolución(nºPíxeles)* ProfundidadColor(bits)
6. VÍDEO DIGITAL
Con compresión:
◼ Reducen considerablemente el tamaño del vídeo ya que no almacenan la
información completa de cada frame, sino únicamente las modificaciones con
respecto al frame anterior en grupos de píxeles (macro-bloques).
◼ Se emplean en videos para ser reproducidos (distribución en videos terminados) por
lo que es la opción más habitual.
MPEG-1: para vídeo CD. Calidad similar a VHS (extensiones .mpg, .mpeg, etc.)
MPEG-2: para DVD comerciales, TDT y SVCD.
MPEG-4: para compresión de datos de audiovisuales para la web (streaming),
distribución de CD, video conferencia,…
Xvid: códec libre muy popular por su calidad y eficiencia basado en MPEG-4.
DivX: códec también muy popular basado en MPEG-4 que ha sido relegado.
H.264 (MPEG-4 Part 10): muy utilizado actualmente para comprimir video digital
de alta definición pues consigue alta compresión con buena calidad de imagen.
◼ Formatos contenedores:
Especifican el tipo de archivo que almacenan audio y video describiendo cómo las pistas
de audio y video se unen o se separan en un archivo pero no define el formato de
compresión (códec) utilizado dentro del contenedor para comprimir o descomprimir.
Los formatos contenedores más conocidos son: avi, mkv, mpg, mov,…