Tema 1. Estadística Descriptiva - Distribuciones de Frecuencias y Gráficos

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 44

ORGANIZACIÓN Y PRESENTACIÓN DE LOS DATOS.

Uso de Tablas de Distribución de Frecuencias y de los


Diferentes tipos de Gráficos para representar los datos

Joel Patiño De Los Santos


DISTRIBUCIONES DE FRECUENCIAS

Características de las distribuciones de frecuencias

• La Operación Básica En Estadística Descriptiva


Consiste En Presentar La Información Para Su
Estudio.

• El Objeto De La Estadística Descriptiva Es La


Realización De Comparaciones Significativas
Entre Agrupaciones De Datos

• ¿Cómo Puedo Describir A Una Población O


Muestra??????

Joel Patiño De Los Santos


DISTRIBUCIONES DE FRECUENCIAS

Características de las distribuciones de frecuencias

• OPERACIONES BÁSICAS CON LOS


DATOS:
• AGRUPACIÓN (ORGANIZACIÓN,
ORDENACIÓN)
• TRATAMIENTO ARITMÉTICO DE LOS
DATOS

Joel Patiño De Los Santos


DISTRIBUCIONES DE FRECUENCIAS

Características de las distribuciones de frecuencias

• Las Distribuciones Son La Forma En Que


Se Organizan Y Se Comparan Los Datos
Obtenidos.
• Hay Distribuciones De Frecuencias,
Porcentuales Y Acumuladas, estas las
veremos como Frecuencias Absolutas y
Frecuencias Relativas

Joel Patiño De Los Santos


DISTRIBUCIONES DE FRECUENCIAS
Características de las distribuciones de frecuencias, Categorías

• Agrupadas en frecuencias, VALORES REPETIDOS PARA


POCAS CATEGORIAS de la variable
– En este tipo de distribución de frecuencias, la variable posee pocos
valores, pero se repiten varias veces debido a que provienen de una
muestra o población grande. Ejemplo:
• SEXOS EN UNA CLASE
• EDADES UN GRUPO DE EMPLEADOS

• Agrupadas en intervalos de clase y frecuencias, MUCHOS


VALORES POSIBLES Y MUCHAS CATEGORIAS de la variable
– En este tipo de distribución de frecuencias, la variable posee MUCHOS
valores que se repiten varias veces debido a que provienen de una
muestra o población grande, Ejemplo:
• INGRESOS, PESO, EDADES, ETC

Joel Patiño De Los Santos


DISTRIBUCIONES DE FRECUENCIAS
Características de las distribuciones de frecuencias

• Las distribuciones de frecuencias son la expresión


analítica de las variables y son fundamentales en el
análisis tanto de una como de varias variables, además
son la base de las distribuciones porcentuales y
agrupadas.

• Son distribuciones donde cada una de las CATEGORIAS


en las que se descompone una variable son presentadas
en relación al número de CASOS que tienen.

• Las DISTRIBUCIONES O TABLAS DE FRECUENCIAS


sirven para la expresión de cualquier tipo de variable
(CUALITATIVAS, CUANTITATIVAS, CONTINUAS Y
DISCRETAS, ORDINAL, NOMINAL, INTERVALO, ETC)

Joel Patiño De Los Santos


DISTRIBUCIONES DE FRECUENCIAS
Características de las distribuciones de frecuencias

• Una vez asignadas las categorías a una variable,


llamaremos FRECUENCIA al número de casos en cada
una de esas categorías y los resultados los expresaremos
en las llamadas TABLAS DE FRECUENCIAS:

Por ejemplo: VARIABLE: CUALITATIVA, NOMINAL


Nacionalidad Frecuencia (fi)
CATEGORIAS
Dominicana 2,684,642
Haitiana 94,740
Estadounidense 10,682
Venezolana 7,720
Española 2,264
Puertorriqueña 1,108
Otras 6,123
TOTAL 2,807,279
Joel Patiño De Los Santos
DISTRIBUCIONES DE FRECUENCIAS
Características de las distribuciones de frecuencias

• Si la variable está expresada en escala de


intervalo, llamaremos también INTERVALO (O
CLASE) a las categorías definidas:

CATEGORIAS
Edad Fi
intervalos/clase entre 15 y 16 años 223
entre 17 y 18 años 194
entre 19 y 20 años 244
entre 21 y 22 años 222
entre 23 y 24 años 317
Total 1200

LA MAYORÍA DE LAS VARIABLES CONTINUAS HAN DE ADQUIRIR


LA FORMA DE INTERVALO (AGRUPADA) Y TAMBIEN MUCHAS
DISCRETAS, A EFECTOS DE FACILITAR SU ANÁLISIS

Joel Patiño De Los Santos


DISTRIBUCIONES DE FRECUENCIAS
Características de las distribuciones de frecuencias

• Llamaremos FRECUENCIA ABSOLUTA o SIMPLE al


número total de casos en cada categoría.

Tabla de frecuencias ABSOLUTAS


CATEGORIAS Frecuencia de
Edad Fi clase/Frecuencia
intervalos/clase entre 15 y 16 años 223 absoluta o SIMPLE
entre 17 y 18 años 194
entre 19 y 20 años 244
entre 21 y 22 años 222
entre 23 y 24 años 317
Total 1200

Frecuencia absoluta o simple (también llamada frecuencia de clase): número


de veces que se repite un suceso. Expresión = fi (con la f minúscula)
N o n = Representa el Número total de casos o frecuencias (suma de todas las fi)..

N = ∑fi
Joel Patiño De Los Santos
DISTRIBUCIONES DE FRECUENCIAS
Características de las distribuciones de frecuencias

• Llamaremos FRECUENCIA ABSOLUTA ACUMULADA a la suma de la


frecuencia simple de cada categoría con la anterior

Tabla de frecuencias ABSOLUTAS ACUMULADAS

f¡ Fa
izquierda 100 100 Frecuencia
ABSOLUTA
derecha 250 350 ACUMULADA (Fa)

Centro 300 650


Total (N o n) 650 Notar que el
ultimo valor de la
Fa es igual al
total (N)
N o n= Número total de casos (suma de todas las fi).. N = ∑fi

Joel Patiño De Los Santos


DISTRIBUCIONES DE FRECUENCIAS
Características de las distribuciones de frecuencias

• Para establecer comparaciones más allá de la pura


observación, se emplean las llamadas FRECUENCIAS
RELATIVAS que son el cociente entre cada frecuencia
absoluta (f¡) con el total de casos (N) multiplicado por
100, es decir,
fr = fi / N * 100
Frecuencia
f¡ fr% RELATIVA (fr)

Hombres 100 29%


Mujeres 250 71%
Total (N o n) 350 100%
Frecuencia relativa: Es una PROPORCIÓN .

Joel Patiño De Los Santos


DISTRIBUCIONES DE FRECUENCIAS
Características de las distribuciones de frecuencias

• Al igual que en las frecuencias absolutas


acumuladas, existe la Frecuencia Relativa
Acumulada (Fra%)
Frecuencia RELATIVA
ACUMULADA (Fra%)

f¡ fr% Fra%
Hombres 100 29% 29%
Mujeres 250 71% 100%
Total (N o n) 350 100%

Joel Patiño De Los Santos


DISTRIBUCIONES DE FRECUENCIAS
Características de las distribuciones de frecuencias

• Ejemplo De Una Distribución De


Frecuencias realizado por un software
estadístico
EDAD

Cumulative
Frequency Percent Percent
Valid etre 15 y 16 años 223 18,6 18,6
entre 17 y 18 años 194 16,2 34,8
entre 19 y 20 años 244 20,3 55,1
entre 21 y 22 años 222 18,5 73,6
entre 23 y 24 años 317 26,4 100,0
Total 1200 100,0

Joel Patiño De Los Santos


DISTRIBUCIONES DE FRECUENCIAS
Características de las distribuciones de frecuencias

• En las distribuciones de frecuencias con datos agrupados


o de intervalo, los datos se presentan de manera fácil y
comprensible...Pero se pierde información

EDAD

Cumulative
Frequency Percent Percent
Valid etre 15 y 16 años 223 18,6 18,6
entre 17 y 18 años 194 16,2 34,8
entre 19 y 20 años 244 20,3 55,1
entre 21 y 22 años 222 18,5 73,6
entre 23 y 24 años 317 26,4 100,0
Total 1200 100,0

¿cuántas Personas
HAY DE 16 AÑOS??
Joel Patiño De Los Santos
DISTRIBUCIONES DE FRECUENCIAS

Principios a utilizar al construir una Tabla de Distribución de


Frecuencias, TDF.

Aunque esta tabla sirve para resumir información de variables discretas ó


continuas, de manera particular la TDF permite transformar una variable
continua, a una variable discreta definida por el número de intervalos y su
frecuencia.

•Lo primero para construir una TDF es definir el “número de clases” ó intervalos
a crear y el “intervalo o ancho” de cada intervalo. El número de clases se
recomienda que no sean menor de 5 ni mayor de 20.

•Hay que utilizar más clases cuando se tiene más datos disponibles, si el
número de clases es muy grande es posible tener muchas clases vacías, si es
demasiado pequeño podrían quedar ocultas características importantes de los
datos al agruparlos. Se tendría que determinar el número de clases a partir de la
cantidad de datos presente y de su uniformidad, en general con menos de 30
datos se usa una TDF con 5 clases.
Joel Patiño De Los Santos
DISTRIBUCIONES DE FRECUENCIAS

Si por alguna razón no es fácil decidir el ancho del


intervalo y el número de ellos, se pueden utilizar
las siguientes fórmulas:
 K = 1 + 3.322 log (n)
 Donde K = número aproximado de clases

n = número de datos.
 Amplitud de los intervalos = Rango / K
 Donde Rango = diferencia entre el dato
mayor y el dato menor del conjunto.

Joel Patiño De Los Santos


DISTRIBUCIONES DE FRECUENCIAS
Ejemplo: Un investigador desea determinar cómo varían las
puntuaciones obtenidas de un grupo de estudiantes en las Pruebas
Nacionales de 6to de Secundaria y toma una muestra de 50 estudiantes
y consulta sus puntuaciones. Los datos obtenidos fueron los siguientes:
65 63 65 63 69 67 53 58 60 61
64 65 64 72 68 66 55 57 60 62
64 65 64 71 68 66 56 59 61 62
63 65 63 70 67 66 57 59 61 62
64 64 63 69 67 66 58 60 61 62

Para construir la tabla de distribución de frecuencias de las


puntuaciones seguiremos los siguientes pasos:

Joel Patiño De Los Santos


DISTRIBUCIONES DE FRECUENCIAS
1. Ordeno los datos en forma ascendente.

53, 55, 56, 57, 57, 58, 58, 59, 59, 60, 60, 60, 61, 61, 61, 61, 62, 62,
62, 62, 63, 63, 63, 63, 63, 64, 64, 64, 64, 64, 64, 65, 65, 65, 65, 65,
66, 66, 66, 66, 67, 67, 67, 68, 68, 69, 69, 70, 71, 72.

2. Determinar la cantidad de datos (n).

n = 50

3. Calculo el número de clases (NC).

NC = 1 + 3.322 * log(n) = 1 + 3.322 * log(50) = 1 + 3.322 * 1.7 =


1 + 5.644 = 6.644 ≈ 7
Joel Patiño De Los Santos
DISTRIBUCIONES DE FRECUENCIAS

Puntuaciones fi Fi fr% Fra%


53-56 2 2 2/50 * 100 = 4% 4.0%
56-59 5 7 5/50 * 100 = 10% 14.0%
59-62 9 16 9/50 * 100 = 18% 32.0%
62-65 15 31 15/50 * 100 = 30% 62.0%
65-68 12 43 12/50 * 100 = 24% 86.0%
68-71 5 48 5/50 * 100 = 10% 96.0%
71-74 2 50 2/50 * 100 = 4% 100.0%
Total 50 100.0%
Joel Patiño De Los Santos
DISTRIBUCIONES DE FRECUENCIAS
Interpretación: Recuadros sombreados
• fi 1ra clase: De los 50 estudiantes, 2 de ellos tienen
obtuvieron una calificación mayor de 53 y menor de 56
pulgadas.

• Fi 2da clase: De los 50 estudiantes, 7 de ellos


obtuvieron una calificación menor de 59 puntos.

• fr% 5ta clase: El 24% de los 50 estudiantes obtuvo una


puntuación mayor de 65 y menor de 68 puntos.

• Fra% 4ta clase: El 62% de los 50 estudiantes obtuvo


una puntuación menor de 65 puntos.
Joel Patiño De Los Santos
PRESENTACIÓN DE DATOS

Joel Patiño De Los Santos


PRESENTACIÓN DE DATOS

Presentación Escrita
La presentación escrita es una de las tres formas diferentes de presentar los
datos estadísticos, la misma se utiliza cuando una serie de datos incluye pocos
valores, por lo cual resulta más apropiada la palabra escrita como forma de
describir el comportamiento de los datos. Asimismo, mediante la forma escrita,
se resalta la importancia de las informaciones principales.

Presentación Tabular
La presentación tabular es una de las tres formas diferentes de presentar los
datos estadísticos; cuando los datos estadísticos se presentan a través de un
conjunto de filas y de columnas que responden a un ordenamiento lógico, a este
resultado se le llama forma de presentación tabular o simplemente tabla o
cuadro estadístico.
Joel Patiño De Los Santos
PRESENTACIÓN DE DATOS

Joel Patiño De Los Santos


PRESENTACIÓN DE DATOS

Número de cuadro: Elemento numérico que permite identificar al cuadro


estadístico al interior de la publicación

Título: Es la inscripción que se coloca después del número de cuadro, en la


parte superior izquierda o central, con el propósito de dar a conocer las
variables y sus características en él.

Encabezamiento: Son las columnas insertadas en la parte superior del cuadro


y que, generalmente aparecen en uno, dos o tres niveles.

Columna matriz: Es el elemento localizado al lado izquierdo del cuadro


estadístico, siendo además la primera columna del mismo.

Cuerpo: Es la parte del cuadro estadístico donde se colocan los datos


numéricos correspondientes a los conceptos presentados en el
encabezamiento y la columna matriz

Notas al pié: Se destina para anotar aquellas aclaraciones o señalamientos


particulares y generales sobre la información: notas, llamadas, fuentes y
elaboración.
Joel Patiño De Los Santos
PRESENTACIÓN DE DATOS
Presentación Gráfica

La presentación gráfica es una de las tres formas diferentes de presentar los datos
estadísticos, la misma proporciona al lector o usuario mayor rapidez en la
compresión de los datos. Esta forma de presentación le da al usuario un valor
aproximado de la información; a diferencia de la presentación tabular que ofrece
exactitud.

Un gráfico o representación gráfica es un tipo de representación de datos,


generalmente numéricos, mediante recursos gráficos (líneas, vectores, superficies
o símbolos), para que se manifieste visualmente la relación matemática o
correlación estadística que guardan entre sí.

El uso de la gráfica es bastante amplio en la estadística, para presentar datos o


para comparar varios grupos de datos, dado el hecho de que casi todas las
informaciones de características cuantitativas pueden ser expresadas a través de
gráficas.

Joel Patiño De Los Santos


PRESENTACIÓN DE DATOS
Las representaciones de las distribuciones de
frecuencias

• La elección de cada tipo de gráfico dependerá de

– Los objetivos del análisis que vayamos a efectuar.


– Del tipo de variable que vayamos a
tratar.(cualitativas/cuantitativas y continuas o
discretas)

Joel Patiño De Los Santos


PRESENTACIÓN DE DATOS
Las representaciones de las distribuciones de
frecuencias

• GRÁFICOS PARA LA DESCRIPCIÓN Y


COMPARACIÓN DE CATEGORÍAS EN UNA
VARIABLE

– Diagrama de barras (simples y apilables)


– Gráfico de áreas
– Diagrama de sectores

Joel Patiño De Los Santos


PRESENTACIÓN DE DATOS
Las representaciones de las distribuciones de
frecuencias

• DIAGRAMA DE BARRAS

• Interesa comparar las categorías de una variable


• Tipo de variables; cualitativas o cuantitativas discretas.
• Compara datos en % o en frecuencias para cada una de las
categorías.

Joel Patiño De Los Santos


PRESENTACIÓN DE DATOS

Diagrama de barras. Variable cualitativa

60 60

50
40
40

30
sexo
20

10

0
Hombres Mujeres

Joel Patiño De Los Santos


PRESENTACIÓN DE DATOS

Diagrama de barras. Variable cuantitativa


discreta

40 40

35
30
25 25

20 20

15
10 10

5 3
2
0 Num de hijos en hogar

Uno dos tres cuatro cinco seis

Joel Patiño De Los Santos


PRESENTACIÓN DE DATOS

Joel Patiño De Los Santos


PRESENTACIÓN DE DATOS

Diagrama de barras. Barras apiladas. Variable


cuantitativa discreta en dos poblaciones

100% 3
2 0
5
90% 10 10
80%
70% s e is

40 45
cinco
60% cuatro
Tre s
50% Dos

40% Uno

30% 25 15
20%
10% 20 25
0%
Andalucia Galicia

Joel Patiño De Los Santos


PRESENTACIÓN DE DATOS
Las representaciones de las distribuciones de
frecuencias

• GRAFICO DE AREAS

• Interesa comparar dos categorías o dos


poblaciones (o más) sobre una variable
cuantitativa continua.
• Muy empleado en análisis de series
temporales.

Joel Patiño De Los Santos


PRESENTACIÓN DE DATOS
• Gráfico de Áreas. Variable cuantitativa continua. Comparación de
tres categorías de la variable “situación laboral” en cuanto a los
ingresos
100% 5
desconocido

15 ocupados
90% 18
25 parados

80%

70%

60% 30
52
65 85
50%

40%

30%

20% 45
30
10% 20
10
0%
2000 3000 4000 5000

Joel Patiño De Los Santos


PRESENTACIÓN DE DATOS
Las representaciones de las distribuciones de frecuencias

• DIAGRAMA DE PASTEL O CIRCULAR

• Para comparar pocas categorías de una variable cualitativa o


cuantitativa discreta.

Joel Patiño De Los Santos


PRESENTACIÓN DE DATOS
• DIAGRAMA DE PASTEL. Variable CUALITATIVA. Comparación
de sexo en una muestra

30

70

Hombres mujeres

Joel Patiño De Los Santos


PRESENTACIÓN DE DATOS
Las representaciones de las distribuciones de
frecuencias

• GRAFICOS PARA EL ANÁLISIS Y LA


COMPARACIÓN DE DISTRIBUCIONES

– Histogramas
– Polígonos de frecuencias
– Diagrama de CAJAS

Joel Patiño De Los Santos


PRESENTACIÓN DE DATOS
Las representaciones de las distribuciones de frecuencias

• HISTOGRAMA
El histograma está definido como aquel conjunto de barras o
rectángulos unidos uno de otro, en razón de que lo utilizamos
para representar variables continúas.

• Adecuadas para variables de intervalo, cuantitativas de tipo


contínuo.
• Los distintos intervalos se ordenan de menor a mayor y de
izquierda a derecha.(convención que no siempre se aplica)
• A diferencia del diagrama de barras, el histograma
representa superficies.

Joel Patiño De Los Santos


PRESENTACIÓN DE DATOS

HISTOGRAMA. Variable cuantitativa contínua y de intervalo


Datos sin agrupar

Joel Patiño De Los Santos


PRESENTACIÓN DE DATOS

HISTOGRAMA. Variable cuantitativa contínua y de intervalo


Datos agrupados/intervalos iguales

Joel Patiño De Los Santos


PRESENTACIÓN DE DATOS
Las representaciones de las distribuciones de
frecuencias

• POLÍGONO DE FRECUENCIA

• Adecuadas para variables de intervalo, cuantitativas


de tipo contínuo
• Son una alternativa a los histogramas
• La línea que cruza en cada categoría representa la
marca de clase

Joel Patiño De Los Santos


PRESENTACIÓN DE DATOS

Polígono de frecuencias. Variable cuantitativa continua y de intervalo


Polígono de frecuencias simple construido encima de histograma

Joel Patiño De Los Santos


PRESENTACIÓN DE DATOS
Polígono de frecuencias. Variable cuantitativa continua y de intervalo
Polígono de frecuencias dos distribuciones

140
120
100
80 Hombres
60 Mujeres

40
20
0
21-30 31-40 41-50 51-60

Joel Patiño De Los Santos

También podría gustarte