Estadistica 4,5 y 6

DEFINICION: Las distribuciones de frecuencias son tablas en que
se dispone las modalidades de la variable por filas. En las

columnas se dispone el número de ocurrencias por cada valor,
porcentajes, etc. La finalidad de las agrupaciones en frecuencias
es facilitar la obtención de la información que contienen los datos.
Ejemplo: Quieren conocer si un grupo de individuos está a favor o

en contra de la exhibición de imágenes violentas por televisión,
para lo cual han recogido los siguientes datos:
La inspección de los datos originales no permite responder

fácilmente a cuestiones como cuál es la actitud mayoritaria del
grupo, y resulta bastante más difícil determinar la magnitud de la
diferencia de actitud entre hombres y mujeres.
Podemos hacernos mejor idea si disponemos en una tabla los

valores de la variable acompañados del número de veces (la
frecuencia) que aparece cada valor:
X: Símbolo genérico de la variable.
f: Frecuencia (también se simboliza como ni).

La distribución de frecuencias de los datos del ejemplo
muestra que la actitud mayoritaria de los individuos del
grupo estudiado es indiferente.
La interpretación de los datos ha sido facilitada porque se ha
reducido el número de números a examinar (en vez de los 20 datos
originales, la tabla contiene 5 valores de la variable y 5
frecuencias).
Generalmente las tablas incluyen varías columnas con las

frecuencias relativas (son el número de ocurrencias dividido por el
total de datos, y se simbolizan "fr" o "pi"), frecuencias acumuladas
(la frecuencia acumulada es el total de frecuencias de los valores
iguales o inferiores al de referencia, y se simbolizan "fa" o "na". No
obstante la frecuencia acumulada también es definida incluyendo
al valor de referencia), frecuencias acumuladas relativas (la
frecuencia acumulada relativa es el total de frecuencias relativas
de los valores iguales o inferiores al de referencia, y se simbolizan
"fr" o "pa")
La reducción de datos mediante el agrupamiento en frecuencias

no facilita su interpretación: La tabla es demasiado grande. Para
reducir el tamaño de la tabla agrupamos los valores en intervalos,
y las frecuencias son las de los conjuntos de valores incluidos en
los intervalos
PASOS DE CONSTRUCCION: Por lo general una tabla de
frecuencias con datos agrupados se realiza cuando la cantidad de
datos es grande y/o la variable es continua.
Básicamente consiste en agrupar los datos en intervalos de una

misma amplitud, denominados clases. A cada clase se le asignan
valores de cada tipo de frecuencias. Vamos directo al punto con
un ejemplo:
Consultamos a 50 personas sobre cuál era su edad y obtuvimos los

siguientes resultados:
38 – 15 – 10 – 12 – 62 – 46 – 25 – 56 – 27 – 24 – 23 – 21 – 20 – 25 – 38
– 27 – 48 – 35 – 50 – 65 – 59 – 58 – 47 – 42 – 37 – 35 – 32 – 40 – 28 –
14 – 12 – 24 – 66 – 73 – 72 – 70 – 68 – 65 – 54 – 48 – 34 – 33 – 21 – 19
– 61 – 59 – 47 – 46 – 30 – 30
Paso 1: Identificar el valor máximo y mínimo
38 – 15 – 10 – 12 – 62 – 46 – 25 – 56 – 27 – 24 – 23 – 21 – 20 – 25 – 38
– 27 – 48 – 35 – 50 – 65 – 59 – 58 – 47 – 42 – 37 – 35 – 32 – 40 – 28 –
14 – 12 – 24 – 66 – 73 – 72 – 70 – 68 – 65 – 54 – 48 – 34 – 33 – 21 – 19
– 61 – 59 – 47 – 46 – 30 – 30
Paso 2: Calcular el Rango
Obtener el rango de edades en que se encuentran los

encuestados, sólo basta con determinar la diferencia que hay
entre el más joven y el más adulto:
Paso 3: Calcular la cantidad de Intervalos
A los intervalos también se les conoce como clases. Simplemente

son las “categorías” en las cuales vamos a encasillar a nuestros
encuestados.
Hay varias formas de calcular cuántos intervalos debemos utilizar.

Vamos a analizar un par:
La segunda forma se conoce como Regla de Sturges, y el

resultado obtenido lo debes aproximar por ARRIBA, es decir, al
entero siguiente (por ejemplo, si te da 5.1 lo debes aproximar a 6 y
no a 5). Para nuestro ejemplo:
Por ambas formas obtuvimos que debemos utilizar 7 intervalos.
Paso 4: Calcular la Amplitud de los Intervalos
Ya sabemos el Rango de edad en la que se mueven nuestros

encuestados…. y sabemos entre cuántos intervalos hay que
REPARTIR las categorías… Así se calcula la amplitud:
Paso 5: Construcción de los intervalos
El primer intervalo viene con límite inferior igual al valor mínimo

de los datos, en este caso 10 años. Súmale el valor de la amplitud,
es decir, 9 años, y obtendrás el límite superior de 19 años. Eso nos
daría el primer intervalo:
Paso 6: Cálculo de la Marca de Clase de cada intervalo

La marca de clase simplemente es el punto medio que hay en cada
intervalo.
Lo que debes hacer es sumar límite inferior y superior de cada

intervalo y dividir el resultado entre 2. Así:
Paso 7: Determinar la Frecuencia Absoluta de cada intervalo
La frecuencia absoluta sólo consiste en CONTAR la cantidad de

datos que caen en cada intervalo. Se representa con la f
minúscula y un subíndice (número chiquito abajo) que indica el
intervalo en el cual está ubicada la frecuencia absoluta (fi).
Veamos cuántos datos caen en el primer intervalo de [10 – 19)
Paso 8: Determinar la Frecuencia Absoluta Acumulada de cada

intervalo. No te compliques, ACUMULAR es SUMAR todo lo que
llevo hasta el momento. La Frecuencia Absoluta Acumulada (Fi) de
cada intervalo consiste en sumar todas las frecuencias absolutas
de los intervalos anteriores y el actual. Para diferenciar su símbolo
de la frecuencia absoluta, simplemente utiliza la F mayúscula.
La primera frecuencia absoluta acumulada es la misma primera

frecuencia absoluta porque recién estamos empezando… no hay
nada que acumular todavía.
La segunda frecuencia absoluta acumulada vale 16 porque

debemos sumar 5+11 porque son las frecuencias absolutas que
llevamos hasta ahora para ACUMULAR.
Paso 9: Determinar la Frecuencia Relativa de cada intervalo
La palabra RELATIVA nos indica que vamos a RELACIONAR cada

Frecuencia Absoluta con su Total… y en matemáticas cuando te
dicen relacionar algo con algo… es DIVIDIR ese algo con ese algo.
Un pequeño ejemplo con dinero (eso hace más llamativas las
cosas… ¿no?) Todos en mi familia aportan plata para el mercado
mensual… entre todos aportamos un TOTAL de 200 dólares. De
esos 200, yo sólo aporto 20 dólares.
Vamos a obtener la RELACIÓN de MI APORTE respecto al TOTAL.

Fácil, 20 ÷ 200 = 0.1
Si lo convierto a porcentaje… 0.1 x 100% = 10%
Entonces MI APORTE RELATIVO es del 10% del TOTAL.
Espero que hayas entendido a qué se refiere la palabra RELATIVO.
La Frecuencia Relativa (fr) de cada intervalo consiste en dividir la

Frecuencia Absoluta de ese mismo intervalo entre el Total de
datos.
Paso 10: Determinar la Frecuencia Relativa Acumulada de cada

intervalo. Vuelve y juega lo acumulado… no te compliques,
ACUMULAR es SUMAR todo lo que llevo hasta el momento.
La Frecuencia Relativa Acumulada (Fr) de cada intervalo consiste

en sumar todas las frecuencias relativas de los intervalos
anteriores y el actual. Para diferenciar su símbolo de la frecuencia
relativa, simplemente utiliza la F mayúscula. La primer frecuencia
relativa acumulada es la misma primer frecuencia relativa porque
recién estamos empezando… no hay nada que acumular todavía.
La segunda frecuencia relativa acumulada vale 0.32 porque
debemos sumar 0.1+0.22 porque son las frecuencias relativas que
llevamos hasta ahora para ACUMULAR.
EJEMPLOS DE APLICACIÓN: La reducción de datos mediante el

agrupamiento en frecuencias no facilita su interpretación: La tabla
es demasiado grande. Para reducir el tamaño de la tabla
agrupamos los valores en intervalos, y las frecuencias son las de
los conjuntos de valores incluidos en los intervalos:
METODOS GRAFICOS:
HISTOGRAMA: Un histograma es similar en apariencia a un

diagrama de barras, pero en lugar de comparar categorías o
buscar tendencias a lo largo del tiempo, cada barra representa
cómo se distribuyen los datos en una única categoría. Cada barra
representa un rango continuo de datos o el número de frecuencias
de un punto de datos específico. Los histogramas son útiles para
mostrar la distribución de una única variable de escala. Los datos
se agrupan y se resumen utilizan un estadístico de porcentaje o
recuento. Una variante del histograma es el polígono de
frecuencias, que es similar a un histograma normal, pero con la
diferencia de que se utiliza el elemento gráfico de área en vez del
elemento gráfico de barra.
Otra variante del histograma es la pirámide de población, llamada

así a consecuencia de su uso más habitual: resumir datos de
población. Cuando se utiliza con datos de población, se divide por
género para proporcionar dos histogramas horizontales de los
datos de edad situados uno a la espalda del otro. En los países en
los que la población es joven, la forma del gráfico resultante
recuerda a una pirámide.
Creación de un gráfico de histograma
1. En la sección Tipos de gráfico del Generador de gráficos,

pulse el icono Histograma.
El lienzo se actualiza para mostrar una plantilla de gráfico de

histograma.
2. Seleccione una variable de escala como la variable Eje X
Características adicionales
Eje X: Lista variables de conjunto de datos que están disponibles

para el eje x del gráfico.
Dividir por: Seleccione una variable categórica que crea una tabla
de gráficos, con una casilla para cada categoría en la variable
Dividir por. Al igual que la agrupación, las variables Dividir por
añaden básicamente más dimensiones al gráfico mostrando
información para cada categoría de variable.
Mostrar curva de kde: Cuando está habilitado, la curva de

estimación de densidad de kernel se muestra en el gráfico.
Mostrar curva de distribución: Cuando está habilitado, la curva de

ajuste de distribución se muestra en el gráfico.
Distribución: La lista desplegable proporciona las siguientes

opciones de distribución.
Ajuste automático de la distribución: Esté es el valor

predeterminado. Beta
Devuelve el valor de una distribución Beta con los parámetros de

forma especificados.
Exponencial: Establece el valor de una distribución exponencial.
Gamma: Devuelve el valor de la distribución Gamma, con los

parámetros de forma y escala especificados.
Log-normal: Devuelve el valor aleatorio de una distribución log-

normal con los parámetros especificados.
Normal: Devuelve el valor de una distribución normal con la media

y desviación estándar especificadas.
Triangular: Devuelve el valor de una distribución triangular con

parámetros especificados.
Uniforme: Devuelve el valor de la distribución uniforme entre mín.

y máx.
Weibull: Devuelve el valor de una distribución de Weibull con los

parámetros especificados.
Ancho de agrupación: El control deslizante controla el tamaño del
intervalo que se utiliza para dividir los datos en grupos.
Título principal: Título del gráfico.
Subtítulo: Subtítulo del gráfico, que se muestra directamente

debajo del título del gráfico.
POLIGONO: Un polígono de frecuencias es un gráfico usado en

estadística para mostrar la frecuencia con la que cambia una
variable o categoría.
Para crear uno necesitas un histograma de datos. Si aún no sabes

de qué se trata, te invitamos a visitar la página anterior para que
conozcas el ejemplo que seguiremos trabajando aquí.
OJIVA: En estadística, la ojiva es la gráfica acumulativa de una
serie de datos. Es decir, la ojiva es un gráfico que muestra la
frecuencia acumulada asociada a un conjunto de datos. Por lo
tanto, la ojiva sirve para saber el número de datos que se
encuentran por debajo de un valor determinado.
Vista la definición de ojiva en estadística, vamos a ver cómo se

hace este tipo de diagrama.
Calcular las frecuencias absolutas acumuladas del conjunto de

datos.
Representar el eje horizontal y el eje vertical del gráfico. En

general, el eje horizontal corresponde a los límites de los
intervalos y el eje vertical a las frecuencias acumuladas.
Representar las frecuencias absolutas acumuladas como puntos

en la gráfica.
Unir los puntos consecutivos del gráfico mediante una línea para
formar la ojiva.
Características de la ojiva
En estadística, la ojiva cumple con las siguientes propiedades:
En caso de que la ojiva represente las frecuencias absolutas

acumuladas, el punto final siempre será el número total de datos.
Pero si se trata de una ojiva porcentual, el punto final siempre

será 1.
En las ojivas solo se pueden representar variables cuantitativas,

este tipo de diagrama estadístico no es útil para variables
cualitativas.
La ojiva permite averiguar visualmente el número de datos que se

encuentran por debajo de un valor determinado.
DIAGRAMA DE CAJA: Un diagrama de caja no es nada más que un

histograma visto por encima y, de la misma forma, un histograma
es un diagrama de caja visto desde un lado. A continuación, se
puede ver un ejemplo. La primera característica que comparten
ambos gráficos es el mínimo y el máximo del conjunto de datos.
Las barras del extremo después de los guiones indican el mínimo
(barra inferior) y el máximo (barra superior). Los datos atípicos
estarían representados fuera del intervalo del máximo y el mínimo.
Es decir, más allá de las barras después de los guiones. También
podemos encontrar diagramas de caja horizontales. A simple vista
se puede ver que la mayoría de los datos se centra en las
observaciones cerca del mínimo en ambos gráficos. Esto está
indicado por el diagrama de caja en que la caja está más cerca del
mínimo que del máximo. Si miramos al histograma, veremos que
las observaciones con más frecuencia son las observaciones que
se sitúan cerca del mínimo y lejos del máximo.
Diagrama de caja
La parte inferior de la caja es el primer cuartil (Q1).
La barra del medio de la caja es la mediana o segundo cuartil (Q2).
La parte superior de la caja es el tercer cuartil (Q3).
El rango intercuartílico o RIC sería la altura de la caja, es decir, la

diferencia entre Q3 y Q1.
DIAGRAMA DE TALLO Y HOJA: El diagrama "tallo y hojas" (Stem-

and-Leaf Diagram) permite obtener simultáneamente una
distribución de frecuencias de la variable y su representación
gráfica. Para construirlo basta separar en cada dato el último
dígito de la derecha (que constituye la hoja) del bloque de cifras
restantes (que formará el tallo). Esta representación de los datos
es semejante a la de un histograma, pero además de ser fáciles de
elaborar, presentan más información que estos.
MEDIDAAS DE TENDENCIA CENTRAL
La mayor parte de las series de datos muestran una clara

tendencia a agruparse alrededor de un cierto punto central. Así
pues, dada cualquier serie de datos particular, por lo general es
posible seleccionar algún valor o promedio típico para describir
toda la serie de datos. Este valor descriptivo típico es una
medición de tendencia central o de ubicación.
Cinco tipos de promedios a menudo usados como mediciones de

tendencia central. Estos son la media aritmética, la mediana, la
moda, el rango medio el eje medio.
La media aritmética: La media aritmética es el promedio o

medición de tendencia central de uso más común. Se calcula
sumando todas las observaciones de una serie de datos y luego
dividiendo el total entre el número de elementos involucrados.
Donde N es el número de datos
Un ejemplo:
Calcular la media de 2, 4, 6, 7, 9
N= 5 (el número de datos)
Aplico la fórmula y queda la sumatoria de 2, 4, 6, 7 y 9, siendo

igual a 28, dividido por la cantidad de datos, es decir, dividido por
5. La media, entonces, es igual a 5,6.
MEDIANA: La mediana es el valor medio de una secuencia

ordenada de datos. Si no hay empates, la mitad de las
observaciones serán menores y la otra mitad serán mayores. La
mediana no se ve afectada por ninguna observación extrema de
una serie de datos. Por tanto, siempre que esté presente una
observación extrema es apropiada usar la mediana en vez de la
media para describir una serie de datos.
Para encontrar el lugar de la clasificación ordenada que

corresponde al valor de la mediana, se sigue una de las dos reglas:
Si el tamaño de la muestra es un número impar, la mediana se
representa mediante el valor numérico correspondiente al punto
de posicionamiento, la observación ordenada es (n+1)/2. Si el
tamaño de la muestra es un número par entonces el punto de
posicionamiento cae entre las dos observaciones medias de la
clasificación ordenada. La mediana es el promedio de los valores
numéricos correspondientes a estas dos observaciones medias.
MODA: La moda o modo es el valor de una serie de datos que

aparece con más frecuencia. Se obtiene fácilmente de una
clasificación ordenada. A diferencia de la media aritmética, la
moda no se ve afectada por la ocurrencia de los valores extremos.
Ejemplo: Los valores siguientes son las calificaciones de un

alumno durante todo el año
7; 8; 9; 7; 9; 8; 8; 8; 7; 8
Podemos afirmar entonces que el modo es igual a 8, dado que es

el valor que aparece con más frecuencia.
El rango medio: El rango medio es el promedio de las

observaciones menores y mayores de una serie de datos.
El rango medio a menudo es usado como una medición de resumen

tanto por analistas financieros como por reporteros
meteorológicos, puesto que puede proporcionar una medición
adecuada, rápida y simple para caracterizar toda una serie de
datos, como por ejemplo toda una serie de lecturas registradas de
temperatura por horas durante todo un día.
El eje medio. Como última medida de tendencia central,

mencionamos al eje medio, que es el promedio del primer y tercer
cuartil de una serie de datos. Es decir:
Eje medio: (Q1 + Q2) / 2
Siendo Q1 y Q2, el primer y segundo cuartil. En conclusión,

podemos decir que es una medición de resumen usada para zanjar
problemas potenciales introducidos por los valores extremos de
los datos.
https://www.uv.es/webgid/Descriptiva/
3_distribucin_de_frecuencias.html
https://lasmatesfaciles.com/2021/05/07/distribucion-de-frecuencias-
para-datos-agrupados/
https://www.ibm.com/docs/es/spss-statistics/beta?topic=types-
histogram-charts
https://www.probabilidadyestadistica.net/ojiva-estadistica/
https://economipedia.com/definiciones/diagrama-de-caja.html
https://aprendiendoadministracion.com/medidas-de-tendencia-
central-media-mediana-moda-rango-y-eje-medio/#google_vignette

Estadistica 4,5 y 6

Cargado por

Copyright:

Formatos disponibles

Estadistica 4,5 y 6

Cargado por

Información del documento

Descripción original:

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Estadistica 4,5 y 6

Cargado por

Copyright:

Formatos disponibles

DEFINICION: Las distribuciones de frecuencias son tablas en que

se dispone las modalidades de la variable por filas. En las

Ejemplo: Quieren conocer si un grupo de individuos está a favor o

La inspección de los datos originales no permite responder

Podemos hacernos mejor idea si disponemos en una tabla los

X: Símbolo genérico de la variable.

f: Frecuencia (también se simboliza como ni).

Generalmente las tablas incluyen varías columnas con las

La reducción de datos mediante el agrupamiento en frecuencias

Básicamente consiste en agrupar los datos en intervalos de una

Consultamos a 50 personas sobre cuál era su edad y obtuvimos los

Paso 1: Identificar el valor máximo y mínimo

Paso 2: Calcular el Rango

Obtener el rango de edades en que se encuentran los

A los intervalos también se les conoce como clases. Simplemente

Hay varias formas de calcular cuántos intervalos debemos utilizar.

La segunda forma se conoce como Regla de Sturges, y el

Por ambas formas obtuvimos que debemos utilizar 7 intervalos.

Paso 4: Calcular la Amplitud de los Intervalos

Ya sabemos el Rango de edad en la que se mueven nuestros

Paso 5: Construcción de los intervalos

El primer intervalo viene con límite inferior igual al valor mínimo

Paso 6: Cálculo de la Marca de Clase de cada intervalo

Lo que debes hacer es sumar límite inferior y superior de cada

Paso 7: Determinar la Frecuencia Absoluta de cada intervalo

La frecuencia absoluta sólo consiste en CONTAR la cantidad de

Veamos cuántos datos caen en el primer intervalo de [10 – 19)

Paso 8: Determinar la Frecuencia Absoluta Acumulada de cada

La primera frecuencia absoluta acumulada es la misma primera

La segunda frecuencia absoluta acumulada vale 16 porque

Paso 9: Determinar la Frecuencia Relativa de cada intervalo

La palabra RELATIVA nos indica que vamos a RELACIONAR cada

Vamos a obtener la RELACIÓN de MI APORTE respecto al TOTAL.

Si lo convierto a porcentaje… 0.1 x 100% = 10%

Entonces MI APORTE RELATIVO es del 10% del TOTAL.

Espero que hayas entendido a qué se refiere la palabra RELATIVO.

La Frecuencia Relativa (fr) de cada intervalo consiste en dividir la

Paso 10: Determinar la Frecuencia Relativa Acumulada de cada

La Frecuencia Relativa Acumulada (Fr) de cada intervalo consiste

EJEMPLOS DE APLICACIÓN: La reducción de datos mediante el

HISTOGRAMA: Un histograma es similar en apariencia a un

Otra variante del histograma es la pirámide de población, llamada

Creación de un gráfico de histograma

1. En la sección Tipos de gráfico del Generador de gráficos,

El lienzo se actualiza para mostrar una plantilla de gráfico de

2. Seleccione una variable de escala como la variable Eje X

Eje X: Lista variables de conjunto de datos que están disponibles

Mostrar curva de kde: Cuando está habilitado, la curva de

Mostrar curva de distribución: Cuando está habilitado, la curva de

Distribución: La lista desplegable proporciona las siguientes

Ajuste automático de la distribución: Esté es el valor

Devuelve el valor de una distribución Beta con los parámetros de

Exponencial: Establece el valor de una distribución exponencial.

Gamma: Devuelve el valor de la distribución Gamma, con los

Log-normal: Devuelve el valor aleatorio de una distribución log-

Normal: Devuelve el valor de una distribución normal con la media

Triangular: Devuelve el valor de una distribución triangular con

Uniforme: Devuelve el valor de la distribución uniforme entre mín.

Weibull: Devuelve el valor de una distribución de Weibull con los