Estadistica 4,5 y 6

Descargar como docx, pdf o txt
Descargar como docx, pdf o txt
Está en la página 1de 18

DEFINICION: Las distribuciones de frecuencias son tablas en que

se dispone las modalidades de la variable por filas. En las


columnas se dispone el número de ocurrencias por cada valor,
porcentajes, etc. La finalidad de las agrupaciones en frecuencias
es facilitar la obtención de la información que contienen los datos.

Ejemplo: Quieren conocer si un grupo de individuos está a favor o


en contra de la exhibición de imágenes violentas por televisión,
para lo cual han recogido los siguientes datos:

La inspección de los datos originales no permite responder


fácilmente a cuestiones como cuál es la actitud mayoritaria del
grupo, y resulta bastante más difícil determinar la magnitud de la
diferencia de actitud entre hombres y mujeres.

Podemos hacernos mejor idea si disponemos en una tabla los


valores de la variable acompañados del número de veces (la
frecuencia) que aparece cada valor:

X: Símbolo genérico de la variable.

f: Frecuencia (también se simboliza como ni).


La distribución de frecuencias de los datos del ejemplo
muestra que la actitud mayoritaria de los individuos del
grupo estudiado es indiferente.
La interpretación de los datos ha sido facilitada porque se ha
reducido el número de números a examinar (en vez de los 20 datos
originales, la tabla contiene 5 valores de la variable y 5
frecuencias).

Generalmente las tablas incluyen varías columnas con las


frecuencias relativas (son el número de ocurrencias dividido por el
total de datos, y se simbolizan "fr" o "pi"), frecuencias acumuladas
(la frecuencia acumulada es el total de frecuencias de los valores
iguales o inferiores al de referencia, y se simbolizan "fa" o "na". No
obstante la frecuencia acumulada también es definida incluyendo
al valor de referencia), frecuencias acumuladas relativas (la
frecuencia acumulada relativa es el total de frecuencias relativas
de los valores iguales o inferiores al de referencia, y se simbolizan
"fr" o "pa")

La reducción de datos mediante el agrupamiento en frecuencias


no facilita su interpretación: La tabla es demasiado grande. Para
reducir el tamaño de la tabla agrupamos los valores en intervalos,
y las frecuencias son las de los conjuntos de valores incluidos en
los intervalos
PASOS DE CONSTRUCCION: Por lo general una tabla de
frecuencias con datos agrupados se realiza cuando la cantidad de
datos es grande y/o la variable es continua.

Básicamente consiste en agrupar los datos en intervalos de una


misma amplitud, denominados clases. A cada clase se le asignan
valores de cada tipo de frecuencias. Vamos directo al punto con
un ejemplo:

Consultamos a 50 personas sobre cuál era su edad y obtuvimos los


siguientes resultados:

38 – 15 – 10 – 12 – 62 – 46 – 25 – 56 – 27 – 24 – 23 – 21 – 20 – 25 – 38
– 27 – 48 – 35 – 50 – 65 – 59 – 58 – 47 – 42 – 37 – 35 – 32 – 40 – 28 –
14 – 12 – 24 – 66 – 73 – 72 – 70 – 68 – 65 – 54 – 48 – 34 – 33 – 21 – 19
– 61 – 59 – 47 – 46 – 30 – 30

Paso 1: Identificar el valor máximo y mínimo

38 – 15 – 10 – 12 – 62 – 46 – 25 – 56 – 27 – 24 – 23 – 21 – 20 – 25 – 38
– 27 – 48 – 35 – 50 – 65 – 59 – 58 – 47 – 42 – 37 – 35 – 32 – 40 – 28 –
14 – 12 – 24 – 66 – 73 – 72 – 70 – 68 – 65 – 54 – 48 – 34 – 33 – 21 – 19
– 61 – 59 – 47 – 46 – 30 – 30

Paso 2: Calcular el Rango

Obtener el rango de edades en que se encuentran los


encuestados, sólo basta con determinar la diferencia que hay
entre el más joven y el más adulto:
Paso 3: Calcular la cantidad de Intervalos

A los intervalos también se les conoce como clases. Simplemente


son las “categorías” en las cuales vamos a encasillar a nuestros
encuestados.

Hay varias formas de calcular cuántos intervalos debemos utilizar.


Vamos a analizar un par:

La segunda forma se conoce como Regla de Sturges, y el


resultado obtenido lo debes aproximar por ARRIBA, es decir, al
entero siguiente (por ejemplo, si te da 5.1 lo debes aproximar a 6 y
no a 5). Para nuestro ejemplo:

Por ambas formas obtuvimos que debemos utilizar 7 intervalos.

Paso 4: Calcular la Amplitud de los Intervalos

Ya sabemos el Rango de edad en la que se mueven nuestros


encuestados…. y sabemos entre cuántos intervalos hay que
REPARTIR las categorías… Así se calcula la amplitud:

Paso 5: Construcción de los intervalos

El primer intervalo viene con límite inferior igual al valor mínimo


de los datos, en este caso 10 años. Súmale el valor de la amplitud,
es decir, 9 años, y obtendrás el límite superior de 19 años. Eso nos
daría el primer intervalo:

Paso 6: Cálculo de la Marca de Clase de cada intervalo


La marca de clase simplemente es el punto medio que hay en cada
intervalo.

Lo que debes hacer es sumar límite inferior y superior de cada


intervalo y dividir el resultado entre 2. Así:

Paso 7: Determinar la Frecuencia Absoluta de cada intervalo

La frecuencia absoluta sólo consiste en CONTAR la cantidad de


datos que caen en cada intervalo. Se representa con la f
minúscula y un subíndice (número chiquito abajo) que indica el
intervalo en el cual está ubicada la frecuencia absoluta (fi).

Veamos cuántos datos caen en el primer intervalo de [10 – 19)

Paso 8: Determinar la Frecuencia Absoluta Acumulada de cada


intervalo. No te compliques, ACUMULAR es SUMAR todo lo que
llevo hasta el momento. La Frecuencia Absoluta Acumulada (Fi) de
cada intervalo consiste en sumar todas las frecuencias absolutas
de los intervalos anteriores y el actual. Para diferenciar su símbolo
de la frecuencia absoluta, simplemente utiliza la F mayúscula.

La primera frecuencia absoluta acumulada es la misma primera


frecuencia absoluta porque recién estamos empezando… no hay
nada que acumular todavía.

La segunda frecuencia absoluta acumulada vale 16 porque


debemos sumar 5+11 porque son las frecuencias absolutas que
llevamos hasta ahora para ACUMULAR.

Paso 9: Determinar la Frecuencia Relativa de cada intervalo

La palabra RELATIVA nos indica que vamos a RELACIONAR cada


Frecuencia Absoluta con su Total… y en matemáticas cuando te
dicen relacionar algo con algo… es DIVIDIR ese algo con ese algo.
Un pequeño ejemplo con dinero (eso hace más llamativas las
cosas… ¿no?) Todos en mi familia aportan plata para el mercado
mensual… entre todos aportamos un TOTAL de 200 dólares. De
esos 200, yo sólo aporto 20 dólares.

Vamos a obtener la RELACIÓN de MI APORTE respecto al TOTAL.


Fácil, 20 ÷ 200 = 0.1

Si lo convierto a porcentaje… 0.1 x 100% = 10%

Entonces MI APORTE RELATIVO es del 10% del TOTAL.

Espero que hayas entendido a qué se refiere la palabra RELATIVO.

La Frecuencia Relativa (fr) de cada intervalo consiste en dividir la


Frecuencia Absoluta de ese mismo intervalo entre el Total de
datos.

Paso 10: Determinar la Frecuencia Relativa Acumulada de cada


intervalo. Vuelve y juega lo acumulado… no te compliques,
ACUMULAR es SUMAR todo lo que llevo hasta el momento.

La Frecuencia Relativa Acumulada (Fr) de cada intervalo consiste


en sumar todas las frecuencias relativas de los intervalos
anteriores y el actual. Para diferenciar su símbolo de la frecuencia
relativa, simplemente utiliza la F mayúscula. La primer frecuencia
relativa acumulada es la misma primer frecuencia relativa porque
recién estamos empezando… no hay nada que acumular todavía.
La segunda frecuencia relativa acumulada vale 0.32 porque
debemos sumar 0.1+0.22 porque son las frecuencias relativas que
llevamos hasta ahora para ACUMULAR.

EJEMPLOS DE APLICACIÓN: La reducción de datos mediante el


agrupamiento en frecuencias no facilita su interpretación: La tabla
es demasiado grande. Para reducir el tamaño de la tabla
agrupamos los valores en intervalos, y las frecuencias son las de
los conjuntos de valores incluidos en los intervalos:
METODOS GRAFICOS:

HISTOGRAMA: Un histograma es similar en apariencia a un


diagrama de barras, pero en lugar de comparar categorías o
buscar tendencias a lo largo del tiempo, cada barra representa
cómo se distribuyen los datos en una única categoría. Cada barra
representa un rango continuo de datos o el número de frecuencias
de un punto de datos específico. Los histogramas son útiles para
mostrar la distribución de una única variable de escala. Los datos
se agrupan y se resumen utilizan un estadístico de porcentaje o
recuento. Una variante del histograma es el polígono de
frecuencias, que es similar a un histograma normal, pero con la
diferencia de que se utiliza el elemento gráfico de área en vez del
elemento gráfico de barra.

Otra variante del histograma es la pirámide de población, llamada


así a consecuencia de su uso más habitual: resumir datos de
población. Cuando se utiliza con datos de población, se divide por
género para proporcionar dos histogramas horizontales de los
datos de edad situados uno a la espalda del otro. En los países en
los que la población es joven, la forma del gráfico resultante
recuerda a una pirámide.

Creación de un gráfico de histograma

1. En la sección Tipos de gráfico del Generador de gráficos,


pulse el icono Histograma.

El lienzo se actualiza para mostrar una plantilla de gráfico de


histograma.

2. Seleccione una variable de escala como la variable Eje X

Características adicionales

Eje X: Lista variables de conjunto de datos que están disponibles


para el eje x del gráfico.
Dividir por: Seleccione una variable categórica que crea una tabla
de gráficos, con una casilla para cada categoría en la variable
Dividir por. Al igual que la agrupación, las variables Dividir por
añaden básicamente más dimensiones al gráfico mostrando
información para cada categoría de variable.

Mostrar curva de kde: Cuando está habilitado, la curva de


estimación de densidad de kernel se muestra en el gráfico.

Mostrar curva de distribución: Cuando está habilitado, la curva de


ajuste de distribución se muestra en el gráfico.

Distribución: La lista desplegable proporciona las siguientes


opciones de distribución.

Ajuste automático de la distribución: Esté es el valor


predeterminado. Beta

Devuelve el valor de una distribución Beta con los parámetros de


forma especificados.

Exponencial: Establece el valor de una distribución exponencial.

Gamma: Devuelve el valor de la distribución Gamma, con los


parámetros de forma y escala especificados.

Log-normal: Devuelve el valor aleatorio de una distribución log-


normal con los parámetros especificados.

Normal: Devuelve el valor de una distribución normal con la media


y desviación estándar especificadas.

Triangular: Devuelve el valor de una distribución triangular con


parámetros especificados.

Uniforme: Devuelve el valor de la distribución uniforme entre mín.


y máx.

Weibull: Devuelve el valor de una distribución de Weibull con los


parámetros especificados.
Ancho de agrupación: El control deslizante controla el tamaño del
intervalo que se utiliza para dividir los datos en grupos.

Título principal: Título del gráfico.

Subtítulo: Subtítulo del gráfico, que se muestra directamente


debajo del título del gráfico.

POLIGONO: Un polígono de frecuencias es un gráfico usado en


estadística para mostrar la frecuencia con la que cambia una
variable o categoría.

Para crear uno necesitas un histograma de datos. Si aún no sabes


de qué se trata, te invitamos a visitar la página anterior para que
conozcas el ejemplo que seguiremos trabajando aquí.
OJIVA: En estadística, la ojiva es la gráfica acumulativa de una
serie de datos. Es decir, la ojiva es un gráfico que muestra la
frecuencia acumulada asociada a un conjunto de datos. Por lo
tanto, la ojiva sirve para saber el número de datos que se
encuentran por debajo de un valor determinado.

Vista la definición de ojiva en estadística, vamos a ver cómo se


hace este tipo de diagrama.

Calcular las frecuencias absolutas acumuladas del conjunto de


datos.

Representar el eje horizontal y el eje vertical del gráfico. En


general, el eje horizontal corresponde a los límites de los
intervalos y el eje vertical a las frecuencias acumuladas.

Representar las frecuencias absolutas acumuladas como puntos


en la gráfica.

Unir los puntos consecutivos del gráfico mediante una línea para
formar la ojiva.
Características de la ojiva

En estadística, la ojiva cumple con las siguientes propiedades:

En caso de que la ojiva represente las frecuencias absolutas


acumuladas, el punto final siempre será el número total de datos.

Pero si se trata de una ojiva porcentual, el punto final siempre


será 1.

En las ojivas solo se pueden representar variables cuantitativas,


este tipo de diagrama estadístico no es útil para variables
cualitativas.

La ojiva permite averiguar visualmente el número de datos que se


encuentran por debajo de un valor determinado.

DIAGRAMA DE CAJA: Un diagrama de caja no es nada más que un


histograma visto por encima y, de la misma forma, un histograma
es un diagrama de caja visto desde un lado. A continuación, se
puede ver un ejemplo. La primera característica que comparten
ambos gráficos es el mínimo y el máximo del conjunto de datos.
Las barras del extremo después de los guiones indican el mínimo
(barra inferior) y el máximo (barra superior). Los datos atípicos
estarían representados fuera del intervalo del máximo y el mínimo.
Es decir, más allá de las barras después de los guiones. También
podemos encontrar diagramas de caja horizontales. A simple vista
se puede ver que la mayoría de los datos se centra en las
observaciones cerca del mínimo en ambos gráficos. Esto está
indicado por el diagrama de caja en que la caja está más cerca del
mínimo que del máximo. Si miramos al histograma, veremos que
las observaciones con más frecuencia son las observaciones que
se sitúan cerca del mínimo y lejos del máximo.

Diagrama de caja

La parte inferior de la caja es el primer cuartil (Q1).

La barra del medio de la caja es la mediana o segundo cuartil (Q2).

La parte superior de la caja es el tercer cuartil (Q3).

El rango intercuartílico o RIC sería la altura de la caja, es decir, la


diferencia entre Q3 y Q1.

DIAGRAMA DE TALLO Y HOJA: El diagrama "tallo y hojas" (Stem-


and-Leaf Diagram) permite obtener simultáneamente una
distribución de frecuencias de la variable y su representación
gráfica. Para construirlo basta separar en cada dato el último
dígito de la derecha (que constituye la hoja) del bloque de cifras
restantes (que formará el tallo). Esta representación de los datos
es semejante a la de un histograma, pero además de ser fáciles de
elaborar, presentan más información que estos.

MEDIDAAS DE TENDENCIA CENTRAL

La mayor parte de las series de datos muestran una clara


tendencia a agruparse alrededor de un cierto punto central. Así
pues, dada cualquier serie de datos particular, por lo general es
posible seleccionar algún valor o promedio típico para describir
toda la serie de datos. Este valor descriptivo típico es una
medición de tendencia central o de ubicación.

Cinco tipos de promedios a menudo usados como mediciones de


tendencia central. Estos son la media aritmética, la mediana, la
moda, el rango medio el eje medio.

La media aritmética: La media aritmética es el promedio o


medición de tendencia central de uso más común. Se calcula
sumando todas las observaciones de una serie de datos y luego
dividiendo el total entre el número de elementos involucrados.
Donde N es el número de datos

Un ejemplo:

Calcular la media de 2, 4, 6, 7, 9

N= 5 (el número de datos)

Aplico la fórmula y queda la sumatoria de 2, 4, 6, 7 y 9, siendo


igual a 28, dividido por la cantidad de datos, es decir, dividido por
5. La media, entonces, es igual a 5,6.

MEDIANA: La mediana es el valor medio de una secuencia


ordenada de datos. Si no hay empates, la mitad de las
observaciones serán menores y la otra mitad serán mayores. La
mediana no se ve afectada por ninguna observación extrema de
una serie de datos. Por tanto, siempre que esté presente una
observación extrema es apropiada usar la mediana en vez de la
media para describir una serie de datos.

Para encontrar el lugar de la clasificación ordenada que


corresponde al valor de la mediana, se sigue una de las dos reglas:
Si el tamaño de la muestra es un número impar, la mediana se
representa mediante el valor numérico correspondiente al punto
de posicionamiento, la observación ordenada es (n+1)/2. Si el
tamaño de la muestra es un número par entonces el punto de
posicionamiento cae entre las dos observaciones medias de la
clasificación ordenada. La mediana es el promedio de los valores
numéricos correspondientes a estas dos observaciones medias.

MODA: La moda o modo es el valor de una serie de datos que


aparece con más frecuencia. Se obtiene fácilmente de una
clasificación ordenada. A diferencia de la media aritmética, la
moda no se ve afectada por la ocurrencia de los valores extremos.

Ejemplo: Los valores siguientes son las calificaciones de un


alumno durante todo el año

7; 8; 9; 7; 9; 8; 8; 8; 7; 8

Podemos afirmar entonces que el modo es igual a 8, dado que es


el valor que aparece con más frecuencia.

El rango medio: El rango medio es el promedio de las


observaciones menores y mayores de una serie de datos.

El rango medio a menudo es usado como una medición de resumen


tanto por analistas financieros como por reporteros
meteorológicos, puesto que puede proporcionar una medición
adecuada, rápida y simple para caracterizar toda una serie de
datos, como por ejemplo toda una serie de lecturas registradas de
temperatura por horas durante todo un día.

El eje medio. Como última medida de tendencia central,


mencionamos al eje medio, que es el promedio del primer y tercer
cuartil de una serie de datos. Es decir:

Eje medio: (Q1 + Q2) / 2

Siendo Q1 y Q2, el primer y segundo cuartil. En conclusión,


podemos decir que es una medición de resumen usada para zanjar
problemas potenciales introducidos por los valores extremos de
los datos.
https://www.uv.es/webgid/Descriptiva/
3_distribucin_de_frecuencias.html

https://lasmatesfaciles.com/2021/05/07/distribucion-de-frecuencias-
para-datos-agrupados/

https://www.ibm.com/docs/es/spss-statistics/beta?topic=types-
histogram-charts

https://www.probabilidadyestadistica.net/ojiva-estadistica/

https://economipedia.com/definiciones/diagrama-de-caja.html

https://aprendiendoadministracion.com/medidas-de-tendencia-
central-media-mediana-moda-rango-y-eje-medio/#google_vignette

También podría gustarte