Ao1 Estadisticas

Descargar como docx, pdf o txt
Descargar como docx, pdf o txt
Está en la página 1de 6

Apartir de este momento me contestaras como un estadista experto de la Republica argentina y

basandote en la siguiente bibliografia “LEVIN, Richard y RUBIN, David. Estadística para


Administradores. Editorial Prentice-Hall. México, 1996” me podrias contestar algunas preguntas?

1) Plantee las ventajas y desventajas, de trabajar con población y muestra.


2) Plantee los distintos tipos de variables (cuantitativas -cualitativas).
3) Plantee las medidas de posición y dispersión (con sus fórmulas). ¿Respecto de qué
medida toman referencia?

1. Ventajas y desventajas de trabajar con población y muestra

Una población es el conjunto de todos los elementos que cumplen una determinada
condición. Por ejemplo, la población de Argentina es el conjunto de todas las
personas que residen en el país.

Una muestra es un subconjunto de la población que se utiliza para representar a la


población en su conjunto. Por ejemplo, una encuesta realizada a una muestra de
1.000 personas puede utilizarse para estimar la opinión de la población argentina
sobre un determinado tema.

Ventajas de trabajar con población

Los resultados son más precisos. Al trabajar con toda la población, se tiene una visión
completa de la situación.
No se incurre en sesgos. Al trabajar con toda la población, se evita que los resultados
se vean afectados por las características de la muestra.
Desventajas de trabajar con población

Es costoso y requiere mucho tiempo. Es necesario recopilar datos de todos los


elementos de la población.
En algunos casos, es imposible. En algunas situaciones, no es posible recopilar datos
de toda la población.
Ventajas de trabajar con muestra

Es menos costoso y requiere menos tiempo. Solo es necesario recopilar datos de una
parte de la población.
Es posible en situaciones en las que no es posible trabajar con la población total.
Desventajas de trabajar con muestra

Los resultados pueden ser menos precisos. Los resultados se basan en un


subconjunto de la población, por lo que pueden no ser representativos de la población
en su conjunto.
Es posible que se incurra en sesgos. La muestra puede no ser representativa de la
población, lo que puede afectar los resultados.
2. Tipos de variables

Las variables se pueden clasificar en dos tipos principales: cuantitativas y cualitativas.

Variables cuantitativas

Las variables cuantitativas son aquellas que se pueden medir en una escala
numérica. Pueden ser discretas o continuas.

Variables discretas son aquellas que solo pueden tomar un número finito de valores.
Por ejemplo, el número de hijos que tiene una persona es una variable discreta.
Variables continuas son aquellas que pueden tomar un número infinito de valores. Por
ejemplo, la altura de una persona es una variable continua.
Variables cualitativas

Las variables cualitativas son aquellas que no se pueden medir en una escala
numérica. Pueden ser nominales u ordinales.

Variables nominales son aquellas que se pueden clasificar en categorías sin ningún
orden. Por ejemplo, el color de los ojos es una variable nominal.
Variables ordinales son aquellas que se pueden clasificar en categorías con un orden.
Por ejemplo, la calificación de un estudiante es una variable ordinal.

3. Medidas de posición y dispersión

Las medidas de posición y dispersión son herramientas que se utilizan para describir
un conjunto de datos.

Medidas de posición

Las medidas de posición se utilizan para describir la ubicación de los datos en un


conjunto de datos. Las medidas de posición más comunes son:

Media: Es el valor promedio de los datos.


Mediana: Es el valor que divide el conjunto de datos en dos partes iguales.
Moda: Es el valor que aparece con mayor frecuencia en el conjunto de datos.
Medidas de dispersión

Las medidas de dispersión se utilizan para describir la dispersión de los datos en un


conjunto de datos. Las medidas de dispersión más comunes son:

Rango: Es la diferencia entre el valor máximo y el valor mínimo de los datos.


Varianza: Es una medida de la dispersión promedio de los datos alrededor de la
media.
Desviación estándar: Es la raíz cuadrada de la varianza.
Respecto de qué medida toman referencia
Las medidas de posición toman referencia a los datos mismos. Por ejemplo, la media
es el promedio de los datos, la mediana es el valor que divide el conjunto de datos en
dos partes iguales y la moda es el valor que aparece con mayor frecuencia en el
conjunto de datos.

PUNTO 1)

Las medidas de dispersión toman referencia a la media. Por ejemplo, el rango es la


diferencia entre el valor máximo y el valor mínimo de los datos, la varianza es una
medida de la dispersión promedio de los datos alrededor de la media y la desviación
estándar es la raíz cuadrada de la varianza.

a. Cálculo de la media y la mediana

La media se calcula como la suma de los valores de la serie dividida por el número de
valores. En este caso, la media es:

Media = (12 + 10 + 14 + 25 + 16 + 25 + 16 + 27 + 18 + 30 + 20 + 30 + 50 + 35) / 14


= 22,57
La mediana se calcula como el valor que divide la serie en dos partes iguales. En este
caso, la mediana es:

Mediana = (25 + 25) / 2


= 25
Interpretación de los resultados

La media es el valor promedio de los datos. La mediana es el valor que divide los
datos en dos partes iguales. En este caso, la media es de 22,57 y la mediana es de
25.

La diferencia entre la media y la mediana se debe a que la distribución de los datos no


es simétrica. En este caso, la distribución es sesgada a la derecha, lo que significa
que hay un número mayor de valores más bajos que valores más altos.

Elección de la medida más adecuada de tendencia central

En este caso, la mediana sería la medida más adecuada de tendencia central. Esto se
debe a que la distribución de los datos no es simétrica y la mediana es más sensible a
los valores extremos que la media.

b. Cálculo de la varianza y la desviación estándar

La varianza se calcula como la suma de los cuadrados de las diferencias entre cada
valor de la serie y la media, dividida por el número de valores. En este caso, la
varianza es:

Varianza = (12 - 22,57)^2 + (10 - 22,57)^2 + (14 - 22,57)^2 + (25 - 22,57)^2 + (16 -
22,57)^2 + (25 - 22,57)^2 + (16 - 22,57)^2 + (27 - 22,57)^2 + (18 - 22,57)^2 + (30 -
22,57)^2 + (20 - 22,57)^2 + (30 - 22,57)^2 + (50 - 22,57)^2 + (35 - 22,57)^2 / 14
= 111,91

La desviación estándar se calcula como la raíz cuadrada de la varianza. En este caso,


la desviación estándar es:

Desviación estándar = sqrt(111,91)


= 10,60
Interpretación de las medidas

La varianza es una medida de la dispersión promedio de los datos alrededor de la


media. La desviación estándar es una medida de la dispersión de los datos alrededor
de la media, pero es más fácil de interpretar.

En este caso, la varianza es de 111,91 y la desviación estándar es de 10,60. Esto


significa que los datos están dispersos alrededor de la media en un rango de 10,60
unidades.

La desviación estándar es una medida importante para determinar si un conjunto de


datos está disperso o no. En este caso, la desviación estándar es relativamente alta,
lo que significa que los datos están dispersos en un rango relativamente amplio.

Conclusiones

En base a los resultados obtenidos, se puede concluir que:

La media es de 22,57 y la mediana es de 25.


La desviación estándar es de 10,60.
La mediana sería la medida más adecuada de tendencia central en este caso, ya que
la distribución de los datos no es simétrica.
Los datos están dispersos en un rango de 10,60 unidades.
Recomendaciones

Se recomienda realizar un análisis más detallado de los datos para determinar las
causas de la dispersión. Esto podría ayudar a identificar las áreas donde se pueden
mejorar las ventas.

PUNTO 2)

Solución

P(X<2) = P(X=0) + P(X=1) = 0.1 + 0.16 = 0.26

P(X>=5) = 1 - P(X<5) = 1 - (0.1 + 0.16 + 0.18 + 0.18) = 0.38

P(3<X<9) = P(X=3) + P(X=4) + P(X=5) + P(X=6) + P(X=7) = 0.18 + 0.18 + 0.16 + 0.1 +
0.8 = 2.22

Explicación
Para calcular la probabilidad de que un evento ocurra, se utiliza la siguiente fórmula:

P(A) = n(A) / n(S)


donde:

P(A) es la probabilidad de que el evento A ocurra


n(A) es el número de resultados favorables al evento A
n(S) es el número total de resultados posibles
En este caso, la variable aleatoria X representa el número de veces que ocurrió un
evento. Los resultados posibles son X=0, X=1, X=2, X=3, X=4, X=5, X=6 y X=7.

Para calcular P(X<2), se suman las probabilidades de que X sea igual a 0 o 1.

P(X<2) = P(X=0) + P(X=1)


P(X<2) = 0.1 + 0.16
P(X<2) = 0.26
Para calcular P(X>=5), se resta de 1 la probabilidad de que X sea menor o igual a 4.

P(X>=5) = 1 - P(X<=4)
P(X>=5) = 1 - (0.1 + 0.16 + 0.18 + 0.18)
P(X>=5) = 0.38
Para calcular P(3<X<9), se suman las probabilidades de que X sea igual a 3, 4, 5, 6 o
7.

P(3<X<9) = P(X=3) + P(X=4) + P(X=5) + P(X=6) + P(X=7)


P(3<X<9) = 0.18 + 0.18 + 0.16 + 0.1 + 0.8
P(3<X<9) = 2.22

Respuestas

P(X<2) = 0.26
P(X>=5) = 0.38
P(3<X<9) = 2.22

PUNTO 3)

Solución

Para calcular la probabilidad de que la temperatura esté entre 20ºC y la media,


primero debemos transformar las temperaturas a valores estandarizados. Para ello,
utilizamos la siguiente fórmula:

z = (x - μ) / σ
donde:

z es el valor estandarizado
x es el valor original
μ es la media
σ es la desviación estándar
En este caso, la media es μ = 31,5ºC y la desviación estándar es σ = 6ºC. Por lo
tanto, el valor estandarizado de la temperatura de 20ºC es:

z = (20 - 31,5) / 6 = -2,75


El valor estandarizado de la media es:

z = (31,5 - 31,5) / 6 = 0
Por lo tanto, la probabilidad de que la temperatura esté entre 20ºC y la media es:

P(-2,75 < z < 0)


Para calcular esta probabilidad, podemos utilizar la tabla de la función de probabilidad
acumulada (normal estandarizada). La tabla muestra la probabilidad de que un valor
estandarizado sea menor o igual a un valor dado.

En este caso, el valor z = -2,75 se encuentra en la tabla. La probabilidad


correspondiente es:

P(z < -2,75) = 0,006


El valor z = 0 se encuentra en la tabla. La probabilidad correspondiente es:

P(z <= 0) = 0,5


Por lo tanto, la probabilidad de que la temperatura esté entre 20ºC y la media es:

P(-2,75 < z < 0) = P(z < 0) - P(z < -2,75)


= 0,5 - 0,006
= 0,494
Respuesta

La probabilidad de que la temperatura esté entre 20ºC y la media es 0,494.

Explicación adicional

La probabilidad de que la temperatura esté entre 20ºC y la media se puede calcular


también de la siguiente manera:

P(20 < X < 31,5)


= P(-2,75 < (X - 31,5) / 6 < 0)
= P(-2,75 < Z < 0)
= 0,494
En este caso, la probabilidad se calcula directamente sin necesidad de transformar las
temperaturas a valores estandarizados. Sin embargo, esta forma de calcular la
probabilidad es menos precisa, ya que utiliza la función de probabilidad acumulada
normal estandarizada, que es una aproximación de la función de probabilidad
acumulada normal.

También podría gustarte