Interpretación Estadística Tatiana y Melisa
Interpretación Estadística Tatiana y Melisa
Interpretación Estadística Tatiana y Melisa
39086
39180
Estadística l
Yehidy Brand
Universidad de Caldas
Manizales
2023
Índice
1. Introducción
2. Antecedentes
3. Justificación
4. Conceptos
Moda
Población
Muestra
Variable cuantitativa seleccionada
Rango
Medidas de tendencia central
Varianza muestral
Coeficientes de variación
Tabla de Frecuencia
5. Gráficas y su respectiva interpretación
6. Comandos usados en R
7. Conclusiones
8. Referencias.
Introducción
Antecedentes
Por otro lado, el concepto de muestra surgió en el siglo XVIII, cuando matemáticos y
estadísticos desarrollaron métodos para seleccionar muestras representativas y obtener
estimaciones confiables sobre las características de una población. Las variables cuantitativas,
permiten una descripción numérica precisa de los fenómenos estudiados, facilitando su
interpretación.
El rango, como medida de dispersión, se reconoció como una forma sencilla pero útil de
cuantificar la variabilidad y dispersión de los datos. Las medidas de tendencia central, como la
media, mediana y moda, fueron desarrolladas en el siglo XIX y se han utilizado ampliamente
en diversos campos para identificar el centro o posición central de los datos.
La varianza muestral y la desviación estándar, preocupaciones centrales en la estadística,
cuantifican la variabilidad y dispersión de los datos en relación con la media. El coeficiente de
variación, una medida de dispersión relativa, permite comparar la variabilidad de diferentes
conjuntos de datos con diferentes unidades de medida.
Justificación
Moda
Población
Muestra
La muestra estadística seleccionada para este caso consiste en los países de los continentes
Asia, América, África, Europa y Oceanía, que se destacan como los principales compradores
de productos para el hogar.
Rango
El rango estadístico es una medida numérica que representa la amplitud o diferencia entre
el valor máximo y mínimo de una población o muestra estadística. En otras palabras, el rango
es la distancia entre el valor más alto y el más bajo en un conjunto de datos. Esta medida es
útil para comprender la dispersión o variabilidad de los datos, ya que proporciona información
sobre el alcance completo de los valores observados. Cuanto mayor sea el rango, mayor será
la variabilidad en los datos.
Las medidas de tendencia central son utilizadas para resumir y describir el conjunto de
datos, y pueden proporcionar información sobre el valor central o típico de un conjunto de
datos. Las tres medidas de tendencia central más comunes son la media, la mediana y la moda.
mean(b)#media
median(b)#mediana
return(as.numeric(names(which.max(table(z)))))#moda
La varianza muestral es una medida estadística que se utiliza para describir la dispersión de
un conjunto de datos respecto a su media muestral en un proyecto estadístico. Se calcula como
la suma de los cuadrados de las diferencias entre cada valor de la muestra y la media muestral,
dividida por el tamaño de la muestra menos uno.
Formula: s2=n−1∑i=1n(xi−xˉ)2
Desviación estándar
La desviación estándar se puede definir como otra medida estadística que se utiliza para
describir la dispersión de un conjunto de datos en un proyecto estadístico. Es una medida más
comúnmente utilizada que la varianza, ya que se expresa en las mismas unidades que los datos
originales, lo que facilita la interpretación.
Coeficientes de variación
Por último, el coeficiente de variación es una medida estadística que se utiliza para expresar la
variabilidad relativa de un conjunto de datos en relación con su media muestral y para
comparar la dispersión de diferentes conjuntos de datos que pueden tener escalas o unidades
de medida distintas.
CV=(xˉs)×100
Frecuencia absoluta
Frecuencia relativa
Aplicación de graficas.
El eje X muestra los nombres de los productos, que incluyen "alimento infantil",
"cárnicos", "cereales", "cosméticos", "doméstico", "frutas", "ropa", "snacks" y "verduras". El
eje Y representa la frecuencia absoluta, que va desde 0 hasta 35, con incrementos de 5.
Según la gráfica se puede interpretar lo siguiente: en la gráfica de barras muestra la
frecuencia absoluta de diferentes productos, donde los productos cárnicos, la ropa y las
verduras son los más representados en la muestra, seguidos de cerca por las frutas y los
cosméticos. Los productos de alimento infantil y cereales también tienen una presencia
significativa, mientras que los productos domésticos y los snacks tienen una presencia
relativamente menor.
La gráfica circular muestra los porcentajes de diferentes productos en la muestra. Los
cereales tienen el mayor porcentaje con un 10%, seguidos de los productos cárnicos,
domésticos, ropa y snacks, todos ellos con un 9% cada uno. Los productos de cuidado
personal, cosméticos, verduras y material de oficina representan el 8% cada uno. Las frutas
representan el 7% y las bebidas el 6%. Cabe destacar que no se registró ningún dato para el
alimento infantil en la muestra.
El gráfico de barras titulado "Canales" muestra que el canal offline es superior al canal
online en términos de su relevancia o frecuencia. Esto podría indicar que el canal offline es
más utilizado, preferido o tiene una mayor influencia en comparación con el canal online.
El diagrama circular muestra que el "offline" representa el 53% de la distribución, mientras
que el "online" representa el 47%. Esto sugiere que el "offline" tiene una mayor proporción
o presencia en comparación con el "online"
El diagrama circular de costos unitarios muestra los datos de esta variable expresados en
porcentajes. Cada fracción del diagrama representa los diferentes valores de "Costos
Unitarios" para cada producto de la muestra.
El gráfico de barras titulado "Costo Unitario" representa la magnitud de cada variable
definida a través de la frecuencia absoluta. La barra de color morado corresponde a la
frecuencia absoluta del histograma de productos, el color verde representa la frecuencia del
diagrama de caja, y el color rojo muestra la frecuencia acumulada, que es la más alta de todas.
El Histograma de producto nos representa gráficamente como podemos observar, la
distribución de frecuencias de un conjunto de datos continuos o discretos agrupados en
intervalos.
En el cual nos indica principalmente que la frecuencia absoluta es mayor en los valores
numéricos del 0 al 100
El grafico del diagrama de caja representa de manera resumida la distribución de un
conjunto de datos y proporciona información sobre su posición central, dispersión y presencia
de valores atípicos.
El diagrama de caja se construye a partir de algunas medidas como: mediana, cuartiles, etc.
El gráfico denominado Histograma B representa una variable única, en este caso, la
distribución de frecuencia de los datos de la variable "b", la cual corresponde al "Costo
unitario". Cada intervalo de la variable se representa mediante una barra en el gráfico."
La ojiva es un gráfico que representa visualmente la distribución acumulada de frecuencias de
una variable que estamos estudiando. De manera horizontal se encuentran los intervalos y de
manera vertical se muestra la frecuencia acumulada. Cada punto rojo en el gráfico representa
la frecuencia acumulada de la variable 'Costo Unitario' y también indica la mediana de estos
datos.
Conclusiones
https://repositorio.unal.edu.co/bitstream/handle/unal/80064/1059705148.2021.pdf?
sequence=3&isAllowed=y
http://132.248.164.227/publicaciones/docs/apuntes_matematicas/34.%20Estadistica
%20Descriptiva.pdf
https://www.researchgate.net/publication/257443564_HISTORIA_DE_LA_ESTADISTICA
https://www.r-project.org/