Trabajo 3

Descargar como docx, pdf o txt
Descargar como docx, pdf o txt
Está en la página 1de 6

1¿Qué es un diagrama circular? ¿Cómo se realiza?

Realice uno para el ejercicio


No. 1.

El diagrama circular (también llamado gráfica circular, gráfica de pastel o


diagrama de sectores) sirve para representar variables cualitativas o discretas. Se
utiliza para representar la proporción de elementos de cada uno de los valores de
la variable.
 Se utiliza para representar la proporción de elementos de cada uno de los valores
de la variable.

2 ¿Qué son las medidas de dispersión?


Las medidas de dispersión muestran la variabilidad de una distribución,
indicándolo por medio de un número, si las diferentes puntuaciones de una
variable están muy alejadas de la media. Cuanto mayor sea ese valor, mayor será
la variabilidad, cuanto menor sea, más homogénea será a la media. Así se sabe si
todos los casos son parecidos o varían mucho entre ellos.
Las medidas de dispersión son parámetros estadísticos que nos informan sobre la
variabilidad de los datos, es decir, si la distribución de los datos es más o menos
homogénea y por tanto nos dan una medida sobre la representatividad de los
parámetros de centralización (moda, mediana o media)

¿cuáles son?
El objetivo del estudio de los parámetros estadísticos es obtener información
resumida del conjunto de datos en los que estamos interesados. Ya hemos
resumido nuestros datos en un número, por ejemplo la media. Pero ¿es
representativo ese valor?

Comencemos con un ejemplo.


"Supongamos que dos alumnos han realizado cinco exámenes cada uno. Para
evaluarlos elegimos hacer la media de las cinco notas que han obtenido.
Las notas han sido:
ALUMNO 1: 4, 5, 5, 5, 6. Media = 5
ALUMNO 2: 1, 2, 5, 8, 9. Media = 5
Si vemos los dos tendrían la misma nota, lo que nos haría pensar que los dos
alumnos son similares, pero si observamos sus notas hay una gran diferencia
entre ambos. El alumno 1 tiene unas notas muy homogéneas, muy próximas a la
media mientras que el segundo tiene unos resultados muy dispares." 

Para poder analizar bien sus resultados necesitaríamos otro parámetro que nos
mida esa variabilidad. Estamos hablando de las medidas de dispersión.

Las medidas de dispersión son parámetros estadísticos que nos informan sobre la
variabilidad de los datos, es decir, si la distribución de los datos es más o menos
homogénea y por tanto nos dan una medida sobre la representatividad de los
parámetros de centralización (moda, mediana o media)

Como en los parámetros de centralización y de posición existen varios para medir


la dispersión. Los principales son:

RANGO O RECORRIDO

Es la diferencia entre el mayor valor de los datos y el menor.

Re = Max {xi} - Min {xi}

La principal ventaja del rango es su fácil cálculo aunque su valor es poco


significativo, ya que sólo tiene en cuenta los dos valores extremos.

RANGO O RECORRIDO INTERCUATÍLICO


Es la diferencia entre el tercer cuartil y el primero, el rango donde se encuentra el
50% central de los datos.

RI = Q3 - Q1

En ocasiones también se suele usar como valor la mitad del rango intercuartílico,
hablando en esta caso de recorrido semi-intercuartil.

Estas dos primeras medidas de dispersión se suelen utilizar cuando el cálculo de


la media no es posible o ésta no es significativa (ver medidas de centralización)
Las siguientes medidas que vamos a analizar se basan en medir la diferencia de
los datos con la media.

DESVIACIÓN MEDIA

La desviación media es la media de la distancia de los valores de los datos (en


valor absoluto) a la media.
El uso del valor absoluto es para evitar que se anulen distancias negativas con
distancias positivas, lo que daría como resultado que la desviación media sea cero
para cualquier distribución de datos.

VARIANZA

Como hemos referido antes para evitar que se anulen diferencias positivas y
negativas, en al desviación media se toma valor absoluto. Dado que la función
valor absoluto no tiene unas buenas propiedades matemáticas (por ejemplo, no es
derivable) otra manera de transformar los valores negativos en positivos es
elevando al cuadrado.
Por tanto, la varianza va a ser la media del cuadrado de la distancia de los valores
de los datos a la media.

Para el cálculo se suele aplicar la expresión:


DESVIACIÓN TÍPICA

Definimos la desviación típica como la raíz cuadrada de la varianza. 


o, usando la otra expresión:

El hecho de realizar la raíz cuadrada tiene por objetivo que la medida de


dispersión esté expresada en la misma unidad que la variable.

COEFICIENTE DE VARIACIÓN (DE PEARSON)

Dado que la desviación típica es una medida que está expresada en las mismas
unidades que la variable, si queremos comparar dispersiones a escalas distintas
necesitamos un parámetro adimensional. En estas situaciones usaremos el
coeficiente de variación que se expresa tanto de forma decimal como en tanto por
ciento, y nos expresaría la desviación típica como porcentaje con respecto a la
media.

2 ) ¿Qué es rango?
¿Qué es varianza?
¿Qué es desviación estándar y cuál es su fórmula?
Ilustre esos conceptos con un pequeño ejemplo.

1.- Rango: mide la amplitud de los valores de la muestra y se calcula por diferencia


entre el valor más elevado y el valor más bajo.

El Rango es el intervalo entre el valor máximo y el valor mínimo; por ello,


comparte unidades con los datos. Permite obtener una idea de la dispersión de los datos,
cuanto mayor es el rango, más dispersos están los datos (sin considerar la afectación de los
valores extremos). Por ejemplo, para una serie de datos de carácter cuantitativo, como lo es la
estatura medida en centímetros, tendríamos:
es posible ordenar los datos como sigue:
donde la notación x(i) indica que se trata del elemento i-ésimo de la serie de datos. De
este modo, el rango sería la diferencia entre el valor máximo  y el mínimo ; o, lo que
es lo mismo:
En nuestro ejemplo, con cinco valores, nos da que R = 185-155 = x Donde x es el
valor inicial al cambio de la variable en la curva de valor en "y"

2.- Varianza: Mide la distancia existente entre los valores de la serie y la media. Se


calcula como sumatorio de las diferencias al cuadrado entre cada valor y la media,
multiplicadas por el número de veces que se ha repetido cada valor. El sumatorio
obtenido se divide por el tamaño de la muestra.

En estadística, la desviación estándar 


(también representada por la letra griega minúscula sigma σ o la letra latina s, así como por
las siglas SD -de standard deviation- en algunos textos traducidos del inglés) es una medida
que se usa para cuantificar la variación o dispersiónde un conjunto de datos numéricos.1
Una desviación estándar baja indica que la mayor parte de los datos de una muestra tienden a
estar agrupados cerca de su media aritmética(también denominada el valor esperado),
mientras que una desviación estándar alta indica que los datos se extienden sobre un rango
de valores más amplio.

Formula

La fórmula de la desviación estándar (DE) es:


donde \sum∑sum significa "suma de", xxx es un valor de
un conjunto de datos, \muμmu es la media del conjunto de
datos y NNN es el número de datos.

Puede parecer que la fórmula de la desviación estándar


es confusa, pero tendrá sentido después de que la
desglosemos. En las secciones subsecuentes
explicaremos un ejemplo interactivo, paso a paso. Aquí
hay una rápida vista previa de los pasos que estamos a
punto de seguir:

Paso 1: calcular la media.

Paso 2: calcular el cuadrado de la distancia a la media


para cada dato.

Paso 3: sumar los valores que resultaron del paso 2.

Paso 4: dividir entre el número de datos.

Paso 5: sacar la raíz cuadrada.

También podría gustarte