2 Conceptos Básicos Datos y Escalas de Medición

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 27

PROBABILIDAD Y

ESTADÍSTICA
Ing. Isabel García paz
DATOS Y ESCALAS DE MEDICIÓN
Objetivos

• Analizar otras formas de clasificar los datos por medio de Niveles de


medición.
• Analiza las definiciones de nivel nominal, ordinal, de intervalo y de razón
• Utiliza el pensamiento crítico y el uso del sentido común al analizar datos
estadísticos analizando los tópicos de: Muestra de respuesta voluntaria,
Muestras demasiado pequeñas , Graficas, Pictogramas, Porcentajes,
Preguntas predispuestas, Orden de las preguntas, Falta de respuesta,
Datos faltantes, Correlación y causalidad, Estudios para el propio
beneficio, Números precisos, Imágenes parciales, Distorsiones deliberadas
TIPOS DE DATOS (continuación)
Otra forma común de clasificar los datos consiste en usar cuatro niveles de
medición:
1. Nominal
2. Ordinal
3. De intervalo
4. De razón

Cuando se aplica la estadística a problemas reales, el nivel de medición de


los datos es un factor importante para determinar el procedimiento a utilizar.
Lo importante es basarse en el sentido común: no hay que hacer cálculos ni
utilizar métodos estadísticos que no sean apropiados para los datos.
Nivel de medición nominal
Se caracteriza por datos que consisten exclusivamente en nombres, etiquetas o
categorías. Los datos no se pueden acomodar en un esquema de orden (como
del más bajo al más alto).
Ejemplos:
 Sí/no/indeciso: Respuestas de sí, no e indeciso en una encuesta
 Colores: Los colores de los automóviles conducidos por estudiantes
universitarios (rojo, negro, azul, blanco, magenta, púrpura, etcétera)
Nivel de medición ordinal
Los datos están en ese nivel el cuando pueden acomodarse en algún orden, aunque
no es posible determinar diferencias entre los valores de los datos o tales diferencias
carecen de significado.
Ejemplos:
 Las calificaciones de un curso: Un profesor asigna calificaciones de A, B, C, D, E o F.
Estas se pueden ordenar, pero no determinar diferencias entre ellas. Por ejemplo,
sabemos que A es mayor que B (por lo que hay un orden); pero no podemos restar
B de A (por lo que no se puede calcular la diferencia)
 Rangos: Con base en varios criterios, una revista ordena las ciudades de acuerdo
con su “habitabilidad”. Dichos rangos (1º, 2º, 3º, etc.) determinan un orden.
Las diferencias entre los rangos no tienen ningún significado. porque no es una
cantidad exacta que sea comparable con otras diferencias de este tipo.
Utilizando los rangos de la revista, la diferencia entre la ciudad de Nueva York y
Boston no se puede comparar de forma cuantitativa con la diferencia entre San
Luis y Filadelfia.
Nivel de medición de intervalo
Se parece al nivel ordinal, pero con la propiedad adicional de que la diferencia entre
dos valores de datos cualesquiera tiene un significado. Sin embargo, los datos en este
nivel no tienen punto de partida cero natural inherente (donde nada de la cantidad
está presente).
EJEMPLOS
 Temperaturas: Las temperaturas corporales de 98.2°F y 98.6°F son ejemplos de datos
a nivel de medición de intervalo. Dichos valores están ordenados, y podemos
determinar su diferencia de 0.4°F. Sin embargo, no existe un punto de inicio natural.
Pareciera que el valor de 0°F es un punto de inicio; son embargo, éste es arbitrario y
no representa la ausencia total de calor. Puesto que 0°F no es un punto de partida
cero natural, sería incorrecto decir que 50°F es dos veces más caliente que 25°F.
 Años: Los años 1000, 2008, 1776 y 1492. (El tiempo no inició en el año 0, por lo que el
año 0 es arbitrario y no constituye un punto de partida cero natural que represente
“la ausencia de tiempo”).
Nivel de medición de razón
Es similar a nivel de intervalo, pero tiene un punto de partida cero natural (donde
el cero indica que nada de la cantidad está presente). Para valores este nivel,
tanto las diferencias como las proporciones tienen significado.
EJEMPLOS Observe la presencia de un valor cero natural, así como el uso de
proporciones que significan “dos veces” y “tres veces”.
 Pesos: Los pesos (en quilates) de anillos de compromiso de diamante (el 0
realmente representa la ausencia de peso y 4 quilates es dos veces el peso de
2 quilates).
 Precios: Los precios de libros de texto universitarios ($0 realmente representa
ningún costo y un libro de $90 es tres veces más caro que un libro de $30
¿Nominal, ordinal, de intervalo o de razón?
1. Maratón. Los números en las camisetas de los corredores de maratones.
2. Producto de consumo. Las calificaciones que da la revista Consumer Reports
de “la mejor compra, recomendado, no recomendado”.
3. IGSS. Los números de seguridad social.
4. Encuesta de bebidas. El número de respuestas “sí” recibidas cuando se les
preguntó a 500 estudiantes si alguna vez se habían embriagado en la
universidad.
5. Cigarras. Los años de aparición de cigarras (chicharras): 1936, 1953, 1970, 1987
y 2004.
6. Mujeres ejecutivas. Los salarios de mujeres que son directoras generales de
corporaciones.
7. Calificaciones. Calificaciones de las películas de una estrella, dos estrellas, tres
estrellas y cuatro estrellas.
8. Temperaturas. Las temperaturas actuales en las capitales de las 50 entidades
de Estados Unidos.
Pensamiento crítico
Muestras erróneas

Es importante saber que cuando los datos muestrales se


reúnen de manera inapropiada, ningún método
estadístico es capaz de producir resultados válidos.
Un método de muestreo mal aplicado arruina la muestra,
de modo que es posible que esté sesgada (que no sea
representativa de la población de la que se obtuvo).
Los errores de muestreo decrecen al aumentar el tamaño
de la muestra, los errores ajenos al muestreo crecen.
Muestra de respuesta voluntaria
 Una muestra de respuesta voluntaria (o muestra
autoseleccionada) es aquella en que los propios sujetos
deciden ser incluidos.
Muestras demasiado pequeñas
 Las conclusiones no se deben basar en muestras
demasiado pequeñas.
 66.66 % de la población encuestada es despistada y
optimista

Población: Fondo de Bikini


Gráficas
 Las gráficas, como las de barras y las circulares, se pueden utilizar para
exagerar o subestimar la verdadera naturaleza de los datos.
 Para interpretar de manera correcta una gráfica, tenemos que analizar la
información numérica que presenta, para no engañarnos por su forma
general.
Pictogramas
 Pictogramas Los dibujos de objetos, llamados pictogramas, también suelen
ser confusos.
 Al dibujar este tipo de objetos, los artistas podrían crear falsas impresiones
que distorsionen las diferencias. El inciso b) está diseñado para exagerar la
diferencia al incrementar cada dimensión en proporción a las cantidades
reales del consumo de petróleo.

Comparación entre Estados Unidos y Japón: Consumo diario de petróleo (millones de barriles)
Porcentajes
En ocasiones se utilizan porcentajes confusos o poco claros. Los siguientes son algunos
principios clave que se aplican cuando tratamos con porcentajes.
 Porcentaje de: Para encontrar el porcentaje de una cantidad, excluya el símbolo % y
divida el valor del porcentaje entre 100, y después multiplique por la cantidad. Este
ejemplo muestra que el 6% de 1200 es 72:
6% de 1200 respuestas = 6/100 x 1200 = 72
 Fracción → porcentaje: Para convertir de una fracción a un porcentaje, divida el
denominador entre el numerador para obtener un número decimal equivalente,
después multiplíquelo por 100 agregue el símbolo %. Este ejemplo muestra que la
fracción 3/4 es equivalente al 75%:
3/4 = 0.75 → 0.75 x 100% = 75%
 Decimal → porcentaje: Para convertir de un número decimal a un porcentaje
multiplíquelo por 100%. Este ejemplo muestra que 0.250 es equivalente a 25.0%:
0.250 → 0.250 x 100% = 25.0%
 Porcentaje →decimal: Para convertir de un porcentaje a un número decimal, elimine
el símbolo % y divida entre 100. Este ejemplo muestra que el 85% es equivalente a
0.85:
85% = 85/100 = 0.85
Preguntas predispuestas
Hay muchos aspectos que afectan las preguntas de encuesta. Éstas pueden estar
“cargadas” o redactadas intencionalmente para obtener la respuesta deseada.
Observe las tasas reales de la respuesta “sí” para las diferentes formas de redacción de
una pregunta:
 97% sí: “¿Debería el presidente utilizar su poder de veto para eliminar los
desperdicios?”
 57% sí: “¿Debería el presidente utilizar su poder de veto o no?”
Orden de las preguntas
En ocasiones las preguntas de una encuesta se sesgan de manera no
intencional debido a factores como el orden de los elementos que se
someten a consideración. Observe estas preguntas de una encuesta
aplicada en Alemania:
 ¿Cree usted que el tránsito vehicular contribuye a la contaminación
del aire más o menos que la industria?
 ¿Cree usted que la industria contribuye a la contaminación del aire
más o menos que el tránsito vehicular?

! Cuando se presentó primero el tránsito, el 45%


culpó a este factor, y el 27% a la industria;
! Cuando la industria se presentó primero, el 24%
culpó al tránsito y el 57% culpó a la industria.
Falta de respuesta
Existe una falta de respuesta cuando alguien se rehúsa a responder una pregunta
de encuesta o cuando la persona no está disponible.
Cuando se plantean preguntas de encuesta a los individuos, algunos se rehúsan
firmemente a responder. Algunos sienten temor por los extraños y otros protegen su
privacidad; sin embargo, su negativa a hablar demuestra que la perspectiva que
tienen del mundo que les rodea es notablemente diferente de la que tienen las
personas que reciben a los encuestadores en sus casas
Datos faltantes
 En ocasiones los resultados se ven muy afectados por datos faltantes. A
veces faltan datos muestrales por el azar, lo cual implica que la posibilidad
de que falte un dato no tiene ninguna relación con sus valores u otros
valores. Sin embargo, algunos datos faltan debido a factores especiales,
como los individuos con bajos ingresos que son menos proclives a reportar
cuánto dinero ganan.
Correlación y causalidad
Correlación indica que dos variables están relacionadas, pero es importante
aclarar: correlación no implica causalidad.
Cuando encontramos una asociación estadística entre dos variables, no
podemos concluir que una de las variables sea causa de (o lo que afecta
directamente a) la otra variable.
Estudios para el propio beneficio
 En ocasiones los estudios reciben el patrocinio de grupos con intereses
específicos que buscan promover.
 Se sebe ser muy cauto con las encuestas donde el patrocinador puede obtener
ganancias monetarias con base en los resultados. En los últimos años ha
aumentado la preocupación por la práctica de las empresas farmacéuticas por
financiar a médicos que realizan experimentos clínicos y reportan sus resultados
en revistas de prestigio, como Journal of the American Medical Association.
Números precisos
 “En la actualidad hay 103,215,027 hogares en Estados Unidos”. Puesto que
esta cifra es muy precisa, mucha gente considera erróneamente que
también es exacta. En este caso, el número es un estimado y sería mejor
decir que el número de hogares es aproximadamente de 103 millones.
Imágenes parciales
 “El 90% de todos nuestros automóviles, vendidos en este país en los últimos
10 años, continúa circulando”. Millones de consumidores escucharon ese
mensaje comercial y no se dieron cuenta de que el 90% de los automóviles
que el anunciante vendió en este país se vendieron durante los últimos tres
años, por lo que la mayoría de esos automóviles que circulaban estaban
casi nuevos. La afirmación era técnicamente correcta, aunque muy
engañosa pues no presentaba los resultados completos.
Distorsiones deliberadas
 Existen muchos usos inadecuados de la estadística. Algunos de ellos se
encuentran en libros como el clásico de Darrel Huff How to Lie with
Statistics; el de Robert Richard, The Figure Finaglers; y el de Cynthia
Crossen, Tainted Truth. Comprender tales prácticas resultará sumamente
útil en la evaluación de los datos estadísticos que se encuentran en
situaciones cotidianas.
Gracias por su atención

También podría gustarte