Cuaderno de Trabajo Estadistica

Descargar como docx, pdf o txt
Descargar como docx, pdf o txt
Está en la página 1de 229

Material de enseñanza

Estadística para comunicadores

Área de Ciencias

Marzo 2022
La siguiente guía de trabajo contiene el material necesa-
rio para seguir las clases del curso Estadística para Comunicado-
res de la Universidad Peruana de Ciencias Aplicadas. Contiene la
teoría, ejercicios resueltos y propuestos, con respuestas, de todo
el curso.

Este material de enseñanza está basado en el trabajo de


la profesora Silvia Gutiérrez y de profesores del curso que lo han
desarrollado y corregido a lo largo de varios ciclos.

Esperamos que este material te sea de mucha utilidad para lo-


grar tu aprendizaje.

Las profesoras y los profesores del curso


Contenido

Unidad 1. Estadística descriptiva................................................................................................6


La Estadística........................................................................................................................................
Clasificación de la Estadística................................................................................................................
Estadística descriptiva..................................................................................................................8
Estadística inferencial...................................................................................................................8
Conceptos básicos................................................................................................................................
Población......................................................................................................................................9
Muestra........................................................................................................................................9
Unidad elemental.........................................................................................................................9
Variable..............................................................................................................................................
Tipos de variables.......................................................................................................................11
Variable cualitativa.....................................................................................................................11
Variable cuantitativa..................................................................................................................11
Escalas de medición...................................................................................................................15
Dato............................................................................................................................................18
Observación...............................................................................................................................18
Técnicas de recolección de datos.......................................................................................................
Censo..........................................................................................................................................21
Muestreo....................................................................................................................................21
Registro administrativo..............................................................................................................22
Parámetro y estadístico..............................................................................................................23
Presentación tabular y gráfica de variables........................................................................................
Frecuencias absolutas, relativas y porcentuales.........................................................................30
Tabla de distribución de frecuencias para variable cualitativa...................................................30
Tabla de distribución de frecuencias para variable cuantitativa discreta...................................31
Tabla de distribución de frecuencias para variable cuantitativa continua..................................31
Representación gráfica de variables cualitativas........................................................................32
Representación gráfica de variables cuantitativas discretas......................................................32
Representación gráfica de variables cuantitativas continuas.....................................................32
Medidas de tendencia central............................................................................................................
Media.........................................................................................................................................41
Mediana.....................................................................................................................................45
Moda..........................................................................................................................................49
Forma de la distribución de los datos.................................................................................................
Medidas de posición: Cuantiles..........................................................................................................
Percentiles..................................................................................................................................58
Cuartiles.....................................................................................................................................58
Deciles........................................................................................................................................58
Medidas de variabilidad o dispersión.................................................................................................
Rango.........................................................................................................................................67
Varianza......................................................................................................................................67
Desviación estándar...................................................................................................................68
Coeficiente de variación.............................................................................................................71
Tabulaciones cruzadas........................................................................................................................
Gráfico de barras comparativas (agrupadas o apiladas).............................................................80

Unidad 2. Probabilidad y distribución normal de probabilidad................................................89


Experimento aleatorio................................................................................................................90
Experimento determinista..........................................................................................................90
Espacio muestral........................................................................................................................90
Evento........................................................................................................................................90
Eventos mutuamente excluyentes.............................................................................................90
Operaciones con eventos...................................................................................................................
Probabilidad...............................................................................................................................92
Definición clásica de probabilidad..............................................................................................92
Distribución normal de probabilidad........................................................................................103

Unidad 3. Inferencia estadística.............................................................................................123


Censo........................................................................................................................................124
Muestreo..................................................................................................................................124
Tamaño de muestra..........................................................................................................................126
Muestreo probabilístico...................................................................................................................140
Ficha técnica.............................................................................................................................141
Población muestreada..............................................................................................................142
Unidad de muestreo.................................................................................................................142
Marco muestral........................................................................................................................142
Técnicas de muestreo...............................................................................................................147
Muestreo aleatorio simple.......................................................................................................147
Muestreo estratificado.............................................................................................................153
Muestreo sistemático...............................................................................................................167
Prueba de hipótesis..........................................................................................................................175
Tipos de errores.......................................................................................................................175
Error tipo I................................................................................................................................175
Nivel de significación................................................................................................................175
Pasos para realizar una prueba de hipótesis............................................................................176
Prueba de hipótesis para la media poblacional........................................................................177
Distribución t-Student..............................................................................................................178
Prueba de hipótesis para una proporción poblacional.............................................................188
Regresión lineal simple y correlación...............................................................................................200
Diagrama de dispersión o gráfico del plot................................................................................201
Ecuación de regresión..............................................................................................................202
Método de los mínimos cuadrados..........................................................................................202
Validación del modelo de regresión lineal................................................................................204
Coeficiente de determinación..................................................................................................205
Coeficiente de correlación........................................................................................................205
Tablas estadísticas............................................................................................................................215
Tabla de números aleatorios....................................................................................................216
Tabla de la distribución normal estándar.................................................................................217
Tabla de la distribucion t - Student...........................................................................................219
Unidad 1. Estadística descriptiva

Logro
Al finalizar la unidad 1, el estudiante aplica las herramientas descriptivas
usando datos e información gráfica para la toma de decisiones.

Temario

La Estadística y su clasificación

Estadística descriptiva
Estadística inferencial

Conceptos básicos

Población, muestra y elemento.


Variables, tipos de variable y escalas de medida
Dato y observación
Parámetro y estadístico.
Organización de variables cualitativas y cuantitativas

Medidas de resumen

Medidas de tendencia central y concepto de asimetría


Medidas de posición
Medidas de dispersión

Tablas de doble entrada

Tablas de doble entrada de frecuencias absolutas y porcentuales


Gráficos comparativos: barras agrupadas y barras apiladas
Estadística para Comunicadores 7

La Estadística
Es una ciencia que proporciona un conjunto de métodos, técnicas y procedimientos para recopilar,
organizar, presentar y analizar datos, que nos llevarán a tomar decisiones correctas.

Recopilar datos Organizar datos Presentar datos Analizar datos Tomar decisiones

Tomado de https://onedigital.mx/2020/12/30/infografia-lo-que-sucedio-cada-minuto-en-internet-en-2020/

La finalidad y utilidad es describir, numérica o gráficamente, al conjunto de datos, así como tam -
bién realizar inferencias entendidas como generalizaciones de lo medido, de manera que se pue -
dan obtener conclusiones adecuadas. Es una herramienta útil para la toma de decisiones.
Estadística para comunicadores 8

Clasificación de la Estadística

Estadística

Descriptiva Inferencial

Estadística descriptiva
Son métodos y técnicas de recolección, caracte-
rización, resumen y presentación que permite describir las
características de un conjunto de datos.

Comprende el uso de gráficos, tablas e indicadores para el análi-


sis.

Existen diversos tipos de gráficos adecuados a los ti-


pos de variables que se desean representar.

Estadística inferencial
Son métodos y técnicas que hacen posible estimar
una o más características de una población o tomar
decisiones referentes a la población basados en el
resultado de muestras seleccionadas al azar.

Estas conclusiones no tienen que ser totalmente


válidas, pueden tener cierto margen de error, por eso
se dan con una medida de confiabilidad o probabili-
dad.
Estadística para comunicadores 9

Conceptos básicos

Población
Es el conjunto de todos los elementos de interés en un determinado estudio.
Pueden ser personas, animales, objetos, conceptos, entre otros, de los cuales sacamos conclusio-
nes a partir de una o más características observables de naturaleza cualitativa o cuantitativa.
Suele llamarse población objetivo porque se selecciona en función al objetivo de estudio.

Muestra
Es una parte representativa de la población que se selecciona adecuadamente para su análisis y así
obtener información acerca de la población de la que proviene.
En Estadística se suele trabajar con muestras representativas, es decir, que son elegidas de forma
aleatoria.

Unidad elemental
Es el objeto sobre el cual se hace la medición. También llamada unidad de observación, unidad de
análiisis, unidad estadística o elemento. Por ejemplo, en estudios de poblaciones humanas, con
frecuencia ocurre que la unidad elemental es cada individuo.

En estudios longitudinales, de series de tiempo, la unidad elemental es la unidad de tiempo. Por


ejemplo, un día, un mes, un año, etc.

Población Todos los trabajadores del área de marketing de la agencia publicitaria Nexo
Muestra Algunos
Elemento Un

Población Todos
Muestra Un subconjunto
Elemento Un
Estadística para Comunicadores 10

Ejemplo 1
El hotel La Posada es relativamente nuevo en el mercado hotelero de Puno. La gerencia general de-
sea invertir en la realización de una publicidad agresiva para incrementar la cantidad de huéspedes
extranjeros por temporada en el hotel. Para ello, desea conocer que características del hotel es
conveniente resaltar en la publicidad aplicando una encuesta a una muestra aleatoria de 115
huéspedes extranjeros que se hospedaron entre enero y marzo del presente año. A continuación,
se presenta parte de la base de datos:

Precio dispues-
Número de
to
acompañan-
N° Edad Género País de procedencia a pagar por ha- Criterio de selección del hotel
tes
bitación
por viaje
(en dólares)
1 25 Masculino Inglaterra 80 0 Limpieza del dormitorio
2 35 Femenino Argentina 60 2 Precio
3 45 Masculino Francia 115 3 Buena calidad de las toallas y sábanas
4 65 Masculino Francia 45 0 Precio
5 72 Femenino Francia 55 1 Amigable y cordial staff de empleados
6 28 Masculino Estados Unidos 65 2 Precio
7 45 Femenino Estados Unidos 60 1 Precio
8 85 Masculino China 70 2 Precio
9 25 Masculino Inglaterra 65 3 Limpieza del dormitorio
10 35 Femenino Francia 45 1 Precio
⋮ ⋮ ⋮ ⋮ ⋮ ⋮ ⋮
115 20 Masculino Estados Unidos 55 2 Amigable y cordial staff de empleados

a. Determine la población, la muestra y la unidad elemental.


b. De la base de datos, proporcione un ejemplo de dato y uno de observación.
Solución
a. Determine la población, la muestra y la unidad elemental.

 Población: Todos los huéspedes extranjeros que se hospedaron en el hotel la Posada


entre enero y mayo del presente año.
 Muestra: 115 huéspedes extranjeros que se hospedaron en el hotel la Posada entre
enero y mayo del presente año.
 Elemento: Un huésped extranjero que se hospedó en el hotel la Posada entre enero y
mayo del presente año.

Ejemplo 2
De los universitarios que viven en Lima, se quiere estimar el porcentaje que tiene un trabajo part
time. Determine la población, la muestra y la unidad elemental.
Solución
 Población: Todos los universitarios que viven en Lima
 Muestra: Algunos universitarios que viven en Lima
 Elemento: Un universitario que viven en Lima
Estadística para comunicadores 11

Variable

Son las características que presentan las unidades elementales de una población y que puede asu-
mir diferentes valores cuando se realiza su medición. Las variables se suelen representar con las le-
tras mayúsculas de nuestro alfabeto, por lo general se usa X, Y o Z.

Tipos de variables

cualitativa

Variable discreta

cuantitativa

continua

Variable cualitativa
Es aquella variable que al ser medida queda expresada por etiquetas o nombres que se utilizan
para identificar una característica o atributo.
 Son ejemplos de variable cualitativa, el distrito de residencia o el grado de instrucción.

Variable cuantitativa
Es aquella variable que al ser medida queda expresada por números que se utilizan para identificar
una característica o atributo.

Se clasifica en discretas o continuas.


Variable cuantitativa discreta
Las mediciones de este tipo de variable son el resultado del conteo, es decir, los valores que puede
tomar son números enteros (finitos o infinitos).
 Son ejemplos de variable cuantitativa discreta, el número de capacitaciones realizadas en el
año o el número de errores cometidos en la redacción de un informe.

Variable cuantitativa continua


Las mediciones de este tipo de variable pueden ser decimales o fracciones; es decir, para dos
valores cualesquiera, siempre se podrá encontrar un tercer valor entre los dos primeros.
 Son ejemplos de variable cuantitativa continua, el ingreso mensual (en soles) o el tiempo que
demora una llamada telefónica (en minutos).
Estadística para comunicadores 12

Ejemplo 3
Si tenemos la pregunta: ¿Cuál es tu programa de televisión preferido?, para identificar la variable
usaremos una letra mayúscula, por ejemplo, X.

Pregunta Variable en estudio Tipo de variable


¿Cuál es tu programa de televisión X = programa de televisión
Cualitativa
preferido preferido

Ejemplo 4
En cada caso, identifique la variable en estudio y su tipo.

Pregunta Variable en estudio Tipo de variable

¿Cuál es su grado de instrucción?

¿Cuál es su ingreso mensual, en


soles?

¿Cuántos hermanos tiene?

¿Cuál es su año de nacimiento?


Estadística para comunicadores 13

Ejemplo 5
El hotel La Posada es relativamente nuevo en el mercado hotelero de Puno. La gerencia general de-
sea invertir en la realización de una publicidad agresiva para incrementar la cantidad de huéspedes
extranjeros por temporada en el hotel. Para ello, desea conocer que características del hotel es
conveniente resaltar en la publicidad aplicando una encuesta a una muestra aleatoria de 115
huéspedes extranjeros que se hospedaron entre enero y marzo del presente año. A continuación,
se presenta parte de la base de datos:

Precio dispuesto Número de


País de proce- a pagar por habi- acompañantes
N° Edad Género Criterio de selección del hotel
dencia tación
(en dólares) por viaje
1 25 Masculino Inglaterra 80 0 Limpieza del dormitorio
2 35 Femenino Argentina 60 2 Precio
3 45 Masculino Francia 115 3 Buena calidad de las toallas y sábanas
4 65 Masculino Francia 45 0 Precio
5 72 Femenino Francia 55 1 Amigable y cordial staff de empleados
6 28 Masculino Estados Unidos 65 2 Precio
7 45 Femenino Estados Unidos 60 1 Precio
8 85 Masculino China 70 2 Precio
9 25 Masculino Inglaterra 65 3 Limpieza del dormitorio
⋮ ⋮ ⋮ ⋮ ⋮ ⋮ ⋮
115 20 Masculino Estados Unidos 55 2 Amigable y cordial staff de empleados

Identifique el tipo de variable que se presenta en la base de datos.


Solución
Variable Tipo de variable
 Edad Cuantitativa continua
 Género Cualitativa
 País de procedencia Cualitativa
 Precio dispuesto a pagar por habitación, en dólares Cuantitativa continua
 Número de acompañantes por viaje Cuantitativa discreta
 Criterio de selección del hotel Cualitativa

Ejemplo 6
Se realizó un estudio para determinar la emisora radial preferida por los limeños. Clasifique las si -
guientes variables de la encuesta de acuerdo con su tipo.

 Nivel educativo
 Nombre de la radio preferida
 Cantidad de horas que escucha dicha radio al día
 Número de días que escuchó radio en la última semana
 Dispositivo con el cual escucha radio (radio, celular, etc.)
Solución
Variable Tipo de variable
 Nivel educativo Cualitativa
 Radio preferida Cualitativa
 Cantidad de horas que escucha dicha radio al día Cuantitativa continua
 Cantidad de días que escuchó radio en la última semana Cuantitativa discreta
 Dispositivo usado para escuchar radio (radio, celular, etc.) Cualitativa
Estadística para comunicadores 14
Ejemplo 7
Se desea conocer la opinión de las mujeres que usan el servicio del Metropolitano. Para ello se en-
cuestó, el primer trimestre del año, a 300 mujeres que usaron dicho medio de transporte. Los re-
sultados se presentan a continuación:

 El 65% de los usuarios opinó que el servicio es bueno, el 30% que es regular y el resto manifes-
tó que era deficiente.
 El 60% de los usuarios manifestó que es muy lenta la recarga de la tarjeta “Bus Card”.
 La edad promedio es de 42,5 años con una desviación estándar de 2,3 años.
 El 50% de los usuarios demora a lo más 25 minutos en llegar a su destino.
 El 85% de los usuarios usa el servicio como máximo cuatro veces al día.

a. Del enunciado anterior identifique: población, muestra, unidad elemental.


b. Identifique las variables e indique su tipo.

Solución
a. Del enunciado anterior identifique: población, muestra y elemento.

 Población: Todas las mujeres que usaron el servicio del Metropolitano el primer trimestre
del año
 Muestra: 300 mujeres que usaron el servicio del Metropolitano el primer trimestre del año
 Elemento: Una mujer que usó el servicio del Metropolitano el primer trimestre del año

b. Identifique las variables del estudio e indique su tipo.

Variable Tipo de variable


 Opinión sobre la calidad del servicio Cualitativa
 Percepción sobre la velocidad de recarga Cualitativa
 Edad, en años Cuantitativa continua
 Tiempo de recorrido, en minutos Cuantitativa continua
 Número de veces al día que usa el servicio Cuantitativa discreta
Estadística para comunicadores 15

Escalas de medición
La medición de una variable consiste en asignar un valor a la característica observada. Por ejemplo,
si la característica observada es el género de las personas, al clasificar a una persona como de sexo
femenino, le asignamos un valor, y hacemos una medición de la característica.

Las escalas de medida de una variable cualitativa son las siguientes:

Nominal
Una variable está medida en escala nominal cuando los datos son etiquetas o nombres que se
emplean para definir un atributo del elemento. Con esta escala no tiene sentido realizar operacio-
nes aritméticas. Las siguientes variables son ejemplos de variables medidas en escala de medición
nominal:

 Distrito de residencia
 Marca de celular
 Número de DNI

Ordinal
Una variable está medida en escala ordinal cuando puede ordenarse de acuerdo con algún criterio.
Se pueden ordenar en forma ascendente o descendente. También, pueden registrarse por medio
de un código numérico. Las siguientes variables son ejemplos de variables medidas en escala ordi-
nal:

 Orden de mérito de los alumnos de una carrera profesional


 Grado de instrucción (primaria, secundaria, superior, postgrado)
 Calificación del servicio recibido (muy bueno, bueno, regular, malo, muy malo)

Cuando el orden de las categorías de la variable es natural, es decir, muestran el paso del tiempo,
la escala de medida no es ordinal. Por ejemplo: los meses del año, las estaciones, turnos de traba -
jo, etc.

Las escalas de medida de una variable cuantitativa son las siguientes:

Intervalo
Una variable está medida en escala de intervalo si el cero es relativo, es decir, no indica la ausencia
de la característica medida. Las siguientes variables son ejemplos de variables medidas en escala
intervalo:

 Temperatura, en °C
 Ubicación en una carretera respecto de un punto de referencia
 Año de nacimiento

Razón
Una variable está medida en escala de razón si el cero indica la ausencia de característica de la
medida. Las siguientes variables son ejemplos de variables medidas en escala razón:

 Sueldo de los trabajadores, en soles


 Peso de una persona, en kg
Estadística para comunicadores 16
 Velocidad de un auto en la carretera, en km/h
Ejemplo 8
El hotel La Posada es relativamente nuevo en el mercado hotelero de Puno. La gerencia general de-
sea invertir en la realización de una publicidad agresiva para incrementar la cantidad de huéspedes
extranjeros por temporada en el hotel. Para ello, desea conocer que características del hotel es
conveniente resaltar en la publicidad aplicando una encuesta a una muestra aleatoria de 115
huéspedes extranjeros que se hospedaron entre enero y marzo del presente año.

A continuación, se presenta parte de la base de datos:

Precio dispues-
to Número de
País de
N° Edad Género a pagar por ha- acompañantes Criterio de selección del hotel
procedencia
bitación por viaje
(en dólares)
1 25 Masculino Inglaterra 80 0 Limpieza del dormitorio
2 35 Femenino Argentina 60 2 Precio
3 45 Masculino Francia 115 3 Buena calidad de las toallas y sábanas
4 65 Masculino Francia 45 0 Precio
5 72 Femenino Francia 55 1 Amigable y cordial staff de empleados
6 28 Masculino Estados Unidos 65 2 Precio
7 45 Femenino Estados Unidos 60 1 Precio
8 85 Masculino China 70 2 Precio
9 25 Masculino Inglaterra 65 3 Limpieza del dormitorio
10 35 Femenino Francia 45 1 Precio
⋮ ⋮ ⋮ ⋮ ⋮ ⋮ ⋮
11
20 Masculino Estados Unidos 55 2 Amigable y cordial staff de empleados
5

Identifique el tipo y la escala de medición de cada una de las variables que se presenta en la base
de datos.

Solución
Variable Tipo de variable Escala de medida
 Edad, en años Cuantitativa continua Razón
 Género Cualitativa Nominal
 País de procedencia Cualitativa Nominal
 Precio dispuesto a pagar por habitación Cuantitativa continua Razón
 Número de acompañantes por viaje Cuantitativa discreta Razón
 Criterio de selección del hotel Cualitativa Nominal
Estadística para Comunicadores 17

Ejercicios de aplicación

1. Con la finalidad de determinar en qué medida la población urbana de cierta ciudad identifica
elementos sexistas o machistas en la publicidad comercial actual, un sociólogo cultural tomó
una muestra de 590 personas, de los cuales encontró que:

 el 60% de los encuestados reconocía elementos sexistas en la publicidad,


 la edad promedio de los entrevistados fue de 37,5 años,
 el 20% pertenecía a la clase socioeconómica A-B, el 45% a la clase C-D y los restantes a la clase
E.
 A la pregunta respecto a la marca comercial con mayor contenido machista en su publicidad, el
45% reconoce a la marca de cerveza “SENPIL”, el 25% a la marca de artículos de cuidado
personal “GOE”, el 10% a la marca de detergente “CEA” y el resto a otras marcas.

Relacione cada información con su respectivo concepto estadístico.

Información dada en el párrafo Concepto estadístico


A. Todos los ciudadanos de cierta ciudad (…) Variable cuantitativa continua
B. 32 años (…) Muestra
C. 45% pertenecen a la clase C-D (…) Población
D. 590 personas de cierta ciudad (…) Variable cualitativa
E. Un ciudadano (…) Estadístico
F. Cerveza “SENPIL” (…) Dato cuantitativo
G. Nivel socioeconómico registrado y medido como (…) Dato cualitativo
A-B, C-D y E (…) Unidad elemental
H. Edad del entrevistado (…) Escala ordinal
I. Marca con mayor contenido sexista

2. Indique el tipo y la escala de medida de cada una de las siguientes variables:

Variable Tipo Escala de medición

Tiempo destinado a ver Netflix a la se-


mana, en horas

Serie favorita de Netflix

Número de capítulos de una serie por


temporada en Netflix

Opinión respecto a la serie “The Crown”


(mala, regular, buena, muy buena)
Estadística para Comunicadores 18

Dato
Es la respuesta o el resultado de medir una característica de una unidad elemental.
Los datos cualitativos corresponden a una variable cualitativa y los datos cuantitativos correspon-
den a una variable numérica, pudiendo ser un dato cuantitativo discreto o un dato cuantitativo
continuo.

Observación
Es el conjunto de datos por unidad elemental.
Se tendrán tantas observaciones como unidades elementales se tengan en el estudio

Ejemplo 9
Según el Informe técnico “La COVID-19 y el trabajo doméstico en Argentina” Elva López Mourelo
de la Oficina de la OIT para la Argentina 20 de abril de 2020 se tiene el siguiente gráfico. Determine
la población, la unidad elemental y proporcione un ejemplo de posible observación.
Estadística para comunicadores 19

Solución
 Población Todas las personas que hacen trabajo doméstico en Argentina
 Unidad elemental Una persona que hace trabajo doméstico en Argentina
 Dato cualitativo Bolivia
 Posible observación Mujer, de 30 a 34 años, Bolivia, jefa, menores de 5 años, entre 30 mil y
50 mil, 2 a 3 miembros.

Ejemplo 10
Una empresa de servicios tiene un total de 30 trabajadores y ha registrado información acerca del
ingreso mensual (en soles) y la cantidad de años cumplidos en la empresa. A continuación, se
presenta la información:

Ingreso Años en la Ingreso Años en la Ingreso Años en la


Nº Nº Nº
(en soles) empresa (en soles) empresa (en soles) empresa
1 2300 5 11 2100 13 21 2400 16
2 2800 11 12 2100 9 22 1700 0
3 2400 4 13 1800 1 23 2500 12
4 2500 2 14 2000 9 24 1700 3
5 2300 3 15 2100 10 25 2400 17
6 2100 2 16 1900 4 26 2400 16
7 1700 2 17 2000 10 27 1900 7
8 2000 0 18 2300 11 28 1700 1
9 2200 7 19 2000 7 29 2100 6
10 2100 4 20 1700 1 30 2000 5

Identifique, a partir del enunciado, la población y la unidad elemental. Además, proporcione un


ejemplo de dato y un ejemplo de observación.
Solución
 Población 30 trabajadores de una empresa de servicios
 Unidad elemental Un trabajador de la empresa
 Ejemplo de dato Dato del trabajador 5: x5 = 3 años en la empresa
 Ejemplo de observación Trabajador 2: 2800 soles y 11 años en la empresa

Ejemplo 11
La siguiente base de datos contiene información de una muestra de 10 usuarios de Internet de un
determinado distrito de la ciudad capital.

Usuar Marca Principales problemas con Número de PC Tiempo de navegación


io de PC Internet con Internet diaria (min)
Estadística para comunicadores 20

1 HP Saturación de la red 1 194,00


2 Dell Lentitud para subir información 1 274,45
3 IBM Saturación de la red 3 104,89
4 HP Lentitud para ver videos 3 125,53
5 Dell Lentitud para ver videos 3 123,97
6 HP Calidad y durabilidad del modem 4 134,66
7 Otra marca Baja velocidad en la señal 2 256,33
8 HP Otros 2 195,32
9 HP Baja velocidad en la señal 2 121,90
10 Lenovo Lentitud para ver videos 2 378,27
Complete:

Unidad elemental

¿Cuántos datos hay por unidad elemental?

¿Cuántas observaciones hay?

¿Cuántas características se están evaluando?

¿Cuántos datos hay en total?

Proporcione un ejemplo de dato cuantitativo


discreto
Proporcione un ejemplo de dato cuantitativo
continuo

Proporcione un ejemplo de observación

Ejemplo 12

A un encuestado se le preguntó la edad, sexo, zona de residencia (Lima Norte, Lima Centro, Lima
Sur, Lima, Lima Este, Provincia Constitucional del Callao), dispositivo más usado para entreteni-
miento tecnológico (laptop o PC, tableta, televisión, celular), gasto familiar aproximado mensual en
entretenimiento tecnológico, en soles, y parte del tiempo libre dedicado al entretenimiento tecno-
lógico (todo mi tiempo libre, la mayor parte de mi tiempo libre, la mitad de mi tiempo libre; una
parte reducida de mi tiempo libre).

Complete:

Cantidad de datos

Cantidad de observaciones

Ejemplo de dato cualitativo


Estadística para comunicadores 21

Ejemplo de dato cuantitativo discreto

Ejemplo de dato cuantitativo continuo

Ejemplo de observación
Estadística para comunicadores 22

Técnicas de recolección de datos


La forma de obtener la información original de las unidades elementales que componen la pobla-
ción a investigar puede ser efectuada a través de:

• Censo
• Muestreo
• Registros administrativos

Censo
Se llama censo cuando se recolecta la información de todas las unidades de la población. El méto -
do para recolectar los datos de toda la población es a través de una encuesta y es necesario que se
especifique el espacio y el tiempo al que se refiere el recuento.

Muestreo
Se realiza cuando se mide las características de una parte de la población. Es llevado a cabo, gene-
ralmente, a través de algún cuestionario que puede ser por teléfono, virtual o a través de un en-
cuestador. Se prefiere el uso de muestreo en vez de un censo principalmente por dos razones: cos-
to y tiempo.
Estadística para comunicadores 23
Estadística para comunicadores 24

Registro administrativo
Los registros administrativos son “información referida a una unidad individual –persona física, ho -
gar, empresa, etc. – que ha sido diseñada, recogida y mantenida por una determinada administra -
ción pública con el propósito de controlar o tomar decisiones relativas a esa unidad individual”. Be -
goña (2006). Los registros administrativos pueden ser privados también, de hecho, gran cantidad
de información agropecuaria, petrolera, económica, etc., tiene como fuente RRAA procedentes de
corporaciones privadas.

Son una forma económica de obtener información estadística. Sin embargo, se obtiene tal como
está disponible. Los fines del registro administrativo no siempre coinciden con los de nuestra inves-
tigación.

Es de fuente secundaria porque el investigador no la toma directamente ni bajo criterios metodo-


lógicos propios sino debido a criterios de la institución dueña del registro.

El registro administrativo posee propiedades que hacen que pueda convertirse en dato estadístico
a un bajo costo y sin perder los requisitos de calidad del dato estadístico.

Existen oficinas públicas que llevan registros administrativos para sus propios fines. Por ejemplo:
 los Registros Civiles registran nacimientos, casamientos o defunciones,
 el Ministerio de Educación que lleva registros sobre matrícula de alumnos o deserción escolar,
 la Aduana que registra las importaciones y exportaciones.

Por ejemplo, se puede consultar las páginas web de las siguientes instituciones:
Estadística para comunicadores 25

Parámetro y estadístico
Un parámetro resume una característica de la población. Para obtener su valor se hace necesario
contar con toda la información que brindan los elementos de una población.

Un estadístico resume una característica de la muestra, para obtener su valor se utiliza la informa -
ción muestral. El valor obtenido de un estimador se conoce como estimación. Al estimador se le
llama estadígrafo o estadístico.

Algunos parámetros y estadísticos:

Nombre de la medida de resumen Parámetro Estadístico


N n

Promedio ∑ xi ∑ xi
i =1 i=1
μ= x̄=
N n

Moda Mo mo

A a
Proporción p= ^p=
N n

Ejemplo 13

Se tiene una población de 30 alumnos del curso de estadística para comunicadores de la sección
AV2D. A cada alumno se le preguntó su edad y la carrera profesional. Con esos 30 datos se calculó
la media, que es 19,7 años y 6 de cada 10 alumnos estudian la carrera de comunicación y
marketing.

Complete el siguiente cuadro:

Indique si estos valores


corresponden a un parámetro o a un
estadístico

Indique la medida de resumen  Edad: …


obtenida para cada variable  Carrera profesional: …

Indique la notación y el valor de la


medida de resumen para la variable
edad
Estadística para comunicadores 26

Indique la notación y el valor de la


medida de resumen para la variable
carrera profesional

Ejemplo 14
La siguiente tabla muestra la composición del padrón electoral de las elecciones generales del
2021.

Indique los parámetros que se pueden inferir de esta tabla.


Solución
Estas medidas de resumen son parámetros, pues la tabla se refiere a toda la población de perua -
nos registrados para votar.

 Proporción de peruanos hombres que pueden votar, su notación es p y su valor es 0,496


 Moda del sexo, su notación es Mo y su valor es mujer, por tener la frecuencia más alta

Ejemplo 15
El hotel La Posada es nuevo en el mercado hotelero de Puno. La gerencia general desea invertir en
la realización de una publicidad agresiva para incrementar la cantidad de huéspedes extranjeros
por temporada en el hotel. Para ello, desea conocer que características del hotel es conveniente
resaltar en la publicidad aplicando una encuesta a una muestra aleatoria de 115 huéspedes extran -
jeros que se hospedaron entre enero y marzo del presente año. A continuación, se presenta parte
de la base de datos:

Precio dispues-
Número de
to
País de acompañantes
N° Edad Género a pagar por ha- Criterio de selección del hotel
procedencia
bitación
por viaje
(en dólares)
1 25 Masculino Inglaterra 80 0 Limpieza del dormitorio
2 35 Femenino Argentina 60 2 Precio
3 45 Masculino Francia 115 3 Buena calidad de las toallas y sábanas
4 65 Masculino Francia 45 0 Precio
5 72 Femenino Francia 55 1 Amigable y cordial staff de empleados
6 28 Masculino Estados Unidos 65 2 Precio
7 45 Femenino Estados Unidos 60 1 Precio
⋮ ⋮ ⋮ ⋮ ⋮ ⋮ ⋮
115 20 Masculino Estados Unidos 55 2 Amigable y cordial staff de empleados

Después de procesar la información se obtuvieron los siguientes resultados:


Estadística para comunicadores 27
 El 34% de los huéspedes extranjeros procede de los Estados Unidos.
 La edad promedio de los huéspedes es de 35,2 años.
 El número de acompañantes más frecuente es de dos personas.
 El criterio de selección del hotel más frecuente es el precio.

Identifique el estadístico y el valor del estadístico para cada una de las variables de la base de da -
tos.
Solución
Variable Estadístico Valor del estadístico
 Lugar de procedencia Proporción 34%, Estados Unidos
 Edad, en años Promedio 35,2 años
 Número de acompañantes Moda 2 acompañantes
 Criterio de selección del hotel Moda Precio

Ejemplo 16
Con la intención de conocer la opinión de los pacientes de los hospitales que fueron afectados por
la última huelga médica, se contrató los servicios de la consultora Access Data S.A. la cual encuestó
a 500 pacientes que acudieron a los diferentes hospitales de Lima y Callao el presente mes. Entre
los principales resultados se obtuvieron los siguientes:

 El 67,4% de los encuestados afirmó que se vieron perjudicados por la huelga médica.
 La respuesta más frecuente a la pregunta ¿Cómo calificaría la calidad de la atención que
recibe?, fue regular.
 La media del número de veces que debe acudir mensualmente al hospital es de 3,4 veces.
 El 25% de los encuestados afirmó que recibe del hospital hasta dos medicamentos por
atención.

Identifique las variables, los estadísticos y los valores del estadístico

Solución
Variable Estadístico Valor del estadístico
 Opinión respecto a si fue afectado por la huelga Proporción 0,674, sí fui afectado
 Calificación de la atención recibida Moda Regular
 Número de veces que acude al hospital al mes Media 3,4 veces
 Número de medicamentos recibidos por atención Proporción el 0,25 de los pacientes re-
cibe hasta dos medicamentos por atención.

Ejemplo 17

Un diario local publicó en su última edición dominical, un estudio realizado sobre el manejo y
desarrollo de la publicidad actual. Mencionamos a continuación algunos párrafos publicados en
este artículo:

 “...se realizó una encuesta en la ciudad de Lima a 1102 personas de 18 a 70 años elegidas al
azar...”
 “…el 52% de los encuestados señalaron que los anunciantes sí sobrepasan los límites de lo
aceptable desde el punto de vista ético y social al realizar sus campañas de publicidad” …
 “… el 40,2% de los encuestados señaló recordar el nombre del producto luego de ver el comer -
cial por TV…”
Estadística para comunicadores 28
 “… el 51,6% de los encuestados no están de acuerdo con el horario en que transmiten algunos
comerciales por TV ...”
 “... el ingreso promedio de los encuestados es de 2403 soles...”
 El encargado de este estudio, publicista peruano de 50 años mencionó: “… la publicidad es co -
municación aplaudida y criticada no sólo por su función de venta de productos, sino también
por su influencia en la economía y en la sociedad…”

Complete la siguiente tabla:

Muestra 1102 personas de 18 a 70 años de la ciudad de Lima

Variable Tipo de variable


Opinión sobre si sobrepasan los límites de lo aceptable desde el punto
Cualitativa
de vista ético y social al realizar sus campañas de publicidad
Recordación del nombre del producto luego de ver el comercial por TV Cualitativa
Aceptación del horario en que transmiten algunos comerciales por TV Cualitativa
Ingreso mensual, en soles Cuantitativa continua

Estadístico Notación del estadístico Valor del estadístico


Sí sobrepasan los límites de lo aceptable desde el
Moda mo punto de vista ético y social al realizar sus cam-
pañas de publicidad
El 0,402 de personas recuerda el nombre del
Proporción ^p
producto
El 0,516 de personas no está de acuerdo con el
Proporción ^p
horario
Media x 2403 soles
Estadística para Comunicadores 29

Ejercicios de aplicación

1. Una empresa de bebidas gaseosas está pensando lanzar una nueva bebida al mercado local, Ice
Tea. Este producto es bajo en calorías y estará dirigido a personas en edad universitaria. Se sabe
que la ciudad donde se piensa lanzar el producto cuenta con 100 000 habitantes en edad
universitaria, el 65% son mujeres, el 30% consume sólo agua mineral y el 20% estudia en
universidades particulares.

Para el estudio se consideró seleccionar una muestra de tamaño 420. Los resultados obtenidos,
luego de procesar la información, fueron los siguientes:

 La edad promedio de los encuestados es de 21,6 años.


 El 52% de los encuestados son mujeres.
 El precio promedio que pagarían por el nuevo producto es 2,70 soles.
 El 80% de los encuestados calificó el sabor de la bebida Ice Tea como muy bueno, el 10%
como bueno, el 5% como malo y el resto como muy malo.

Identifique y complete a partir del enunciado:

Población

Muestra

Defina la variable Tipo de variable

Estadístico Notación Valor del estadístico


Estadística para comunicadores 30
2. Hace un mes, una empresa de servicios realizó una encuesta a una muestra de 60 profesionales
que asistieron a una conferencia en el Colegio de Comunicadores Sociales del Perú con la
finalidad de recoger información encomendada por ciertas empresas que alquilan locales para
la organización de eventos culturales tales como: congresos, coloquios, conversatorios, etc.

Parte del cuestionario que se le pidió completar a los asistentes se presenta a continuación:

1. Sexo: Masculino  Femenino 


2. Edad: ……..... años
3. Ingreso mensual: ........... soles
4. Profesión: ....................
5. Cargo que ocupa en su empresa: .........................................
6. ¿Cuánto suele gastar por asistir a un evento cultural? .............. soles
7. ¿A cuántos congresos asistió el mes pasado? ...........
8. ¿Su empresa organiza con regularidad eventos profesionales y/o culturales? Sí  No 
9. ¿Su empresa alquila locales para organizar eventos culturales? Sí  No 

a. Indique la población, muestra y unidad elemental.


b. En base al enunciado anterior y analizando la encuesta complete lo siguiente:

Variable Tipo de variable Escala de medición

Razón

Número de congresos asistidos el


mes pasado

Cargo que ocupa en su empresa

Gasto por asistir a un evento cultu-


ral, en soles

3. Los lectores que se suscriben a la revista Buena Vida deben llenar un formato con información
personal. Indique el tipo y la escala de medida de las siguientes variables:

Variable Tipo de variable Escala de medida


Profesión

Distrito de residencia

Ingreso mensual familiar, en soles

Edad, en años

Número telefónico

Estado civil (soltero, casado, viudo, di-


vorciado)

Gasto semanal en alimentos, en soles

Centro laboral
4. La revista A empezó a circular en Lima en enero del año 2016, siendo una de las más sólidas en
Estadística para comunicadores 31
su rubro. Cuenta actualmente con 2450 suscriptores, de los cuales el 30% reside fuera de la
ciudad de Lima. Los directivos de la revista han decidido aplicar una encuesta a una muestra de
220 suscriptores con la finalidad de implementar un nuevo programa de impacto que permita
incrementar el número de suscriptores. Los resultados obtenidos, después de la aplicación,
fueron los siguientes:

 El 80% de los suscriptores está muy satisfecho, el 12% está satisfecho y sólo un 8% está in -
satisfecho.
 El 65% de los suscriptores solicita se agregue información referente a actividades recreati -
vas para programarlas en su tiempo libre.
 El 70% de los suscriptores realiza compras por Internet.

a. En base al enunciado anterior identifique la población y la muestra.


b. Complete los espacios en blanco, según el enunciado.

Identifique la variable Tipo de variable Escala de medida


Ordinal

Cualitativa

Nominal

5. Un diario publicó lo siguiente: “En la ciudad de Lima existen 313 608 mujeres que son
trabajadoras del hogar, el 72% labora en hogares del sector socioeconómico A, la mayoría no
cuenta con seguro social, la jornada laboral media es de 12,3 horas diarias y el sueldo medio es
de 655 soles mensuales.” Identifique la población, muestra y unidad elemental. Además,
proporcione un ejemplo de observación.

6. Un diario desea saber si sus suscriptores están interesados en que se ofrezcan recetas de
comidas típicas de diferentes regiones del país. El diario tiene 2 100 suscritores, de los cuales el
74% son hombres. Se seleccionó al azar 352 personas y se encontró que el 60% tiene interés
en recetas de comida típica, la edad media de los entrevistados es de 31 años y el 10% procede
de la selva.

a. Identifique la población, la muestra y el elemento.


b. Identifique qué variables se están estudiando, su tipo y escala de medición.
Estadística para comunicadores 32

Presentación tabular y gráfica de variables

Una vez recopilada la información, con las variables consideradas de mayor importancia, el siguien-
te paso es presentarla a través de una tabla de frecuencias o un gráfico que describa adecuada -
mente las características más importantes.

Un gráfico es un dibujo complementario a una tabla o cuadro, que permite observar las tendencias
de un fenómeno en estudio y facilita el análisis estadístico de las variables.

Un gráfico, al igual que un cuadro o una tabla de frecuencias, debe contar con un título y una fuen -
te. El título y la fuente de la tabla será el mismo para el gráfico.

Frecuencias absolutas, relativas y porcentuales

 La frecuencia absoluta (fi ) de una clase es la cantidad de elementos que pertenecen a esa cla-
se.

 La frecuencia relativa (hi ) de una clase es la proporción de elementos que pertenecen a esa
clase.
frecuencia absoluta f i
Frecuencia relativa ( h i )= =
número de datos n

 La frecuencia porcentual (pi) de una clase es la frecuencia relativa multiplicada por 100%.
Frecuencia porcentual ( pi ) =hi ×100 %

Elementos de la tabla de frecuencias

Título
El título de la tabla debe tener la siguiente estructura:

Distribución de <elementos> según <variable en estudio>

Fuente
Se refiere de dónde se recolectaron los datos para posteriormente ser organizados. Se ubica
siempre en la parte inferior de la tabla.

Tabla de distribución de frecuencias para variable cualitativa


Se deberá presentar en la tabla las diferentes categorías que asume la variable cualitativa y en la
columna de las frecuencias absolutas la cantidad de veces que se repite esta categoría de la varia -
ble.

 Si la medición está hecha en escala nominal sólo deberán mostrarse las frecuencias absolutas,
relativas y porcentuales.
 Si la variable cualitativa está medida en escala ordinal, tendrá sentido mostrar las frecuencias
acumuladas absolutas y relativas.
Estadística para comunicadores 33
La distribución de frecuencias es un cuadro que se obtiene de la siguiente manera:

Distribución de < elementos> según <variable en estudio>


Frecuencia porcentual
Variable Frecuencia absoluta fi Frecuencia relativa hi
pi
f1
Categoría 1 f1 h1 = p1 =h1 ×100
n
f2
Categoría 2 f2 h2 = p2 =h2 ×100
n
… … … …
fk
Categoría k fk hk = pi= hi×100
n
Total n 1,00 100%
Fuente: ……………………………………..

Tabla de distribución de frecuencias para variable cuantitativa discreta


La distribución de frecuencias es un cuadro que se calcula de la siguiente manera:

Distribución de <elementos> según <variable en estudio>


Frecuencia porcentual
Variable Frecuencia absoluta fi Frecuencia relativa hi
pi
f1
x1 f1 h1 = p1 =h1 ×100
n
f2
x2 f2 h2 = p2 =h2 ×100
n
… … … …
fk
xn fk hk = pi= hi×100
n
Total n 1,00 100%
Fuente: ……………………………………..

Tabla de distribución de frecuencias para variable cuantitativa continua


La distribución de frecuencias es un cuadro que se calcula de la siguiente manera:

Distribución de <elementos> según <variable en estudio>


Frecuen
Frecuencia
Intervalos ´ Frecuencia cia Frecuencia relativa
Marca de clase x 1 absoluta
(clases) absoluta f i relativ acumulada H i
acumulada F i
a ih
Li 1 + Ls 1 f1
[ Li 1−Ls 1 ] x ´1= f1 h1 = F 1=f 1 H 1=h 1
2 n
L i2 Ls 2
+ f2
¿ Li 2−Ls 2 ¿ ¿ ´
x 2= f2 h2 = F 2=f 2+ F 1 H 2=h2+ H 1
2 n
⋮ ⋮ ⋮ ⋮ ⋮ ⋮
Estadística para comunicadores 34
Lik + L sk fk
¿ Lik −Lsk ¿ ¿ ´
x k= fk hk= F k =f k + Fk −1 H k =hk + H k−1
2 n
Total n 1,00
Fuente:

Representación gráfica de variables cualitativas


Gráfico de barras
En el eje horizontal se colocan las categorías de la variable y en
el eje vertical las frecuencias absolutas, relativas o porcentuales.
Si la variable cualitativa es de escala ordinal, las categorías de-
ben estar ordenadas en el eje X.

Gráfico circular
En este caso las categorías de la variable cualitativa ocupan un
espacio en el círculo que es proporcional a la frecuencia que re-
presentan. También se denomina diagrama de sector circular,
gráfico tipo torta o pastel. En un gráfico circular, las etiquetas de
los sectores siempre se deben presentar en porcentaje.

Si la variable cualitativa es de escala nominal se puede usar el


gráfico de barras o circular, mientras que para una variable cuali-
tativa de escala ordinal se debe usar el gráfico de barras para
mostrar la jerarquía en el eje horizontal, de menor a mayor o de mayor a menor.

Representación gráfica de variables cuantitativas discretas


Gráfico de bastones o varas
En el eje horizontal se presentan los valores de la variable y en el
eje vertical se puede usar las frecuencias absolutas, relativas o
porcentuales.

Cada frecuencia, absoluta o relativa, se representa trazando un


bastón a la altura de cada valor de la variable sobre el eje hori-
zontal y cuya altura es proporcional a la frecuencia correspon-
diente.

Representación gráfica de variables cuantitativas continuas


Histograma
Se traza colocando la variable sobre el eje horizontal y las fre-
cuencias, absolutas o relativas, sobre el eje vertical.
Cada frecuencia de clase se representa trazando un rectángulo,
cuya base es el intervalo de clase sobre el eje horizontal y cuya
altura es proporcional a la frecuencia correspondiente.
Los rectángulos adyacentes se tocan entre sí.

Elementos indispensables que debe tener todo gráfico


Estadística para comunicadores 35
 El título principal debe ser el mismo de su tabla de frecuencias. De acuerdo con el INEI, se tiene
el siguiente esquema: Distribución de < elementos> según <variable en estudio>
 La fuente: indica de dónde se obtuvieron los datos para organizarlos
 Las etiquetas (en cantidades o porcentajes)
 El título de los ejes, X e Y
Ejemplo
El hotel La Posada es relativamente nuevo en el mercado hotelero de Puno. La gerencia general de-
sea invertir en la realización de una publicidad agresiva para incrementar la cantidad de huéspedes
extranjeros por temporada en el hotel. Para ello, desea conocer qué características del hotel es
conveniente resaltar en la publicidad. Para llevar a cabo el estudio se aplicó una encuesta a una
muestra aleatoria de 115 huéspedes extranjeros que se hospedaron en el hotel entre enero y mar-
zo del presente año.

Parte de la base de datos se presenta a continuación:

Precio dispues-
Número de
to
País de acompañan-
N° Edad Género a pagar por ha- Criterio de selección del hotel
procedencia tes
bitación
por viaje
(en dólares)
1 25 Masculino Inglaterra 80 0 Limpieza del dormitorio
2 35 Femenino Argentina 60 2 Precio
Buena calidad de las toallas y sába-
3 45 Masculino Francia 115 3 nas
4 65 Masculino Francia 45 0 Precio
Amigable y cordial staff de emplea-
5 72 Femenino Francia 55 1 dos
6 28 Masculino Estados Unidos 65 2 Precio
7 45 Femenino Estados Unidos 60 1 Precio
8 85 Masculino China 70 2 Precio
9 25 Masculino Inglaterra 65 3 Limpieza del dormitorio
10 35 Femenino Francia 45 1 Precio
⋮ ⋮ ⋮ ⋮ ⋮ ⋮ ⋮
11 Amigable y cordial staff de emplea-
20 Masculino Estados Unidos 55 2
5 dos

Presente la tabla de distribución de frecuencias y las gráficas apropiadas para cada una de las si -
guientes variables: criterio de selección del hotel, precio que estaría dispuesto a pagar por habita-
ción y número de acompañantes por viaje.

Solución
Tabla de distribución de frecuencias de la variable criterio de selección del hotel.

Título …
Criterio de selección del hotel Frecuencia frecuencia relativa Porcentaje
Amigable y cordial staff de empleados 25 0.2174 21,7%
Buena calidad de las toallas y sábanas 12 0.1043 10,4%
Limpieza del dormitorio 13 0.1130 11,3%
Opciones del Preferred guest card 6 0.0522 5,2%
Precio 39 0.3391 33,9%
Servicios "In room" 10 0.0870 8,7%
Servicios adicionales 10 0.0870 8,7%
Total 115 1 100,0
Fuente: Hotel La Posada. Puno
Estadística para Comunicadores 36

Gráfico circular

Título …

Servicios adicionales
8.7% Amigable y cordial staff de
empleados
Servicios "In room" 21.7%
8.7%

Buena calidad de las toallas y


sábanas
10.4%
Precio Limpieza del dormitorio
33.9% 11.3%

Opciones del Preferred guest card


5.2%

Fuente: Hotel La Posada. Puno

Gráfico de barras
Título …

40.0%
porcentaje de huéspedes

35.0% 33.9%

30.0%

25.0%
21.7%
20.0%

15.0%
10.4% 11.3%
10.0% 8.7% 8.7%
5.2%
5.0%

0.0%

criterio de selección del hotel

Fuente: Hotel La Posada. Puno


Estadística para comunicadores 37
Tabla de distribución de frecuencias de la variable precio que estaría dispuesto a pagar por habita-
ción, en dólares.

Título…
Frecuencia ab-
Límite Límite Marca de Frecuencia Frecuencia Frecuencia rela-
soluta acumu-
inferior superior clase absoluta relativa tiva acumulada
lada
[40 54] 47 15 0.1304 15 0.1304
]54 68] 61 47 0.4087 62 0.5391
]68 82] 75 23 0.2000 85 0.7391
]82 96] 89 16 0.1391 101 0.8783
]96 110] 103 8 0.0696 109 0.9478
]110 124] 117 3 0.0261 112 0.9739
]124 138] 131 2 0.0174 114 0.9913
]138 152] 145 1 0.0087 115 1,0000
Fuente: Hotel La Posada. Puno

Histograma
Título …
45%
40.9%
40%
35%
porcentaje de huéspedes

30%
25%
20.0%
20%
15% 13.0% 13.9%

10% 7.0%
5% 2.6% 1.7% 0.9%
0%
40-54 54-68 68-82 82-96 96-110 110-124 124-138 138-152
precio por habitación

Fuente: Hotel La Posada. Puno


Estadística para comunicadores 38
Tabla de distribución de frecuencias de la variable número de acompañantes por viaje.

Título …
Número de acompañantes
Frecuencia absoluta frecuencia relativa Porcentaje
por viaje
0 21 0,1826 18,3%
1 26 0,2261 22,6%
2 37 0,3217 32,2%
3 22 0,1913 19,1%
4 9 0,0783 7,8%
Total 115 1.00 100,0%

Fuente: Hotel La Posada. Puno

Gráfico de bastones

Título …

35%
porcentaje de huéspedes

32.2%
30%

25%
22.6%
20% 19.1%
18.3%
15%

10%
7.8%
5%

0%
0 1 2 3 4 5
número de acompañantes por viaje

Fuente: Hotel La Posada. Puno


Estadística para Comunicadores 39

Ejemplo 18
De acuerdo con los Censos Nacionales 2017 realizado por el Instituto Nacional de Estadística e In-
formática INEI se tiene la siguiente distribución de frecuencias acerca de la edad los peruanos.

Ponga título y fuente a la tabla, complete los espacios en blanco e indique el grupo quinquenal con
más peruanos.

Título: …..
Edad en grupos quinque- Frecuencia absoluta Frecuencia porcentual Frecuencia acumulada porcen-
nales fi pi tual Pi

De 0 a 4 años 2 494 300


De 5 a 9 años 2 646 324
De 10 a 14 años 2 613 427 8,89% 26,39%
De 15 a 19 años 2 422 478 8,24% 34,64%
De 20 a 24 años 2 508 736 8,54% 43,17%
De 25 a 29 años 2 386 320 8,12% 51,30%
De 30 a 34 años 2 257 102 7,68% 58,98%
De 35 a 39 años 2 122 675 7,22% 66,20%
De 40 a 44 años 1 952 661 6,65% 72,85%
De 45 a 49 años 1 707 717 5,81% 78,66%
De 50 a 54 años 1 503 225 5,12% 83,78%
De 55 a 59 años 1 269 343 4,32% 88,10%
De 60 a 64 años 1 038 505 3,53% 91,63%
De 65 a 69 años 807 902 2,75% 94,38%
De 70 a 74 años 624 512 2,13% 96,51%
De 75 a 79 años 453 554 1,54% 98,05%
De 80 a 84 años 311 125 1,06% 99,11%
De 85 a 89 años 173 467 0,59% 99,70%
De 90 a 94 años 66 537 0,23% 99,93%
De 95 a más 21 974 0,07% 100,00%
Total 29 381 884 100,00% 100,00%
Fuente: ….
Estadística para comunicadores 40

Ejercicios de aplicación

7. La siguiente infografía publicada en el 2016 por el Programa Nacional contra la Violencia


Familiar y Sexual del Ministerio de la Mujer y Poblaciones Vulnerables (MIMP) muestra la
Radiografía de la violencia contra la mujer peruana.
Estadística para comunicadores 41
A partir de la infografía, responda a las siguientes preguntas:

a. El porcentaje de mujeres peruanas víctimas de violencia familiar y sexual que no son adultas
mayores es ...%.
b. El porcentaje de mujeres peruanas menores de 60 años víctimas de violencia familiar y sexual
es …%
c. El porcentaje de mujeres peruanas víctimas de violencia familiar y sexual que han sufrido
feminicidio por parte de sus parejas o exparejas es …%
d. En el mes de enero del 2016, se atendieron …… casos de violencia familiar y sexual en los
Centros de Emergencia Mujer, de los cuales, el ….% de los casos corresponde a violencia
femenina.
e. Indique el título de cada uno de los siguientes gráficos:

Título: …

Título: …
Estadística para Comunicadores 42

Medidas de resumen
Las medidas de resumen sirven para describir en forma resumida un conjunto de datos que consti-
tuyen una muestra tomada de alguna población.

Podemos clasificar las medidas de resumen en: las medidas de tendencia central, las medidas de
posición y medidas de dispersión.

En esta unidad trabajaremos las medidas descriptivas únicamente con datos simples o no agrupa-
dos; es decir, con valores que no están agrupados en tablas de distribución de frecuencia.

Medidas Medidas de tendencia Media


de central

resumen Mediana

Moda

Medidas de posición o Percentil


cuantiles

Cuartil

Decil

Medidas de dispersión Rango

Varianza

Desviación estándar

Coeficiente de variación
Estadística para comunicadores 43

Medidas de tendencia central

Son aquellas medidas que localizan el centro de una distribución, indicando el valor alrededor del
cual tienden a concentrarse o distribuirse las demás observaciones.

Media Mediana Moda

El objetivo es conseguir un valor que sea representativo del conjunto de datos analizado.

Media
La media aritmética (media o promedio) de un conjunto de datos de una variable es la suma de di-
chos valores dividida entre la cantidad de valores.

La media poblacional es el parámetro y se calcula con la siguiente fórmula:

∑ xi
μ= i=1
N

La media muestral es el estadístico y se calcula con la siguiente fórmula:

∑ xi
x= i=1
n

En Excel se usa la función: =PROMEDIO

El número promedio de notas publicadas por los periodistas del Popular es igual a 10,5 notas.

Calcular el promedio usando la calculadora científica

Para ingresar al modo estadístico, presio-


1
ne la tecla MODE y elija la opción 3:STAT

2 En la lista que aparece, elija la op-


ción 1:1-VAR
Estadística para comunicadores 44

Ahora aparecerá una columna rotu-


3
lada por X. Digite el número que de-
sea ingresar y a continuación presio-
ne la tecla igual (=).
Cuando termine de ingresar todos
los datos presione la tecla AC

4 Presione SHIFT + 1. En el listado que


aparece elija la opción 4:Var

5 De la lista, elija la opción 2 para el


promedio

6 Para que se muestre el valor numéri-


co debe presionar la tecla (=)

Características de la media

 Se puede calcular para datos medidos en escala de intervalo o razón.


 El valor de la media es sensible a los valores extremos o atípicos que la distorsionan.
 El cálculo de la media es sencillo y fácil de entender e interpretar.

Ejemplo 19
El Instituto Nacional de Estadística e Informática informó que, en el trimestre setiembre-octubre-
noviembre del 2020, el ingreso medio mensual proveniente del trabajo fue de 1514,40 soles en
Lima Metropolitana, reduciéndose en 14,3% (-253,10 soles) al compararlo con similar trimestre del
año 2019. El ingreso medio de los hombres fue de 1700 soles y el de las mujeres de 1390 soles. In -
terprete el valor del ingreso medio mensual proveniente del trabajo en Lima Metropolitana.

Solución
En Lima Metropolitana, el ingreso medio mensual proveniente del trabajo estuvo alrededor de
1514,40 soles en el trimestre setiembre-octubre-noviembre del 2020.
Estadística para Comunicadores 45

Ejemplo 20
La información corresponde al número de notas publicadas por un grupo de periodistas del diario
Popular durante el último mes. Calcule e interprete el valor del promedio del número de notas pu -
blicadas.

12 9 8 11 10 16 14 7 10 10 6 13

Solución
La media muestral se calcula con:

12+9+8+11+10+16 +14+7+ 10+10+6+13


x= =10,5
12

El número promedio de notas publicadas por los periodistas del Popular es igual a 10,5 notas.
El número de notas publicadas por los periodistas del Popular está alrededor de 10,5 notas.

En Excel se usa =PROMEDIO(A1:A12) = 10,5

Ejemplo 21
La Liga de Naciones de Voleibol Femenino de 2019 fue la segunda edición del torneo anual más
importante de selecciones nacionales de voleibol femenino, el evento fue organizado por la
Federación Internacional de Voleibol (FIVB) y contó con 16 equipos. En la figura se muestra algunas
jugadoras de la selección de Serbia. Calcule la media de la estatura de estas jugadoras.

Luego la media muestral es x = 186,56 cm.


La estatura de las jugadoras de voleibol de Serbia está alrededor de 185,56 cm.
La estatura promedio de las jugadoras de voleibol de Serbia es de 185,56 cm.
Estadística para Comunicadores 46

Ejercicios de aplicación

8. Carlos, estudia por las mañanas en la UPC en la Facultad de Comunicaciones y por las tardes
trabaja en el diario El Comercio. En una muestra de 10 días del último mes transcurrido registró
su gasto diario, en soles. Los resultados se muestran a continuación:

Gasto diario
40 35 32 48 25 25 30 33 42 50
(en soles)

Identifique la unidad elemental y calcule e interprete la media del gasto diario de Carlos.

9. A continuación, se presenta la información de una muestra de empleados de la compañía A.

Empleado Ingreso mensual (soles) Experiencia laboral (años)


1 2020 4,6
2 3410 8,8
3 1967 2,1
4 1630 1,2
5 2502 5,2
6 1677 1,1
7 4286 4,9
8 2952 2,8

Calcule e interprete el valor de la media de cada una de las variables.

Variable Valor del promedio Interpretación

Ingreso mensual,
en soles

Experiencia labo-
ral, en años
Estadística para Comunicadores 47

Mediana
La mediana de un conjunto de datos ordenados es el valor que ocupa la posición central y divide al
conjunto de datos en dos partes iguales.

El 50% de las unidades elementales El 50% de las unidades elementales


presentan valores iguales o menores a la presentan valores mayores a la mediana
mediana

Mediana(Me)

Cálculo de la mediana

Si i es un valor decimal, se
redondea. El valor entero
inmediato mayor que i indica la
Calcular la posición i de la posición de la mediana.
mediana usando la
Ordenar los datos de
siguiente fórmula: i = 0,5n
menor a mayor
donde n es el tamaño de
muestra Si i es un valor entero, la
mediana es el promedio de los
valores de los datos ubicados en
los lugares i e i+1.

En Excel se usa la función: =MEDIANA

Características de la mediana

 Se puede calcular para variables medidas en escala de ordinal, intervalo o razón.


 El valor de la mediana depende del número de datos observados.
 La mediana es un estadístico que no se ve afectado por valores extremos (mínimo y máximo).
Por eso se le utiliza cuando hay datos inusuales o el polígono de frecuencias no es simétrico.

Ejemplo 22
La siguiente información corresponde al número de notas publicadas por un grupo de periodistas
del diario Popular durante el último mes.

12 9 8 11 10 16 14 7 10 10 6 13

Calcule e interprete el valor de la mediana del número de notas publicadas por los periodistas del
diario Popular.

Solución
Ordenamos los datos de menor a mayor

6 7 8 9 10 10 10 11 12 13 14 16

Como n = 12, entonces el valor de la posición i es, según fórmula:


Estadística para comunicadores 48
i=0,5 ×12=6

Como i es entero, entonces:


X [6 ]+ X [7 ] 10+10
me= = =10
2 2

Mediana = 10
En Excel se usa =MEDIANA(A3:A14) = 10

Interpretación:

 El 50% de los periodistas del diario Popular publicaron, durante el último mes, como máximo
diez notas periodísticas.
 El 50% de los periodistas del diario Popular publicaron, durante el último mes, de diez notas
periodísticas a menos.

Ejemplo 23
La Liga de Naciones de Voleibol Femenino de 2019 fue la segunda edición del torneo anual más im -
portante de selecciones nacionales de voleibol femenino, el evento fue organizado por la Federa -
ción Internacional de Voleibol (FIVB). En la figura se muestra algunas jugadoras de la selección de
República Dominicana. Calcule e interprete la mediana de la estatura de estas jugadoras.
Estadística para Comunicadores 49

Solución
Primero, ordenamos los datos de menor a mayor

Posición 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15


Estatura 167 171 174 182 183 183 186 186 188 188 190 190 194 196 201

Luego, calculamos la posición de la mediana.

La posición i es

i=0,5 n=0,5 ×15=7,5

Como 7,5 es un número no entero, entonces la mediana es el valor en la posición i = 8.


Luego la mediana es aquel valor que se encuentra en la posición 8, es decir, me = 186 cm.
En Excel se usa =MEDIANA(A4:A18) = 186

Interpretación:

 El 50% de las jugadoras de voleibol de República Dominicana miden 186 cm o menos.


 El 50% de las jugadoras de voleibol de República Dominicana miden hasta 186 cm.
 El 50% de las jugadoras de voleibol de República Dominicana miden como máximo 186 cm.

Ejercicios de aplicación

10.Carlos estudia por las mañanas en la UPC en la facultad de Comunicaciones y por las tardes
trabaja en un diario local. En una muestra de 10 días del mes enero y siete del mes de febrero
registró su gasto diario, en soles. Los resultados se muestran a continuación:

Gasto diario enero 40 35 32 48 25 25 30 33 42 50


Gasto diario febrero 27 35 32 48 25 25 30      

Calcule e interprete el valor de la mediana del gasto diario para cada mes.

Mes Valor de la mediana Interpretación

Enero

Febrero
Estadística para comunicadores 50
11.A continuación, se presenta la información de la experiencia laboral, en años, de una muestra
de nueve empleados la editorial Kero y seis empleados de la editorial Esparta.

Experiencia laboral en Kero 10,5 6,3 2,5 1,2 3,4 4,9 7,8 5,5 0,9
Experiencia laboral en Esparta 4,6 8,8 2,1 1,2 5,2 1,1

Calcule e interprete el valor de la mediana de la experiencia laboral para cada editorial.

Editorial Valor de la mediana Interpretación

Kero

Esparta
Estadística para Comunicadores 51

Moda
La moda de un conjunto de datos observados de una variable es el valor que se presenta con ma -
yor frecuencia.

En Excel se usa: =MODA:VARIOS


Esta función se usa por si en el conjunto de datos existiera más de una moda.
Los valores deben ser numéricos
Si el conjunto de datos no tiene moda, =MODA.VARIOS devuelve el valor de error #N/A.

Características de la moda
 La moda se puede calcular para cualquier escala de medición.
 El valor de la moda no se ve afectada por valores extremos.
 Si un conjunto de datos tiene una sola moda se dice que es unimodal, si tiene dos modas se dice
que es bimodal y si tiene más de dos modas se dice que es polimodal.
 Algunas series de datos no tienen moda.
 La moda es una medida menos importante que la mediana o la media debido a su ambigüedad.

Ejemplo 24
En el estudio “Conociendo al nuevo vacacionista nacional”, realizado por PromPerú, en agosto de
2020, indique el valor de la moda de la variable <medio de transporte para llegar a su destino>

Solución
La moda es bus, es decir, mo = bus
Interpretación: El medio de transporte más frecuente para llegar al destino deseado es el bus.
Estadística para Comunicadores 52

Ejemplo 25
La siguiente información corresponde al número de notas publicadas por un grupo de periodistas
del diario Popular durante el último mes:

12 9 8 10 10 16 14 7 10 10 6 13

Calcule e interprete el valor de la moda del número de notas publicadas por los periodistas del dia -
rio.
Solución
Moda = mo = 10
En Excel se usa: =MODA.VARIOS(A3:A14) = 10

Interpretación: El número de notas publicadas con mayor frecuencia, durante el último mes, fue-
ron diez.

Ejemplo 26
La Liga de Naciones de Voleibol Femenino de 2019 fue la segunda edición del torneo anual más im -
portante de selecciones nacionales de voleibol femenino, el evento fue organizado por la Federa -
ción Internacional de Voleibol (FIVB) y contó con 16 equipos. En la figura se muestra algunas juga-
doras de la selección de China. Calcule e interprete la moda de la estatura de estas jugadoras.

Moda = mo = 187
En Excel se usa: =MODA.VARIOS(A3:A14) = 187
La estatura más frecuente de las jugadoras chinas es 187 cm.
Estadística para Comunicadores 53

Ejercicios de aplicación

12.A continuación, se presenta la información de una muestra aleatoria de 15 profesionales


egresados de la carrera de Administración.

Estatura Núme- Estatura


Número Género Edad Género Edad
(en cm) ro (en cm)
1 Femenino 15 154 9 Femenino 22 168
2 Femenino 19 154 10 Masculino 31 161
3 Femenino 21 156 11 Masculino 31 171
4 Femenino 34 184 12 Masculino 28 175
5 Femenino 21 173 13 Masculino 31 187
6 Femenino 24 170 14 Masculino 28 161
7 Femenino 30 176 15 Masculino 24 172
8 Femenino 26 188

Calcule e interprete la moda de la estatura para cada género.

13.Calcule e interprete la moda de la edad de un grupo de trabajadores clasificados por género.

Hombres 35 28 24 35 28 24 35 23 30 20
Mujeres 22 31 20 30 22 27 28 20 34 22

Calcule e interprete la moda de la edad para cada grupo.


Estadística para comunicadores 54

Forma de la distribución de los datos

Además de las medidas de tendencia central y dispersión, podemos estar interesados en determi -
nar la forma que presenta el conjunto de datos que se está analizando.

Relación entre media, mediana y moda

Para usar la relación entre las medidas de tendencia central se requiere que los datos tengan una
sola moda.

 Si los datos se distribuyen con igual frecuencia y alejamiento por debajo y por encima de la me -
dia, se dice que la distribución es simétrica.
 Si los datos por debajo de la media son más frecuentes que aquellos por encima de la media o
viceversa, se dice que la distribución es asimétrica.

A continuación, se presentan las formas de la distribución de un conjunto de datos:

media < mediana < moda media = mediana = moda moda < mediana < media
Asimétrica negativa Simétrica Asimétrica positiva
Sesgo izquierdo o negativo sesgo nulo Sesgo derecho o positivo
Datos concentrados en Datos concentrados Datos concentrados en
valores altos alrededor de la media valores bajos

En Excel se usa la función: =COEFICIENTE.ASIMETRIA,


Excel emplea en su algoritmo la siguiente fórmula:

Ejemplo 27
Indique la forma de la distribución (positiva /negativa) que seguramente deben tener las siguientes
variables:

a. Sueldos mensuales en el Perú


b. Tiempo dedicado en dar el examen final de este curso
c. Edad de los peruanos
Estadística para comunicadores 55

Solución
a. Sesgo positivo, porque hay muchos sueldos concentrados en valores bajos.
b. Sesgo negativo, porque muchas personas toman todo el tiempo posible para dar el examen.
c. Sesgo positivo, porque hay más niños que personas de la tercera edad en el Perú.

Ejemplo 28

Complete los siguientes textos:

 Si un grupo de datos tiene un coeficiente de asimetría negativo, esto significa que hay una
concentración de datos en los valores …

 Si un grupo de datos tiene un coeficiente de asimetría positivo, esto significa que hay una
concentración de datos en los valores …

 La asimetría de los sueldos de los trabajadores en un país como el Perú seguramente será …
(positiva/negativa) pues…

 En un examen difícil de Estadística, la asimetría de los tiempos que toman los alumnos en re-
solverlo seguramente será … (positiva/negativa) pues …

 Según los gráficos, la edad de los peruanos tiene asimetría …, mientras que la edad de los japo-
neses tiene asimetría …. (positiva/negativa). Para el caso peruano, comparando los años 2007 y
2017, hay una menor concentración en edades ... (bajas/altas)

Perú: Distribución porcentual de peruanos según edad por sexo. 2007 Y 2017

Fuente: Instituto Nacional de Estadística e Informática - Censos Nacionales de Población y Vivienda.


Estadística para comunicadores 56
Japón: Distribución porcentual de japoneses según edad por sexo. 2017

Ejemplo
Un estudiante de la carrera de Comunicaciones revisó durante 11 días el ranking del Instituto Pe-
ruano de Marketing (IPM) de la industria publicitaria en Internet. A continuación, se presenta el lis -
tado que elaboró de acuerdo con el número de visitas, por día, a la página web www.netjoven.pe.

Número de visitas por


4000 3200 3600 3500 3000 3250 2900 3400 3450 2800 3200
día a la página web

A partir de las medidas de tendencia central indique la relación y grafique la forma de la distribu -
ción del número de visitas.

Solución
Como el valor de la moda = 3200 < mediana = 3250 < media = 3300, enton-
ces la distribución del número de visitas, por día, es asimétrica positiva.

En Excel se usa: =COEFICIENTE.ASIMETRIA(A4:A14) = 0,4984 > 0

Interpretación: El número de visitas, por día, a la página web presentan


una distribución asimétrica positiva con sesgo derecho. Esto quiere decir,
que el número de visitas, por día, a la página web www.netjoven.pe está concentrado en valores
bajos.
Estadística para comunicadores 57

Ejercicios de aplicación

Ejemplo 29

14.Un grupo de alumnos de la facultad de Ciencias de la Comunicación de la carrera de Publicidad


se interesó en analizar el tiempo, en segundos, que tardan las personas en recordar al
supermercado cuyo eslogan es “Precios más bajos siempre”.

Este trabajo se aplicó en el distrito A de la ciudad de Lima, los resultados obtenidos se muestran
a continuación.

Tiempo
9,0 7,8 10,3 9,2 5,6 7,4 7,3 5,0 12,4 5,1 11,8 3,4 5,0
(en segundos)

Determine la forma de la distribución de los tiempos de recordación del slogan en este distrito.
Presente la gráfica e interprete la forma de la distribución en términos del problema.

15.Frenéticos combates, grandes recompensas, una diversión duradera. El fenómeno «Fortnite» va


rompiendo moldes. El videojuego multijugador en línea ha popularizado, junto a
«PlayerUnknown's Battlegrounds (PUBG)», el estilo de juego conocido como battle royale, que
consiste en competir todos contra todos para ver quién queda el último.

Una encuestadora, al seleccionar una muestra de usuarios, para cada juego, obtuvo los
siguientes resultados:

 Para un jugador de Fortnite: el número de horas de juego a la semana tiene media de 10,5;
mediana de 9 y moda de 6,3.
 Para un jugador de PUBG: el número de horas de juego a la semana tiene media de 7,1; me -
diana de 7,5 y moda de 8,0.

La empresa iGame quiere regalar algunas suscripciones anuales a su revista. Este regalo estará
dirigido a los usuarios de Fortnite o PUBG, cuyos tiempos de juego estén concentrados en valo-
res altos. Indique si se regalarán las suscripciones a los usuarios de Fortnite o PUBG. Presente
las gráficas para cada caso.
Estadística para comunicadores 58

Juego Asimetría Concentración

Fortnite

PUBG

16.Para los Censos nacionales de los años 1993, 2007 y el 2017 se tiene las siguientes pirámides
poblacionales de la edad de los peruanos.

En todos los censos, la edad de los peruanos ha presentado sesgo ……………..

17.Según los Censos 2017: XII de Población, VII de Vivienda y III de Comunidades Indígenas se tiene
los siguientes resultados para la edad de los peruanos.

Medida de resumen Lima Loreto


Media 33,05 años 27,14 años
Mediana 31,00 años 23,00 años
Moda 25,00 años 8,00 años

a. Para cada región, indique la forma y seleccione el gráfico que permita ver la forma de la dis-
tribución de la edad de los peruanos.

Lima: … Forma …
Estadística para comunicadores 59
Loreto: … Forma …

b. ¿Qué semejanzas y diferencias encuentra entre la distribución de las edades en ambas re-
giones?
Estadística para comunicadores 60

Medidas de posición: Cuantiles

Los cuantiles son los valores de la distribución que la dividen en partes iguales, es decir, en interva -
los que comprenden el mismo número de valores.

Percentiles
Dividen el conjunto de datos en 100 partes porcentualmente iguales.

El k% de las unidades elementales presentan El (100 – k)% de las unidades elementales


valores iguales o menores al percentil k, Pk presentan valores mayores al percentil k, Pk

Pk

Cuartiles
 Dividen el conjunto de datos en cuatro partes porcentualmente iguales.
 Se les denota como Q1, Q2 y Q3 respectivamente. Su equivalente en percentiles es, respectiva-
mente, P25, P50, P75.

Deciles
 Dividen el conjunto de datos en 10 partes porcentualmente iguales.
 Se les denota como D1 , D2, D3, …, D9 respectivamente. Su equivalente en percentiles es, respec-
tivamente, P10, P20, ..., P90.

Ejemplo
Si queremos determinar el puntaje mínimo para que un alumno pertenezca al quinto superior de
su facultad, debemos calcular el percentil 80.

P80
El 80% de los estudian- El 20% de los es-
tes tienen un puntaje tudiantes tienen
menor o igual al per- un puntaje ma-
centil 80. yor al percentil
80.
Estadística para comunicadores 61

Cálculo del percentil

Si i es un valor decimal, se
redondea. El valor entero
Calcule la posición i del inmediato mayor que i indica la
percentil usando la posición del percentil.
Ordene los datos en siguiente fórmula:
forma ascendente
donde k es el percentil y n Si i es un valor entero, el
es el tamaño de muestra percentil es el promedio de los
valores de los datos ubicados en
los lugares i e i+1

En Excel se usa: =PERCENTIL.EXC (matriz;k)

Donde:
 Matriz: es la matriz o conjunto de datos
 K: es el valor del percentil entre 0 y 1, inclusive

Cuando se usa esta función, los datos no necesitan estar ordenados. PERCENTIL. EXC interpolará
cuando el valor del percentil especificado se encuentra entre dos valores de la matriz. 

Ejemplo 30
A continuación, se presentan los sueldos mensuales, en soles, de 12 periodistas.

2710 2755 2850 2880 2880 2890 2920 2940 2950 3050 3130 3325

a. Determine el percentil 25
b. Determine el percentil 85

Solución
Observe que los datos ya se encuentran ordenados.

a. Determine el percentil 25

Calculemos la posicióni
nk 25× 12
i= = =3
100 100

El valor de i es un número entero, entonces el percentil buscado será el promedio de los valores de
los datos ubicados en los lugares 3 y 4.

2710 2755 2850 2880 2880 2890 2920 2940 2950 3050 3130 3325

X [3 ]+ X [4 ] 2850+ 2880
P25= = =2865
2 2
Interpretación:
El 25% de los periodistas tiene un sueldo mensual máximo de 2865 soles.
El 25% de los periodistas tiene un sueldo mensual de 2865 soles a menos.
Estadística para comunicadores 62
El 25% de los periodistas tiene un sueldo mensual hasta 2865 soles.
En Excel se usa: =PERCENTIL.EXC (A3:A14;0.25) = 2857.5
Observe que ambos valores no coinciden porque Excel interpola cuando el valor del percentil espe -
cificado se encuentra entre dos valores de la matriz. 

b. Determine el percentil 85

Calculemos la posicióni .
nk 85× 12
i= = =10,2
100 100

Redondeando a más se tiene que i = 11, por tanto, su valor será P85 = 3130.

2710 2755 2850 2880 2880 2890 2920 2940 2950 3050 3130 3325

En Excel se usa: =PERCENTIL.EXC (A3:A14;0.85) = 3139.75


Observe que ambos valores no coinciden porque Excel interpola cuando el valor del percentil espe -
cificado se encuentra entre dos valores de la matriz. 

Interpretación:
El 85% de los periodistas tiene un sueldo mensual máximo de 3130 soles.
El 85% de los periodistas tiene un sueldo mensual de 3130 soles a menos.
El 85% de los periodistas tiene un sueldo mensual hasta 3130 soles.

Ejemplo 31
En la figura se muestran los datos de algunos jugadores de la selección peruana de fútbol y su edad
en agosto del 2020. Calcule e interprete el percentil 75 de la edad de estos jugadores.
Estadística para comunicadores 63

Solución
Primero, ordenamos los datos.

Posición 1 2 3 4 5 6 7 8 9 10 11 12


Edad 21 24 25 25 25 26 26 27 27 28 28 28

Posición 13 14 15 16 17 18 19 20 21 22 23
Edad 28 29 30 30 30 30 30 31 31 35 36

Calculemos la posición i del percentil 75 usando la siguiente fórmula:

kn 75 × 23
i= = =17,25
100 100

donde k es el percentil y n es el tamaño de muestra.

Como i no es número entero, entonces el percentil 75 será el valor en la posición 18, P75 = 30 años.

Interpretación:
El 75% de los jugadores de la selección peruana de fútbol tiene 30 años o menos.
El 75% de los jugadores de la selección peruana de fútbol tiene como máximo 30 años.
El 75% de los jugadores de la selección peruana de fútbol tiene hasta 30 años.

Ejemplo 32
Rosa María Augusta Palacios McBride es una abogada y periodista peruana. Actualmente conduce
el programa Sin Guion, trasmitido por YouTube en el canal RTV-La República, programa sobre polí-
tica peruana. Se desea calcular algunas medidas de posición sobre el número de visualizaciones de
sus videos en la primera quincena de agosto del 2020. El número de visualizaciones corresponde
hasta el domingo 16 de agosto.

Título del vídeo Día de estreno Número de visualizaciones


Educación sin censura 14 de agosto del 2020 40 893
Las políticas del Estado nos están matan-
13 de agosto del 2020 60 743
do a todos
No es extraño que lo haya obtenido, lo ex-
12 de agosto del 2020 46 903
traño son los 115 votos
La única forma en que Martos gane está
11 de agosto del 2020 32 079
en manos de APP
Mañana le dan la confianza a Martos 10 de agosto del 2020 51 143
García Bealunde: Señala a su bancada que
7 de agosto del 2020 64 429
no pueden votar a favor de un ladrón
Al Congreso: “Espero que decidan dejar
6 de agosto del 2020 54 092
de jugar contra el Perú”
El presidente puede ser vacado por el
5 de agosto del 2020 74 315
Congreso, pero sería inconstitucional
Sobre censura al gabinete Cateriano: “Es
4 de agosto del 2020 106 132
un acto de traición al país”
La presidencia del Consejo de Ministros
3 de agosto del 2020 43 138
está bajo extorsión del Congreso
Estadística para comunicadores 64

a. Calcule e interprete el valor del cuartil 3.

Solución

La unidad elemental es cada uno de los vídeos del programa Sin Guión.

Primero, ordenamos los datos de la cantidad de visualizaciones.

10613
32079 40893 43138 46903 51143 54092 60743 64429 74315
2

El cuartil 3 corresponde al percentil 75. Calculemos la posición i del percentil 75 usando la fór-
mula:

kn 75 × 10
i= = =7,5
100 100

donde k es el percentil y n es el tamaño de muestra.

Como i no es número entero, entonces el percentil 75 será el valor en la posición 8, P75 = 64429
visualizaciones.

Esto quiere decir que, el 75% de los vídeos del programa Sin Guion tuvo 64 429 visualizaciones
o menos.

b. Calcule e interprete el valor del percentil 80.

Solución
Calculemos la posición i del percentil 80 usando la fórmula:

kn 80× 10
i= = =8
100 100

donde k es el percentil y n es el tamaño de muestra.

Como i = 8 es número entero, entonces el percentil 80 será el promedio de los valores en la po -


sición 8 y 9.

10613
32079 40893 43138 46903 51143 54092 60743 64429 74315
2

X [ 8] + X [ 9] 64429+74315
P80= = =69372
2 2

Esto quiere decir que, el 80% de los vídeos del programa Sin Guion tuvo 69 372 visualizaciones
o menos.
Estadística para comunicadores 65

c. Calcule e interprete el valor del decil 2.

Solución
Calculemos la posición i del percentil 20 usando la fórmula:

kn 20× 10
i= = =2
100 100

donde k es el percentil y n es el tamaño de muestra.

Como i = 2 es número entero, entonces el percentil 20 será el promedio de los valores en la po -


sición 2 y 3.

10613
32079 40893 43138 46903 51143 54092 60743 64429 74315
2

X [2 ]+ X [3 ] 40893+ 43138
P20 = = =42 015,5
2 2

Esto quiere decir que, el 20% de los vídeos del programa Sin Guion tuvo 42 015,5 visualizacio-
nes o menos.

d. ¿Cuál debe ser el mínimo valor del número de visualizaciones diarias para pertenecer al 15% de
sus videos más vistos?

Solución
Calculemos la posición i del percentil 85 usando la fórmula:

kn 85× 10
i= = =8,5
100 100

donde k es el percentil y n es el tamaño de muestra.

Como i no es número entero, entonces el percentil 85 será el valor en la posición 9, P85 = 74315
visualizaciones.

10613
32079 40893 43138 46903 51143 54092 60743 64429 74315
2

Esto quiere decir que, el valor mínimo de visualizaciones para pertenecer al 15% de sus videos
más vistos es 74 315.

e. ¿Cuál debe ser el máximo valor del número de visualizaciones diarias para pertenecer al 30% de
sus videos menos vistos?

Solución
Calculemos la posición i del percentil 20 usando la fórmula:
Estadística para comunicadores 66

kn 30× 10
i= = =3
100 100

donde k es el percentil y n es el tamaño de muestra.

Como i = 3 es número entero, entonces el percentil 20 será el promedio de los valores en la po -


sición 3 y 4.

10613
32079 40893 43138 46903 51143 54092 60743 64429 74315
2

X [3 ]+ X [4 ] 43138+46903
P20 = = =45020,5
2 2

Esto quiere decir que, el valor máximo de visualizaciones para pertenecer al 30% de sus videos
menos vistos es 45 020,5.
Estadística para comunicadores 67

Ejercicios de aplicación

18.Una compañía publicitaria solicitó al área de Recursos Humanos información sobre las ventas
(en miles de soles) obtenidas durante el último mes de los 10 nuevos vendedores. Los datos se
presentan a continuación:

1300 1210 950 1200 1910 700 1300 1020 1500 870

a. Calcule e interprete el valor del cuartil 3.


b. Calcule e interprete el valor del decil 7.
c. ¿Cuál debe ser el valor de la venta mínima que debe tener el vendedor nuevo para perte-
necer al 15% de los que más venden?
d. ¿Cuál debe ser el valor de la venta máxima de un vendedor nuevo para pertenecer al 20%
de los vendedores con las más bajas ventas?

19.Papa Jim's Pizza es una cadena de restaurantes. La corporación acredita su crecimiento al


excelente servicio al cliente, a la calidad de sus productos y a la simplicidad del menú. El estudio
realizado por la encuestadora WGS, a 120 personas mayores de 18 años de Lima Metropolitana
que consume Papa Jim's Pizza por lo menos una vez al mes, arrojó los siguientes resultados:
Para una muestra de clientes mujeres de la tienda de Miraflores, los estadisticos de la variable
monto gastado en el último pedido, en soles  son los siguientes:

Media Mediana Moda Percentil 25 Cuartil 3 Desviación estándar


83,4 78,5 75,5 70 86 40,67

Para una muestra de clientes hombres, los datos de la variable monto gastado en el último pe-
dido, en soles  son los siguientes:
35 60 72 90 80 50 70 89 80 80 65 120 45 63 78
80 75 71 67 100 40 69 80 85 80 75 90 68 90 80

La gerencia de la tienda de Miraflores desea ofrecer una nueva promoción de fin de semana.
Los clientes beneficiados serán aquellos que pertenezcan al quinto superior de la variable
<monto gastado en el último pedido>. Indique el valor del monto mínimo que debe considerar
la gerencia.

20.La empresa iGame desea categorizar a los jugadores de Fornite de acuerdo con el dinero que
gastan en micropagos dentro del juego. Las categorías son las siguientes:
 Categoría A: aquel jugador que está en el cuarto superior con respecto al gasto.
 Categoría B: aquel jugador que no es ni A ni C.
 Categoría C: aquel jugador que está en el cuarto inferior con respecto al gasto.
Para la categorización se usará una muestra de jugadores, en la que ha registrado la cantidad de
dinero gastada en micropagos, en dólares, dentro de Fortnite.
10 13 13 15 16 17 18 18 20 29 20 23 23 24 25
28 29 30 31 34 35 36 38 38 39 40 41 43 44 45
50 50 51 51 52 53 53 53 54 54 55 67 70 76 80
81 85 96 110 115 120 130 140 150 155 160 165 165 200 218
Indique el gasto mínimo y máximo para ser considerado un jugador de la categoría B.
Estadística para comunicadores 68

Medidas de variabilidad o dispersión

Con las medidas de tendencia central es posible determinar el valor central de una distribución,
pero no indican qué tan cercanos o alejados están los datos de dicho valor central.

Las medidas de variabilidad indican cuán alejados están los valores de una variable del valor que
los representa y por lo tanto permiten evaluar la confiabilidad de ese valor central.

Cuando la medida de dispersión tiene un valor pequeño, los datos están concentrados alrededor
de la medida central, en cambio si la medida de dispersión tiene un valor grande, los datos no es-
tán concentrados alrededor de la medida central.

Las medidas de dispersión son las siguientes:

Rango El rango es la diferencia entre el dato mayor y el dato menor.

Varianza Es el promedio de los cuadrados de las desviaciones de los datos respecto


de su media aritmética.

Desviación Es la raíz cuadrada positiva de la varianza.


estándar

Coeficiente de Indica el porcentaje que es la desviación estándar en comparación con la


variación media.
Estadística para comunicadores 69

Rango
El rango (alcance, amplitud o recorrido) de un conjunto de datos observados es la diferencia entre
dato mayor (Xmax) y el dato menor (Xmin).

R = Xmáx - Xmín

Características del rango


 Se puede calcular en variables medidas en escala de intervalo o razón
 Se ve muy afectado por valores extremos.

Ejemplo 33
Ante la pregunta sobre el número de hijos por familia, una muestra de 12 hogares marcó las res-
puestas mostradas a continuación:

2 1 2 4 1 3 2 3 2 0 5 1

Calcule e interprete el valor del rango.

Solución
El rango R = máximo – mínimo = 5 - 0 = 5. La dispersión para el número de hijos por familia es de
cinco hijos.

Varianza
Se define como el promedio de los cuadrados de las desviaciones de los datos respecto de su me -
dia aritmética. Mide el grado de dispersión o variación de los valores de una variable con respecto
a su media aritmética.

La varianza tiene las unidades de la variable en estudio, pero elevada al cuadrado. Por ejemplo, si
la variable tiene unidades centímetros (cm), entonces la varianza tendrá como unidades cm 2.

Se denota por 2 (varianza poblacional) y s2 (varianza muestral).

La varianza poblacional es un parámetro y se calcula con la siguiente fórmula:

∑ ( xi −μ )2
σ 2= i=1
N

La varianza muestral es un estadístico y se calcula con la siguiente fórmula:

∑ ( x i−x )2
2 i=1
s=
n−1
Estadística para comunicadores 70

Si d = ( x i−x ) , entonces la fórmula de la varianza muestral se reduce a: s2 = ∑ d2


n−1
En Excel se usa: =VAR.S para obtener la desviación estándar muestral y =VAR.P para obtener la des-
viación estándar poblacional.

Desviación estándar
Es la raíz cuadrada de la varianza. La desviación estándar tiene las mismas unidades de la variable
en estudio. Por ejemplo, si la variable tiene unidades centímetros (cm), entonces, la desviación es-
tándar tendrá como unidades centímetros (cm).

Se denota por  (desviación estándar poblacional) y s (desviación estándar muestral).

La desviación estándar poblacional es un parámetro y se calcula con la siguiente fórmula:


N

∑ ( xi −μ )2
i=1
σ=
N

La desviación estándar muestral es un estadístico y se calcula con la siguiente fórmula:


n

∑ ( x i−x )2
i=1
s=
n−1

Si d = ( x i−x ) , entonces la fórmula de la desviación estándar muestral se reduce a: s =



En Excel se usa: =DESVEST.M para obtener la desviación estándar muestral y =DESVEST.P para ob-
∑ d2
n−1

tener la desviación estándar poblacional.

Características de la varianza y la desviación estándar


 La varianza y la desviación estándar son números reales no negativos.
 Se pueden calcular para variables medidas en escala de intervalo o razón.
 Se ven afectadas por valores extremos o atípicos.
 La varianza se expresa en unidades al cuadrado, mientras que la desviación estándar se expresa
en las mismas unidades de la variable en estudio.

¿Cómo se obtiene la varianza y la desviación estándar, qué miden?

A continuación, se presentan las edades de una muestra de tres niños, en años: 2, 3 y 10

Tamaño de muestra: n = …… y promedio x = ……

Para que esta barra


esté en equilibrio, es
decir, para que no se
incline a ningún lado
2 3 4 5 6 7 8 9 10 ¿dónde se colocaría
el punto de apoyo?
Estadística para comunicadores 71
A continuación, se hallará la distancia de cada edad con respecto a su media:

Edad d = xi -−x d2
2 2 - 5 = -3 La varianza quiere medir
3 3 - 5 = -2 cuánto se alejan los datos
10 10 - 5 = 5 respecto a la media
Suma 0

Usando la calculadora:

La varianza muestral: Varianza muestral: s2 = …. = …. años2

2
s =
∑ d2 Desviación estándar muestral: s = √ s2 = …… años
n−1

Ahora, ingrese los siguientes datos a la


calculadora: 2, 3, 10 y obtenga la desvia-
ción estándar muestral

Finalmente, se obtienen los valores de s = …… años y s2 = … años2


En Excel se usa: =DESVEST.M y VAR.M

Ejemplo 34
Un estudiante de la carrera de Comunicaciones revisó durante once días el ranking del Instituto Pe-
ruano de Marketing (IPM) de la industria publicitaria en Internet. A continuación, se presenta el lis -
tado que elaboró de acuerdo con el número de visitas por día a la página web: www.netjoven.pe

Número de visitas por día a


4000 3200 3600 3500 3000 3250 2900 3400 3450 2800 3200
la web www.netjoven.pe

Además, la cantidad de visitas a la página web www.mujeractiva.com se presenta a continuación:

Número de visitas por día a la 320 430 420 420 410 410 430
4700 4400 4200
web www.mujeractiva.com 0 0 0 0 0 0 0

Calcule el valor de la desviación estándar de ambas páginas web.


Estadística para comunicadores 72

Solución
La desviación estándar del número de visitas por día a la web www.netjoven.pe es 342,78 y la des-
viación estándar del número de visitas por día a la web www.mujeractiva.com es 383,12.

En Excel se usa:
Para www.netjoven.pe: =DESVEST.M(A3:A13) = 342,78
Para www.mujeractiva.com: =DESVEST.M(A17:A26) = 383,12
Estadística para comunicadores 73

Ejercicios de aplicación

21.A continuación, se presenta la información de una muestra aleatoria de 15 profesionales


egresados de la carrera de Ciencias de la Comunicación.

Nº Género Estatura Nº Género Estatura


1 Masculino 154 9 Femenino 154
2 Masculino 156 10 Femenino 184
3 Masculino 173 11 Femenino 170
4 Masculino 176 12 Femenino 168
5 Masculino 188 13 Femenino 182
6 Masculino 161 14 Femenino 172
7 Masculino 173 15 Femenino 154
8 Masculino 187

Calcule el valor de la desviación estándar y el valor de la varianza de la estatura, en centímetros,


para cada género.
Estadística para comunicadores 74

Coeficiente de variación

Las medidas de variación estudiadas anteriormente son medidas de variación absolutas pues estas
se expresan en las mismas unidades que la variable original (excepto la varianza que se expresa en
unidades al cuadrado).

El coeficiente de variación proporciona una estimación de la magnitud de las desviaciones con


respecto a la media.

El coeficiente de variación poblacional es un parámetro y se calcula por la siguiente fórmula:

σ
CV = × 100 %
μ

El coeficiente de variación muestral es un estadístico y se calcula por la siguiente fórmula:

s
CV = ×100 %
x

Características del coeficiente de variación

 Es una medida de dispersión relativa libre de unidades.


 Es útil al comparar la variabilidad de dos o más series de datos que se expresan en distintas o
iguales unidades, pero difieren a tal punto que una comparación directa de las respectivas des -
viaciones estándar no es muy útil, por ejemplo, cuando las medias están muy distantes.
 El coeficiente de variación se calcula en variables medidas en escala de razón.
 Cuando el coeficiente de variación es mayor se dice que los datos son más heterogéneos o que
existe mayor dispersión. Si el coeficiente de variación es menor, entonces se dice que los datos
son más homogéneos o que existe menor dispersión.

Ejercicio
Observe las dos imágenes siguientes.

Tomado de http://gastronomiaycia.republica.com/

Complete los siguientes textos, con respecto a la variabilidad de los tamaños de las manzanas.

a. En el grupo de la izquierda hay mayor ………………………. en el peso de las manzanas.


b. En el grupo de la izquierda hay menor ………………………. en el peso de las manzanas.
Estadística para comunicadores 75
c. En el grupo de la derecha hay mayor ………………………. en el peso de las manzanas.
d. En el grupo de la derecha hay menor ………………………. en el peso de las manzanas.
e. Seguramente en el grupo de manzanas a la izquierda, el coeficiente de variación del peso de
las manzanas es ………………………. al coeficiente de variación del grupo a la derecha.
Solución
a. En el grupo de la izquierda hay mayor homogeneidad en el peso de las manzanas.
b. En el grupo de la izquierda hay menor heterogeneidad/variabilidad/dispersión en el peso de las
manzanas.
c. En el grupo de la derecha hay mayor heterogeneidad en el peso de las manzanas.
d. En el grupo de la derecha hay menor homogeneidad en el peso de las manzanas.
e. Seguramente en el grupo de manzanas a la izquierda, el coeficiente de variación del peso de
las manzanas es menor al coeficiente de variación del grupo a la derecha.

Ejemplo 35
A continuación, se presenta la información de una muestra aleatoria de 15 profesionales egresados
de la carrera de Ciencias de la Comunicación.

Género Edad Estatura Género Edad Estatura Género Edad Estatura


Masculino 22 154 Masculino 31 161 Femenino 24 170
Masculino 21 156 Masculino 28 173 Femenino 27 168
Masculino 21 173 Masculino 35 187 Femenino 18 182
Masculino 30 176 Femenino 33 154 Femenino 39 172
Masculino 26 188 Femenino 34 184 Femenino 33 154

a. ¿Qué género presenta mayor variabilidad en la estatura?


b. ¿Qué género presenta menor dispersión en la edad?

Solución
a. ¿Qué género presenta mayor variabilidad en la estatura?

Género Media Desviación estándar Coeficiente de variación


13,05
Masculino 171 cm 13,05 cm CV M = × 100 %=7,63 %
171
10,06
Femenino 169 cm 10,06 cm CV F = ×100 %=5,95 %
169

Por lo tanto, el género que presenta mayor variabilidad de estatura es el masculino porque su
coeficiente de variación es el mayor (7,63% > 5,95%).

b. ¿Qué género presenta menor dispersión en la edad?

Género Media Desviación estándar Coeficiente de variación


5,1755
Masculino 26,75 años 5,1755 años CV M = × 100 %=19,87 %
26,75
7,1114
Femenino 29,71 años 7,1114 años CV F = × 100 %=23,94 %
29,71
Estadística para comunicadores 76
Por lo tanto, el género que presenta menor dispersión es masculino porque tiene un coeficiente
de variación menor.
22.A continuación, se presenta un listado del número de visitas, por día, a la página web
www.netjoven.pe y a la página www.mujeractiva.com.

Número de visitas por día a


4000 3200 3600 3500 3000 3250 2900 3400 3450 2800 3200
la web www.netjoven.pe

Número de visitas por día a


3200 4300 4700 4400 4200 4200 4200 4100 4100 4300
web www.mujeractiva.com

Si se decide comparar la variabilidad de la cantidad de visitas ¿cuál de las dos páginas web tiene
datos más homogéneos?

Página web Media Desviación estándar Coeficiente de variación

Netjoven

Mujeractiva

Por lo tanto, …

23.A continuación, se presentan los costos de producción (en dólares) por segundo de animación
en 2D del último trabajo encargado a una empresa nacional. Los datos de una muestra de
comerciales de TV y otra de películas se muestran a continuación:

Comerciales de TV 28 25 30 21 27 22 23 29 26 24
Películas 34 33 32 29 36 37 35 34 31  

¿Son los costos de producción por segundo de animación más homogéneos en los comerciales
de TV que en las películas?

Producto Media Desviación estándar Coeficiente de variación

Comerciales

Películas

Por lo tanto, …
Estadística para comunicadores 77
Estadística para Comunicadores 78

Ejercicio de aplicación

24.Papa Jim's Pizza es una cadena de restaurantes. La corporación acredita su crecimiento al


excelente servicio al cliente, a la calidad de sus productos y a la simplicidad del menú. El estudio
realizado por la encuestadora WGS, a 120 personas mayores de 18 años de Lima Metropolitana
que consume Papa Jim's Pizza por lo menos una vez al mes, arrojó los siguientes resultados:
Para una muestra de clientes mujeres de la tienda de Miraflores, los estadisticos de la variable
monto gastado en el último pedido, en soles  son los siguientes:
Media Mediana Moda Percentil 25 Cuartil 3 Desviación estándar
85,4 78,5 72,0 70 90 25,67

Para una muestra de clientes hombres, los datos de la variable monto gastado en el último pe-
dido, en soles  son los siguientes:
60 60 72 90 56 50 70 89 76 80 65 120 45 63 78
80 76 71 67 100 40 69 80 85 80 75 90 68 90 80

La gerencia de la tienda de Miraflores desea realizar las siguientes acciones para mejorar la
fidelización de sus clientes.

a. Se desea realizar una promoción diferenciada por sexo. El género beneficiado será aquél que
presente mayor variabilidad en el monto gastado en el último pedido. ¿Qué sexo será beneficia-
do?
b. Se ha decidido determinar la forma de la distribución del monto gastado en el último pedido
por sexo. El plan de mejora se priorizará al género que presente una distribución asimétrica po -
sitiva en la variable analizada.
c. Además, la empresa desea ofrecer una promoción de fin de semana, diferenciada por sexo,
para aquellos clientes que estén en el 25% de los clientes que gastaron menos en el último pe -
dido. ¿Cuál debe ser el valor del gasto máximo, en cada grupo?

25.Según los Censos 2017: XII de Población, VII de Vivienda y III de Comunidades Indígenas se tiene
los siguientes resultados para la cantidad de personas en un hogar.

Medida de resumen Lima Loreto


Media 3,56 personas 4,24 años
Mediana 3,00 personas 4,00 personas
Moda 3,00 personas 4,00 personas
Desviación estándar 2,00 personas 2,29 personas

¿En cuál de las dos ciudades se presenta mayor variabilidad en la cantidad de personas en un
hogar en el Perú?

26.Los datos representan resúmenes del puntaje asignado a dos comerciales del mismo producto.

Medida de resumen Media Mediana Moda Desviación estándar Tamaño de muestra


Comercial 1 5 4 3 1,0 10
Comercial 2 3 4 5 1,6 15
Estadística para comunicadores 79
Identifique verdadero (V) o falso (F) según corresponda, de ser falso indique dónde está el
error.

a. La forma de la distribución del comercial 2 es asimétrica negativa. Rpta. V


b. Sí la forma de la distribución de uno de los comerciales es asimétrica negativa, entonces
quiere decir que existe mayor concentración de datos con valores bajos. Rpta. F
c. La medida de tendencia central más representativa en el comercial 1 es la mediana.
Rpta. V
d. El puntaje recibido en el comercial 2 es menos disperso que el comercial 1. Rpta. F

27.Un grupo de alumnos de publicidad se interesó en analizar el tiempo de recordación, en


segundos, que tardan las personas en recordar al supermercado cuyo eslogan es “Precios más
bajos siempre”.

Este trabajo se aplicó a tres distritos de Lima. Los resultados obtenidos para cada grupo se
muestran a continuación:

Distrito A 9,0 7,80 10,3 9,2 5,6 7,4 7,3 5,0 12,4 5,1 11,8 3,4 5,1

Distritos Media Mediana Moda Desviación estándar Tamaño de muestra

Distrito B 4,252 4,96 5,10 2,979 17

Distrito C 5,338 4,85 3,86 2,593 16

a. Interprete las medidas de tendencia central del tiempo de recordación en el distrito Espe -
ranza.
b. ¿Qué distrito presenta mayor variabilidad en los tiempos de recordación?
Rpta: El que tenga mayor cv
c. Calcule e interprete el valor del tercer cuartil para el tiempo de recordación del eslogan en
el distrito América. Rpta: Percentil 75
d. ¿Cuál es el tiempo máximo que tardó el 25% de las personas que recordaron más rápida-
mente el eslogan en el distrito América? Rpta: Percentil 25
e. Indique la forma de la distribución de los tiempos de recordación en el distrito Central.
Rpta: Asimetría positiva

28.A continuación, se muestran los resultados obtenidos del número de notas publicadas por un
grupo de periodistas de tres diarios locales durante el último mes:

Siglo XXI Actualidad


Media 9,5 Media 13,3
Mediana 10,3 Mediana 12,0
Moda 12,0 Moda 10,0
Varianza 76,110 Varianza 21,952
Tamaño de muestra 10 Tamaño de muestra 15
P20 7,6 P75 16,5
P80 12,0 P25 10,0

Publis 12 9 8 11 10 16 14 7 10 10 6 13
Estadística para comunicadores 80

a. ¿Cuál es la forma de la distribución del número de notas publicadas por los periodistas del
diario Actualidad? Rpta. Asimetría positiva
b. ¿En cuál de los diarios locales el número de notas publicadas es más homogéneo?
Rpta. La que tenga menor cv.
c. ¿Cuál es el mínimo número de notas publicadas por los periodistas del diario Siglo XXI para
pertenecer al 20% de periodistas que más artículos escribe? Rpta: Percentil 80
d. ¿Cuál el máximo número de notas que debe publicar un periodista del diario Publis para
pertenecer al 25% de periodistas con menos notas publicadas? Rpta: Percentil 75

29.Un joven egresado de la carrera de Ciencias de la Comunicación tiene la invitación laboral de


dos prestigiosas agencias publicitarias internacionales. La agencia A de ellas ofrece sueldos en
dólares y la agencia B en euros.

Para tomar la decisión de a cuál de ellas aceptar la invitación recopila datos correspondientes a
los sueldos mensuales pagados en cada una de ellas, los mismos que se presentan en la siguien-
te tabla:

Agencia Media Mediana Moda Desviación estándar Tamaño de muestra


Agencia A 1295,75 1241 1230 436,57 20
Agencia B 1148,80 1180 1400 343,52 15

En base a la información anterior, responda las siguientes preguntas:

a. Defina la variable en estudio, determine su tipo y escala de medición.


Rpta: sueldo mensual, cuantitativa continua, razón
b. En la agencia A ¿qué sueldo es el más frecuente? Rpta: 1230
c. ¿Cuánto gana como mínimo el 50% de los empleados con los mejores sueldos de la agencia
B? Rpta: 1180
d. Si se recomienda aceptar la invitación de aquella agencia con sueldos más estables, esto es
con menos riesgos de variación, ¿qué agencia considera usted que conviene elegir?
Rpta: Agencia B

30.La siguiente información corresponde al tiempo de servicio, en meses, de una muestra de


publicistas que laboran en dos conocidas agencias de la capital.

Agencia Media Mediana Moda Desviación estándar Tamaño de muestra


Omega 18,93 14,0 6,0 15,78 16
Sigma 19,64 15,0 11,0 94,284 25

a. Interprete las medidas de tendencia central de la agencia Omega.


b. ¿Qué forma presenta la distribución del tiempo de servicio de los publicistas de la agencia
Sigma? Rpta: Asimetría positiva
c. ¿En cuál de las agencias publicitarias el tiempo de servicio es más homogéneo?
Rpta: El que tenga menor cv
Estadística para Comunicadores 81

Tabulaciones cruzadas

También llamadas tablas de contingencia o tablas de doble entrada.


Se usan para resumir de manera simultánea los datos de dos variables.

Título de una tabla cruzada


Si la tabla presenta las frecuencias absolutas o las frecuencias porcentuales con respecto al gran
total, el título será:

Distribución de <elementos> según <variable 1> y <variable 2>

Si el gráfico presenta las frecuencias porcentuales con respecto a la variable 2, el título será:

Distribución de <elementos> según <variable 1> por <variable 2>

Ejemplo 36
Se tiene información de una muestra de 805 hogares según nivel socioeconómico y área de resi -
dencia. Los resultados se presentan a continuación:

Distribución de hogares según nivel socioeconómico y área de residencia


Área de residencia
Nivel socioeconómico Total
Área urbana Área rural
Nivel socioeconómico A 15 2 17
Nivel socioeconómico B 48 3 51
Nivel socioeconómico C 105 145 250
Nivel socioeconómico D 94 175 269
Nivel socioeconómico E 38 180 218
Total 300 505 805
Fuente: Empresa A S.A.

De la tabla anterior, complete los espacios en blanco:

a. Número de hogares que pertenecen al NSE C o D: ................................


b. Son ............... hogares que pertenecen al NSE C y son del área urbana.
c. Del total de hogares del área rural, el ..........................% son del NSE E.
d. Del total de hogares del NSE D, el .......................% son del área urbana.

Solución
a. Número de hogares que pertenecen al NSE C o NSE D: 519.
b. Son 105 hogares que pertenecen al NSE C y son del área urbana.
c. Del total de hogares del área rural, el 35,64% son del NSE E.
d. Del total de hogares del NSE D, el 34,94% son del área urbana.
Estadística para comunicadores 82

Ejemplo 37
Los directivos de la agencia publicitaria Tres Picos quieren implementar un programa de motiva-
ción para sus trabajadores. Para ello, se solicitó a cada trabajador realizar una autoevaluación (cali -
ficación a sí mismo) de su nivel de desempeño profesional en lo que va del año. Los resultados de
una muestra de 120 trabajadores clasificados de acuerdo con su cargo se presentan a continua-
ción:

Distribución de trabajadores según cargo y nivel de desempeño profesional


Nivel de desempeño profesional
Cargo Total
Excelente Bueno Regular Deficiente
Gerente 0 3 2 0 5
Director de medios 2 2 5 1 10
Planificador 3 6 8 2 19
Jefe de medios 4 15 12 0 31
Redactor 8 29 14 4 55
Total 17 55 41 7 120
Fuente: Agencia Tres Picos

Complete los espacios en blanco.

a. La cantidad de trabajadores que son de redactores o jefes de medios es …….


b. La cantidad de trabajadores que calificaron su desempeño como mínimo bueno es …….
c. Del total de trabajadores, el ……. son redactores.
d. Del total de jefe de medios, el …….% calificaron su desempeño profesional como bueno.
e. Del total que calificaron su desempeño profesional como regular, …….% son gerentes.

Solución

a. La cantidad de trabajadores que son de redactores o jefes de medios es 86 (31 + 55).


b. La cantidad de trabajadores que calificaron su desempeño como mínimo bueno es 72 (55 + 17).
55
c. Del total de trabajadores, el ×100 %=45,83% son redactores.
120
15
d. Del total de jefe de medios, el ×100 %=48,39% calificaron su desempeño profesional
31
como bueno.
2
e. Del total que calificaron su desempeño profesional como regular, el × 100 %=4,88 % son
41
gerentes.
Estadística para comunicadores 83

Ejercicios de aplicación

31.La actividad de la animación es la menos arraigada del sector de la producción de


entretenimiento. Por ser transferible culturalmente, es posible tomar contratos desde cualquier
parte del mundo. Bajo este contexto, un equipo de jóvenes profesionales está decidido en
enrumbar en la producción de la animación en 2D y 3D.

Sabiendo que el negocio es de escala internacional, uno de los miembros de este equipo
propuso realizar un pequeño estudio sobre el comportamiento del mercado y la competencia al
cual se enfrentarían.

La siguiente tabla resume la información presentada en el reporte final donde se muestra la es -


pecialización de un total de 242 producciones y la región de origen:

Título ...
Región Películas y TV Juegos en computadora Otros Total
Norteamérica 80 27 10 117
Europa 10 25 18 53
Asia 12 23 37 72
Total 102 75 65 242
Fuente: Empresa A

Complete:

a. Del total de producciones, ………………………….. proceden de Norteamérica y son especializa-


das en juegos de computadoras.
b. De las producciones que proceden de Asia, las que son especializadas en juegos de compu -
tadoras representan el …………………………%.
c. Del total de películas y TV, el …………………% proceden de Europa.
d. La moda para el caso de Europa es ………………………………………………………………………….
Estadística para comunicadores 84

Gráfico de barras comparativas (agrupadas o apiladas)

 Un gráfico de barras agrupadas muestra todas las series en una sola barra por cada categoría. El
alto de cada barra es proporcional a la frecuencia de cada categoría.

 Un gráfico de barras apiladas muestra todas las series apiladas en una sola barra para cada cate-
goría. El alto de cada barra es proporcional a la frecuencia de cada categoría.

 Un gráfico de barras apiladas 100% muestra todas las series apiladas en una sola barra para
cada categoría. El alto de cada barra es el mismo para cada categoría.

 Una manera ordenada de presentarlo es teniendo en cuenta si la tabla de doble entrada corres-
ponde al total general o si ella corresponde al total de fila o al total de columna.

Ejemplo 38

El área de marketing de una empresa llevó a cabo un estudio de liderazgo para determinar la rela -
ción que tienen sus trabajadores con la gerencia. A continuación, se muestra la información de una
muestra de 122 trabajadores clasificados según su función.

Distribución de trabajadores según su función y relación con la gerencia


Relación con la gerencia
Función Total
Buenas Regulares Malas
Apoyo/adm. 18 2 20
Obrero 10 29 20 59
Profesional 11 6 17
Técnico/ventas 19 7 26
Total 58 44 20 122
Estadística para comunicadores 85
Fuente: Empresa A
Las tablas de frecuencias relativas y sus respectivos gráficos se muestran a continuación:

Con respecto al gran total

Distribución de trabajadores según su función y relación con la gerencia


Relación con la gerencia
Función Total
Buenas Regulares Malas
Apoyo/adm. 14.75% 1.64% 0.00% 16.39%
Obrero 8.20% 23.77% 16.39% 48.36%
Profesional 9.02% 4.92% 0.00% 13.93%
Técnico/ventas 15.57% 5.74% 0.00% 21.31%
Total 47.54% 36.07% 16.39% 100.00%
Fuente: Empresa A

Distribución de trabajadores según su función y relación con la


gerencia

25% 24%
Porcentaje de trabajadores

20%
16%
16%
15% Buenas
15%
Regulares
Malas
10% 9%
8%
6%
5%
5%
2%
0%
Apoyo/adm. Obrero Profesional Técnico/ventas

Fuente: Empresa A Función

Interpretación
 Del total de trabajadores, el 16,4% son de Apoyo/adm.
 Del total de trabajadores, el 47,5% manifestaron tener una buena relación con la gerencia.
 Del total de trabajadores, el 23,8% son obreros y manifestaron tener una regular relación con la
gerencia.

Con respecto al total de columnas

Distribución de trabajadores según su función por tipo de relación con la gerencia


Relación con la gerencia
Función
Buenas Regulares Malas
Apoyo/adm. 31,03% 4,55% 0,00%
Obrero 17,24% 65,91% 100,00%
Profesional 18,97% 13,64% 0,00%
Técnico/ventas 32,76% 15,91% 0,00%
Estadística para comunicadores 86
Total general 100,00% 100,00% 100%

Distribución de trabajadores según su función por tipo de relación con la


gerencia
Porcentaje de trabajadores
100%
100%
90%
80%
70% 66% Apoyo/adm.
60% Obrero
50% Profesional
Técnico/ventas
40% 33%
31%
30%
20% 17% 19% 14% 16%
10% 5%
0%
Buenas Regulares Malas
Fuente: Empresa A
Relación con la gerencia

 Del total de trabajadores que tienen una buena relación con la gerencia, el 31% son de Apoyo/
adm.
 Del total de trabajadores que tienen una mala relación con la gerencia, el 100% son obreros.

Con respecto al total de filas


Distribución de trabajadores según relación con la gerencia por función
Relación con la gerencia
Función Total
Buenas Regulares Malas
Apoyo/adm. 90,00% 10,00% 0,00% 100,00%
Obrero 16,95% 49,15% 33,90% 100,00%
Profesional 64,71% 35,29% 0,00% 100,00%
Técnico/ventas 73,08% 26,92% 0,00% 100,00%

Distribución de trabajadores según su relación con la gerencia por función


Porcentaje de trabajadores

100%
90%
90%
80% 73%
70% 65%
60% Buenas
49% Regulares
50%
Malas
40% 34% 35%
30% 27%
20% 17%
10%
10%
0%
Apoyo/adm. Obrero Profesional Técnico/ventas
Fuente: Empresa
A Función

 Del total de trabajadores de Apoyo/adm., el 90% tiene una buena relación con la gerencia.
 Del total de obreros, el 17% tiene una buena relación con la gerencia.
Estadística para comunicadores 87

Ejemplo 39
Un productor musical entrevistó a 425 personas. A cada una de ellas les pidió escuchar una canción
para determinar el grado de identificación de su género musical preferido. Elabore el gráfico de ba -
rras apiladas con respecto al gran total.

Distribución de personas según género musical preferido y grado de identificación


Género musical preferido Plenamente Medianamente No identifica Total
Reggaetón 35% 3% 4% 42%
Vals 23% 7% 6% 36%
Cumbia 13% 8% 1% 22%
Total 71% 18% 11% 100%
Fuente: Productor musical

Solución

Distribución de personas según género musical preferido y grado de identifi-


cación
45%
Porcentaje de encuestados

40% 4%

35% 3%
6%
30%
7% No identifica
25% 1% Medianamente
20% Plenamente
35% 8%
15%
10% 23%

5% 13%

0%
Reggaeton Vals Cumbia
Género musical
Fuente: Productor musical

Ejemplo 40

Para realizar un gráfico apilado al 100% con respecto a género musical preferido (fila).

Distribución de personas según grado de identificación por género musical preferido


Género musical preferido Plenamente Medianamente No identifica Total
Reggaetón 84% 7% 9% 100%
Vals 63% 19% 18% 100%
Cumbia 59% 37% 4% 100%
Fuente: Productor musical
Estadística para comunicadores 88

Solución

Distribución de personas según grado de identificación por género musical


preferido

100%
Porcentaje de encuestados
9% 4%
90% 18%
7%
80%
37%
70% 19%
60% No identifica
50% Medianamente
40% 84% Plenamente
30% 63% 59%
20%
10%
0%
Reggaeton Vals Cumbia

Fuente: Productor musical


Género musical

Ejemplo 41
Se tiene información de una muestra de 805 hogares según nivel socioeconómico y área de ubica-
ción. Los resultados se presentan a continuación.

Área de ubicación
Nivel socioeconómico Total
Área urbana Área rural
Nivel socioeconómico A 15 2 17
Nivel socioeconómico B 48 3 51
Nivel socioeconómico C 105 145 250
Nivel socioeconómico D 94 175 269
Nivel socioeconómico E 38 180 218
Total 300 505 805
Fuente: Empresa de Medios A

a. ¿Cuál es el título que debe llevar tabla?


b. Interprete, en porcentaje, el valor 145 de la celda sombreada.
c. Coloque título al gráfico.
Estadística para comunicadores 89

25%
21.7%22.4%
20%
Porcentaje de hogares
18.0%

15% 13.0%
11.7% NSE A
NSE B
10% NSE C
6.0% NSE D
4.7%
5% NSE E
1.9%
0.2% 0.4%
0%
Área rural Área urbana
Área de ubicación
Fuente: Empresa de Medios A

d. Complete la tabla y haga el gráfico respectivo.

Área de ubicación
Nivel socioeconómico Total
Área urbana Área rural
Nivel socioeconómico A 100%
Nivel socioeconómico B 100%
Nivel socioeconómico C 100%
Nivel socioeconómico D 100%
Nivel socioeconómico E 100%
Total 100%
Fuente: Empresa de Medios A

e. A partir de la información anterior, complete los siguientes textos.

“Del total de hogares, ……….. de ellos están en zona rural y son de nivel socioeconómico B”
“De los hogares del nivel socioeconómico D, el …….…..% se encuentran en la zona urbana”
“De los hogares, el ………..% son, por lo menos, de nivel socioeconómico B”

Solución

a. ¿Cuál es el título que debe llevar tabla?

Distribución de hogares según nivel socioeconómico y área de ubicación

b. Interprete, en porcentaje, el valor 145 de la celda sombreada.

145
×100 %=18,01 % .
con respecto al total general 805
El 18,01% de hogares es de NSE C y pertenecen área rural.
con respecto al total de fila 145
×100 %=58 % .
250
Estadística para comunicadores 90
El 58% de hogares del NSE C pertenece al área rural.
145
con respecto al total de co- ×100 %=28,71 %.
505
lumna
El 28,71% de hogares del área rural son de NSE C.

c. Coloque título al gráfico.

Distribución de hogares según nivel socioeconómico y área de ubicación

d. Complete la tabla y el gráfico siguientes.

Distribución de hogares según área de ubicación por nivel socioeconómico


Área de ubicación
Nivel socioeconómico Total
Área urbana Área rural
Nivel socioeconómico A 88,2% 11,8% 100%
Nivel socioeconómico B 94,1% 5,9% 100%
Nivel socioeconómico C 42,0% 58,0% 100%
Nivel socioeconómico D 34,9% 65,1% 100%
Nivel socioeconómico E 17,4% 82,6% 100%
Total 37,3% 62,7% 100%
Fuente: Empresa de Medios A

e. A partir de la información anterior, complete los siguientes textos.


“Del total de hogares, 3 de ellos están en zona rural y son de nivel socioeconómico B”
“De los hogares del nivel socioeconómico D, el 34,9% se encuentran en la zona urbana”
“De los hogares, el 8,5% son, por lo menos, de nivel socioeconómico B”
Estadística para comunicadores 91

Ejercicios de aplicación

32.La siguiente tabla fue elaborada el Instituto Peruano de Marketing (IPM) y muestra al grupo de
profesionales de Ciencias de la Comunicación del semanario “Ultima Hora”. La clasificación se
realizó de acuerdo con la categoría laboral y nivel salarial.

  Nivel salarial
Categoría laboral Bajo Medio Alto Total
Jefe de sección 46 54 57 157
Redactor 61 60 23 144
Colaborador 73 47 29 149
Total 180 161 109 450
Fuente: Instituto Peruano de Marketing (IPM)

a. Coloque título a la tabla.

b. Interprete, en porcentaje, el valor 23 de la celda sombreada, con respecto al total general,


con respecto al total de fila y con respecto al total de columna

con respecto al gran total

con respecto al total de fila

con respecto al total de


columna

c. Complete la siguiente tabla cruzada para elaborar el siguiente gráfico: Distribución porcen-
tual de profesionales según nivel salarial por categoría laboral.

Título: …………………….………………………………………………………………………………………………………..

  Nivel salarial
Categoría laboral Bajo Medio Alto Total
Jefe de sección 29,3%

Redactor 42,4%

Colaborador 49,0%
Fuente: Instituto Peruano de Marketing (IPM)

d. Elabore el gráfico para la tabla anterior.


Estadística para comunicadores 92
33.Un ejecutivo de la empresa de medios A está interesado en conocer qué medio de
comunicación es más eficiente evaluando el éxito o fracaso de los reportes periodísticos
difundidos. La siguiente tabla resume la información:

Distribución de reportes periodísticos según medio de comunicación y condición de éxito


El reporte tuvo éxito
Medio de comunicación Total
Sí No
Prensa 67 15 82
Radio 12 19 31
Televisión 67 28 95
Total 146 62 208
Fuente: Empresa de Medios A

a. Presente la tabla que tenga el siguiente título: “Distribución de reportes periodísticos según
condición de éxito por medio de comunicación”.

Distribución de reportes periodísticos según condición de éxito por medio de comunicación


El reporte tuvo éxito
Medio de comunicación Total
Sí No
Prensa
Radio
Televisión
Total
Fuente: Empresa de Medios A

b. Elabore un gráfico para la tabla anterior.


Estadística para comunicadores 93

Unidad 2. Probabilidad y distribución


normal de probabilidad

Logro
Al término de la unidad 2, el estudiante aplica la teoría de la probabilidad
para la toma de decisiones en base a datos históricos.

Temario

Probabilidad

Concepto de experimento aleatorio, espacio muestral y evento


Eventos mutuamente excluyentes
Operaciones con eventos
Concepto de probabilidad
Cálculo de probabilidades en tablas de doble entrada

Distribución normal de probabilidad

Función de densidad de probabilidad


Propiedad de la distribución normal y normal estándar
Uso de la tabla de la normal estándar
Cálculo de probabilidades y percentil
Estadística para comunicadores 94

Experimento aleatorio
Es un proceso que, al ser realizado u observado repetidas veces, bajo las mismas condiciones, ge-
nera más de un posible resultado que no puede ser determinado de antemano.

Experimento aleatorio: E: lanzar un dado

Experimento determinista
Es aquel en el que se puede predecir el resultado de su realización y existe ley o fórmula matemáti-
ca que permite explicarlo. Los experimentos de la física son deterministas. Por ejemplo, el movi-
miento de caída libre.

Experimento: E: lanzar un dado

Espacio muestral
Es el conjunto de todos los posibles resultados que genera un experimento aleatorio. Se denota
mediante el símbolo Ω . Cada elemento del espacio muestral se denomina punto muestral.

Espacio muestral: Ω = {1, 2, 3, 4, 5, 6}

Evento
Es un subconjunto del espacio muestral. Se denotan por letras mayúsculas de nuestro alfabeto, por
ejemplo, A y B.

Experimento: E: lanzar un dado


Espacio muestral: Ω = {1, 2, 3, 4, 5, 6}

Evento A: Obtener el número 1, entonces A = {1}


Evento B: Obtener un número par, entonces B = {2,4,6}

Eventos mutuamente excluyentes


Diremos que dos eventos, A y B, son mutuamente excluyentes en el mismo espacio muestral si no
pueden ocurrir juntos. Por lo tanto, A y B son eventos excluyentes si y solo si A Ç B = f.

Sea el experimento : Contar el número de personas atendidas en un banco en un periodo de tiem-


po.
Sean los eventos:

A= se atiendan a menos de 20 personas A = { 0, 1, 2,…, 19}


B= se han atendido exactamente a veinticinco personas B = {25}
Como A Ç B =, entonces los eventos son mutuamente excluyentes.
Estadística para comunicadores 95

Operaciones con eventos

Intersección
La intersección de dos eventos A y B es el evento que ocurre si tanto A como B ocurren en una sola
realización del experimento.

La intersección de los eventos A y B se denota mediante el símbolo A ∩ B

Unión
La unión de dos eventos A y B es el evento que ocurre si A o B, o ambos ocurren en una sola
realización del experimento.

La unión de dichos eventos se denota mediante el símbolo A ∪B

La probabilidad de la unión de los eventos A y B es la suma de las probabilidades de los eventos A y


B menos la probabilidad de la intersección de los eventos A y B:

P( A ∪ B)=P( A)+ P(B)−P( A ∩B)

A B

AB

Complemento
El complemento de un evento A es el evento en el que A no ocurre, es decir, el evento formado por
todos los eventos simples que no están en el evento A. El complemento del evento A se denota
mediante el símbolo A’ o Ac.

c
A ∪ A =¿

Ac
A

La suma de las probabilidades complementarias es igual a 1.

P( A)+ P( A c )=1
Por lo tanto,
P( A c )=1 – P( A)
Estadística para comunicadores 96

Probabilidad
Es una medida de la posibilidad de ocurrencia de un evento. Los conceptos probabilísticos se apli-
can sobre experimentos aleatorios.

Definición clásica de probabilidad


Algunos autores definen la probabilidad como una medida de la posibilidad de ocurrencia de un
evento. La definición clásica propone que, si el espacio muestral es numerable y cada punto mues -
tral tiene la misma posibilidad de ocurrencia, entonces la probabilidad de ocurrencia de un evento
A definido sobre W es:

n ( A ) N ú mero de casos favorables al evento A


P( A)= =
n ( Ω ) N ú mero de casos totales

Ejemplo 42
Complete el siguiente cuadro:

Experimento aleatorio Espacio muestral Evento Probabilidad

E: Se lanza una monada


A = obtener por lo
dos veces n(A) ❑
= {…} menos una cara P ( A )= =
n( ) ❑
A={ }

Ejemplo 43
Una empresa investigadora de mercados, por encargo de un cliente, realizó un estudio acerca de
las preferencias del turismo interno que realizan los estudiantes universitarios. La empresa realizó
una encuesta a 220 estudiantes de diversas universidades nacionales y privadas; registrándose la
condición de la universidad y la región de preferencia para un posible viaje. Los resultados se
muestran en la siguiente tabla:

Condición de Región de preferencia


universidad Costa (A) Sierra (B) Selva (C) Total
Nacional (D) 8 15 60 83
Privada (E) 12 25 100 137
Total 20 40 160 220

a. Se elige un alumno al azar, determine la probabilidad de que prefiera viajar a la sierra.

Definamos el evento B: que prefiera viajar a la sierra.

La probabilidad pedida es:


40
P ( B )= =0,1818
220
Estadística para comunicadores 97

Condición de Región de preferencia


universidad Costa (A) Sierra (B) Selva (C) Total
Nacional (D) 8 15 60 83
Privada (E) 12 25 100 137
Total 20 40 160 220

b. Se elige un alumno al azar, determine la probabilidad de que no estudie en una universidad pri-
vada.

Definamos el evento E : estudia en una universidad privada.


Entonces, el evento EC: no estudia en una universidad privada.

La probabilidad pedida es:


83
P ( E )=P ( D )=
c
=0,3772
220

Condición de Región de preferencia


universidad Costa (A) Sierra (B) Selva (C) Total
Nacional (D) 8 15 60 83
Privada (E) 12 25 100 137
Total 20 40 160 220

c. Se elige un alumno al azar, determine la probabilidad de que no tenga preferencia por viajar a la
selva y estudie en una universidad nacional.

Definamos el evento C : prefiere viajar a la selva.


Definamos el evento D : estudia en una universidad nacional.

La probabilidad pedida es:

8+15
P ( C ∩ D )=
c
=0,1045
220

Condición de Región de preferencia


universidad Costa (A) Sierra (B) Selva (C) Total
Nacional (D) 8 15 60 83
Privada (E) 12 25 100 137
Total 20 40 160 220

d. Se elige un alumno al azar, determine la probabilidad de que prefiera viajar a la sierra o estudie
en una universidad privada.

Definamos el evento B: prefiere viajar a la sierra.


Definamos el evento E : estudia en una universidad privada.
Estadística para comunicadores 98
La probabilidad pedida es:

40 137 25 152
P ( B ∪ E ) =P ( B ) + P ( E )−P ( B∩ E )= + − = =0,6909
220 220 220 220

Condición de Región de preferencia


universidad Costa (A) Sierra (B) Selva (C) Total
Nacional (D) 8 15 60 83
Privada (E) 12 25 100 137
Total 20 40 160 220

Ejemplo 44
El director de mercadotecnia de un diario metropolitano estudia la relación entre el tipo de comu -
nidad donde vive el lector y la sección del periódico que lee primero. Para una muestra de lectores
se obtuvo la siguiente información:

Comunidad Noticias nacionales (N) Deportes (D) Historietas cómicas (H) Total
Urbana (U) 170 124 90 384

Rural (R) 120 112 100 332

Total 290 236 190 716

Si se selecciona un lector al azar:

a. Calcule la probabilidad de que viva en una comunidad rural.


b. Calcule la probabilidad de que viva en una comunidad urbana y la sección del periódico que lee
primero sea noticias nacionales.
c. Calcule la probabilidad de que la primera sección del periódico que lee primero sean las noticias
nacionales o las historietas cómicas.
d. Calcule la probabilidad de que la primera sección del periódico que lea sea deportes o viva en
una zona rural.
e. Calcule la probabilidad de que viva en la comunidad rural y la primera sección del periódico que
lee no sea deportes.

Solución

a. Calcule la probabilidad de que viva en una comunidad rural.

Sea el evento R: vive en una comunidad rural

La probabilidad pedida es:

n (R) 332
P ( R )= = =0,4637
n( Ω) 716
Estadística para comunicadores 99

Comunidad Noticias nacionales (N) Deportes (D) Historietas cómicas (H) Total
Urbana (U) 170 124 90 384

Rural (R) 120 112 100 332

Total 290 236 190 716

b. Calcule la probabilidad de que viva en una comunidad urbana y la sección del periódico que lee
primero sea noticias nacionales.

Sea el evento U: vive en una comunidad urbana


Sea el evento N: sección del periódico que lee primero es noticias nacionales

La probabilidad pedida es:


n (U ∩ N ) 170
P ( U ∩ N )= = =0,2374
n (Ω) 716

Comunidad Noticias nacionales (N) Deportes (D) Historietas cómicas (H) Total
Urbana (U) 170 124 90 384

Rural (R) 120 112 100 332

Total 290 236 190 716

c. Calcule la probabilidad de que la primera sección del periódico que lee primero sean las noticias
nacionales o las historietas cómicas.

Sea el evento N: sección del periódico que lee primero es noticias nacionales
Sea el evento H: sección del periódico que lee primero es historietas cómicas

¿Son N y H eventos mutuamente excluyentes? Sí; luego P(A È B) = P(A) + P(B)

La probabilidad pedida es:

290 190
P ( N ∪ H ) =P ( N ) + P ( H )= + =0,6704
716 716

Comunidad Noticias nacionales (N) Deportes (D) Historietas cómicas (H) Total
Urbana (U) 170 124 90 384

Rural (R) 120 112 100 332

Total 290 236 190 716

d. Calcule la probabilidad de que la primera sección del periódico que lea sea deportes o viva en
una zona rural.

Sea el evento D: sección del periódico que lee primero es deportes


Sea el evento R: vive en una comunidad rural

¿Son D y R eventos mutuamente excluyentes?


Estadística para comunicadores 100
No, luego P( A ∪ B)=P( A)+ P(B) – P( A ∩ B)
La probabilidad pedida es:

236 332 112


P ( D∪ R ) =P ( D ) + P ( R )−P ( D ∩ R )= + − =0,6369
716 716 716

Comunidad Noticias nacionales (N) Deportes (D) Historietas cómicas (H) Total
Urbana (U) 170 124 90 384

Rural (R) 120 112 100 332

Total 290 236 190 716

e. Calcule la probabilidad de que viva en la comunidad rural y la primera sección del periódico que
lee no sea deportes.

Sea el evento R: vive en una comunidad rural


Sea el evento D: la sección del periódico que lee primero sea deportes

La probabilidad pedida es:

n(R ∩ Dc ) 120+100
P ( R ∩ D c )= = =0,3073
n (Ω) 716

Comunidad Noticias nacionales (N) Deportes (D) Historietas cómicas (H) Total
Urbana (U) 170 124 90 384

Rural (R) 120 112 100 332

Total 290 236 190 716

Ejemplo 45
Trescientas personas se han presentado para una oferta laboral. La siguiente tabla muestra algunas
características de estas personas:

Experiencia Nivel de instrucción


Género previa Secundaria (S) Técnica (T) Universitaria (U) Total
Sin 35 38 13 86
Masculino (M)
Con 10 30 18 58
Sin 40 37 8 85
Femenino (F)
Con 12 42 17 71
Total 97 147 56 300

a. ¿Cuál es la probabilidad de que tenga instrucción técnica?


b. ¿Cuál es la probabilidad de que sea una persona con instrucción técnica y sin experiencia?
c. ¿Cuál es la probabilidad de que no sea universitario?
d. ¿Cuál es la probabilidad de que sea un hombre?
e. ¿Cuál es probabilidad de que sea una mujer o no tenga experiencia previa?
Estadística para comunicadores 101

Solución
a. ¿Cuál es la probabilidad de que tenga instrucción técnica?

Solución
Sea el evento T: instrucción técnica

La probabilidad pedida es:


n(T ) 147
P (T )= = =0,49
n (Ω) 300

Experiencia Nivel de instrucción


Género previa Secundaria (S) Técnica (T) Universitaria (U) Total
Sin 35 38 13 86
Masculino (M)
Con 10 30 18 58
Sin 40 37 8 85
Femenino (F)
Con 12 42 17 71
Total 97 147 56 300

b. ¿Cuál es la probabilidad de que sea una persona con instrucción técnica y sin experiencia?

Solución
Sea el evento T: instrucción técnica
Sea el evento N: no tenga experiencia

La probabilidad pedida es:


n(T ∩ N ) 38+37
P ( T ∩ N )= = =0,25
n (Ω) 300

Experiencia Nivel de instrucción


Género previa Secundaria (S) Técnica (T) Universitaria (U) Total
Sin 35 38 13 86
Masculino (M)
Con 10 30 18 58
Sin 40 37 8 85
Femenino (F)
Con 12 42 17 71
Total 97 147 56 300

c. ¿Cuál es la probabilidad de que no sea universitario?

Solución
Sea el evento U: tenga instrucción universitaria

La probabilidad pedida es:

n(U c ) 97+147
P ( U c )= = =0,8133
n( Ω) 300
Estadística para comunicadores 102

Experiencia Nivel de instrucción


Género previa Secundaria (S) Técnica (T) Universitaria (U) Total
Sin 35 38 13 86
Masculino (M)
Con 10 30 18 58
Sin 40 37 8 85
Femenino (F)
Con 12 42 17 71
Total 97 147 56 300

d. ¿Cuál es la probabilidad de que sea un hombre?

Solución
Sea el evento M: hombre

La probabilidad pedida es:

n(M ) 86+58
P ( M )= = =0,48
n (Ω) 300

Experiencia Nivel de instrucción


Género previa Secundaria (S) Técnica (T) Universitaria (U) Total
Sin 35 38 13 86
Masculino (M)
Con 10 30 18 58
Sin 40 37 8 85
Femenino (F)
Con 12 42 17 71
Total 97 147 56 300

e. ¿Cuál es probabilidad de que sea una mujer o no tenga experiencia previa?

Solución
Sea el evento F: mujer
Sea el evento N: no tenga experiencia previa

¿Son los eventos F y N mutuamente excluyentes?

No; P( A ∪ B)=P( A)+ P(B) – P( A ∩ B)

P ( F ∪ N )=P ( F ) + P ( N )−P ( F ∩ N )

La probabilidad pedida es:

85+71 86+ 85 85
P ( F ∪ N )= + − =0,8067
300 300 300
Estadística para comunicadores 103
Experiencia Nivel de instrucción
Género previa Secundaria (S) Técnica (T) Universitaria (U) Total
Sin 35 38 13 86
Masculino (M)
Con 10 30 18 58
Sin 40 37 8 85
Femenino (F)
Con 12 42 17 71
Total 97 147 56 300

Ejemplo 46
Se seleccionó una muestra aleatoria de trabajadores de la editorial Óptima para determinar sus
planes de jubilación después de cumplir los 65 años. Los trabajadores en la muestra se dividieron
en: ejecutivos, empleados y obreros. Los resultados obtenidos fueron:

Planes después de los 65 años


Trabajador
Se jubile (D) No se jubile (E) No ha decidido su jubilación (F) Total
Ejecutivo (A) 8 3 1 12
Empleado (B) 20 10 5 35
Obrero (C) 50 22 11 83
Total 78 35 17 130

Si se selecciona un trabajador al azar.

a. ¿Cuál es la probabilidad de que se jubile del trabajo?


b. ¿Cuál es la probabilidad de que no se jubile y sea ejecutivo?
c. ¿Cuál es la probabilidad de que no haya decidido su jubilación o no sea obrero?
d. ¿Cuál es la probabilidad de que se jubile o no haya decidido su jubilación?

Solución
a. ¿Cuál es la probabilidad de que se jubile del trabajo?

b. ¿Cuál es la probabilidad de que no se jubile y sea ejecutivo?

c. ¿Cuál es la probabilidad de que no haya decidido su jubilación o no sea obrero?


Estadística para comunicadores 104
d. ¿Cuál es la probabilidad de que se jubile o no haya decidido su jubilación?

Ejemplo 47

El portal web Ponte en Carrera clasificó a una muestra aleatoria de jóvenes que trabajan de
acuerdo a su nivel educativo alcanzado y su condición de empleo. Los resultados se muestran a
continuación:

Nivel de educación alcanzado


Condición de empleo
Primaria (A) Secundaria (B) Superior (C) Total
Formal a tiempo completo (T) 12 35 32 79
Formal a tiempo parcial (P) 18 42 28 88
Informal (I) 35 28 10 73
Total 65 105 70 240

Si se selecciona al azar un joven que trabaja.


a. Calcule la probabilidad de que tenga empleo formal a tiempo parcial o empleo formal a tiempo
completo.

b. Calcule la probabilidad de que tenga empleo informal y su nivel de educación alcanzado no sea
secundaria.

c. Calcule la probabilidad de que tenga empleo formal a tiempo completo o tenga educación su-
perior.

d. Calcule la probabilidad de que tenga empleo formal a tiempo parcial o no tenga educación pri -
maria.
Estadística para comunicadores 105

e. Calcule la probabilidad de que tenga educación primaria y no tenga empleo informal.

Ejercicios de aplicación
34.Se realizó el resumen de la información presentada por la empresa Ipsos Perú, sobre el tipo de
asalto y el distrito de residencia con la finalidad de poder tomar decisiones acerca de qué
distrito necesita mayor presencia policial. La información se presenta en la siguiente tabla:

Tipo de asalto
Total
Distrito Robo de cartera (D) Robo de celular (E) Robo de laptop (F) Otro(G)
Los Olivos (A) 120 80 20 10 230
La Molina (B) 30 50 40 5 125
Surco (C) 70 40 55 20 185
Total 220 170 115 35 540

Si se selecciona al azar a un encuestado, calcule la probabilidad de que el encuestado:

a. Calcule la probabilidad de que el encuestado no haya sido víctima de robo de cartera.


b. Calcule la probabilidad de que el encuestado haya sido víctima de robo de cartera y que
viva en La Molina.
c. Calcule la probabilidad de que el encuestado haya sufrido el robo de su laptop y no viva en
Surco.
d. Calcule la probabilidad de que el encuestado no haya sufrido robo de su celular o no resida
en La Molina.
e. Calcule la probabilidad de que el encuestado haya sufrido el robo de su cartera o resida en
Surco.

35.En la siguiente tabla se muestra la distribución de una muestra de 200 empleados de una
empresa según su género, estado civil y opinión respecto al ambiente laboral.

Femenino (F) Masculino (N)


Total
Opinión Soltero Casado Divorciado Soltero Casado Divorciado
Buena (B) 25 9 6 35 6 10 91
Regular (R) 4 22 7 11 21 3 68
Mala (M) 2 5 15 3 7 9 41
Total 31 36 28 49 34 22 200

Si se selecciona un empleado al azar, calcule la probabilidad de que:

a. Calcule la probabilidad de que su opinión con respecto al ambiente laboral no sea mala.
Rpta: 0,795
b. Calcule la probabilidad de que sea una mujer soltera. Rpta: 0,155
c. Calcule la probabilidad de que tenga una buena opinión del ambiente laboral y sea un hom -
bre soltero. Rpta: 0,175
Estadística para comunicadores 106
d. Calcule la probabilidad de que sea hombre divorciado y tenga una mala opinión del ambien -
te laboral. Rpta: 0,045

36.Cada año, en nuestro país se denuncian alrededor de siete mil violaciones y cerca de 100 mil
casos de violencia familiar. Al seleccionar una muestra de mujeres y preguntarles ¿qué tipo de
violencia sufrió?, ¿cuál es su estado civil? y ¿tiene hijos?

La información se presenta en la siguiente tabla:

Soltera (E) Casada (F)


Total
Tipo de violencia Sin hijos (G) Con hijos (H) Sin hijos (G) Con hijos (H)
Abuso sexual
22 35 42 18 117
(A)
Maltrato físico (B) 26 52 44 50 172
Maltrato psicológico (C) 36 28 38 45 147
Otros
15 10 12 27 64
(D)
Total 99 125 136 140 500

Si se selecciona al azar a una mujer.

a. Calcule la probabilidad de que haya sufrido maltrato psicológico y tenga hijos.


b. Calcule la probabilidad de que no haya sufrido maltrato físico.
c. Calcule la probabilidad de que no tenga hijos y no haya sufrido abuso sexual.
d. Calcule la probabilidad de que sea casada con hijos o haya sufrido un maltrato psicológico.
Estadística para comunicadores 107

Distribución normal de probabilidad


Es la distribución de probabilidad más usada para describir variables aleatorias continuas.
Por ejemplo, se modela con variable normal, el peso, en kilogramos o estatura, en centímetros.

Función de densidad de probabilidad normal


Se dice que la variable aleatoria X sigue una distribución normal con parámetros  y 2. Su función
de densidad se define de la siguiente manera:

( )
2
−1 x− μ
1 2 σ
f ( x)= e −∞< x <∞
√2 π σ
Notación
Si la variable aleatoria tiene distribución normal con parámetros μ y σ 2 .

μ :media de la distribución
σ :desviación estándar de la distribución

Se denota por X N (,❑2 )y se lee la variable X se distribuye normalmente con media  y varianza
2.

Características
 La función de densidad tiene forma de campana y es simétrica, por lo que las medidas de ten -
dencia central coinciden. El punto más alto se encuentra sobre la media.
 El rango de la variable normal es toda la recta real, esto es, de – a + .
 Las colas nunca chocan con el eje horizontal X .
 Si el valor de la desviación estándar es grande implica mayor dispersión en los datos
 Toda el área bajo la curva normal es igual a uno. Como la distribución es simétrica significa que
el área a la derecha de la media es igual a 0,50 y el área a la izquierda de la media es también
igual a 0,50.

Se presentan tres gráficas simétricas, ¿qué las diferencia?


Estadística para comunicadores 108

Estandarización
Se toma como referencia una distribución normal estándar (  = 0 y 2 = 1). Se trabaja con la distan-
cia entre x y  en función de la desviación estándar, tal como se muestra.

X−μ
Z=
σ

Notación

Z ~ N(0, 1) y se lee: La variable aleatoria Z tiene distribución normal estándar con media igual a 0 y
varianza igual a 1.

Función acumulada F(z) = P(Z  z)

La distribución de la variable Z se encuentra tabulada en la tabla de la normal estándar. A continua-


ción, se presentan los tres casos posibles:

Caso 1 P (Z ≤ a)

Caso 2 P ( Z >a )=1−P ( Z ≤ a )


Estadística para comunicadores 109

Caso 3 P ≤b=P ( Z ≤ b )−P ( Z ≤ a )

Ejemplo 48

Dada una distribución normal estandarizada. Eso significa que su media es 0 y su varianza es 1;
Z N ( 0 ; 1 ).

a. ¿Cuál es la probabilidad de que Z sea menor a 1,34?

P( Z< 1,34)=0,90988

Z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
1,2 0,88493 0,88686 0,88877 0,89065 0,89251 0,89435 0,89617 0,89796 0,89973 0,90147
1,3 0,90320 0,90490 0,90658 0,90824 0,90988 0,91149 0,91309 0,91466 0,91621 0,91774
1,4 0,91924 0,92073 0,92220 0,92364 0,92507 0,92647 0,92785 0,92922 0,93056 0,93189

En Excel, usamos la función =DISTR.NORM.N(1.34;0;1;1) = 0,90988.

b. ¿Cuál es la probabilidad de que Z mayor a -1,87?


Estadística para comunicadores 110

P ( Z >−1,87 )=1−P ( Z ≤−1,87 )=1−0,03074−0,96926

Z -0,09 -0,08 -0,07 -0,06 -0,05 -0,04 -0,03 -0,02 -0,01


-1,9 0,02330 0,02385 0,02442 0,02500 0,02559 0,02619 0,02680 0,02743 0,02807
-1,8 0,02938 0,03005 0,03074 0,03144 0,03216 0,03288 0,03362 0,03438 0,03515
-1,7 0,03673 0,03754 0,03836 0,03920 0,04006 0,04093 0,04182 0,04272 0,04363

En Excel, usamos la función =1-DISTR.NORM.N(-1.87;0;1;1) = 0,96926.

c. ¿Cuál es la probabilidad de que Z entre -1,10 y 2,00?

P (−1,10 ≤ Z ≤ 2,00 )=0,97725−0,13567=0,84158

Z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
1,9 0,97128 0,97193 0,97257 0,97320 0,97381 0,97441 0,97500 0,97558 0,97615 0,97670
2,0 0,97725 0,97778 0,97831 0,97882 0,97932 0,97982 0,98030 0,98077 0,98124 0,98169
2,1 0,98214 0,98257 0,98300 0,98341 0,98382 0,98422 0,98461 0,98500 0,98537 0,98574

Z -0,09 -0,08 -0,07 -0,06 -0,05 -0,04 -0,03 -0,02 -0,01 -0,00
-1,2 0,09853 0,10027 0,10204 0,10383 0,10565 0,10749 0,10935 0,11123 0,11314 0,11507
-1,1 0,11702 0,11900 0,12100 0,12302 0,12507 0,12714 0,12924 0,13136 0,13350 0,13567
-1,0 0,13786 0,14007 0,14231 0,14457 0,14686 0,14917 0,15151 0,15386 0,15625 0,15866

En Excel, usamos la función =DISTR.NORM.N(2;0;1;1) = 0,97725


En Excel, usamos la función =DISTR.NORM.N(-1.1;0;1;1) = 0,13567

d. ¿Cuál será el valor máximo de Z tal que el 63,307% de los valores son menores a Z?
Estadística para comunicadores 111

Z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08


0,2 0,57926 0,58317 0,58706 0,59095 0,59483 0,59871 0,60257 0,60642 0,61026
0,3 0,61791 0,62172 0,62552 0,62930 0,63307 0,63683 0,64058 0,64431 0,64803
0,4 0,65542 0,65910 0,66276 0,66640 0,67003 0,67364 0,67724 0,68082 0,68439

En Excel, usamos la función =INV.NORM(0.63307;0;1) = 0,34


Estadística para Comunicadores 112

Pasos para obtener probabilidades acumuladas de Z usando la calculadora

Para ingresar al modo estadístico, presio-


1
ne la tecla MODE y elija la opción
3:STAT / 1: 1-VAR

Aparecerá una columna rotulada por


2 X. Luego presione la tecla AC para
que aparezca la opción STAT en la
parte superior

A continuación, presione Shift + 1.


3
En el menú que aparece elija la op-
ción 5: Distr

4 A continuación, elija la opción 1: P(


e Ingrese el valor 1.28 de Z

Cierre paréntesis y dé igual (=) para


5
obtener finalmente el valor de la
probabilidad acumulada
Estadística para comunicadores 113
Ejemplo 49
Formalice las siguientes probabilidades y obtenga el valor de:

a. ¿Cuál es la probabilidad de que Z sea menor a 1,15?

b. ¿Cuál es la probabilidad de que Z sea mayor que 2,01?

c. ¿Cuál es la probabilidad de que Z esté entre –0,13 y 1,05?

d. ¿Cuál es el valor máximo de Z tal que el 15,87% de los valores son menores a Z?

e. ¿Cuál es el valor mínimo de Z tal que el 15,87% de los valores son mayores a Z?
Estadística para Comunicadores 114

TABLA DE LA DISTRIBUCION NORMAL ESTANDAR

Área bajo la curva normal: P (Z ≤ z) = 

Z -0,09 -0,08 -0,07 -0,06 -0,05 -0,04 -0,03 -0,02 -0,01 -0,00
-3,9 0,000033 0,000034 0,000036 0,000037 0,000039 0,000041 0,000042 0,000044 0,000046 0,000048
-3,8 0,000050 0,000052 0,000054 0,000057 0,000059 0,000062 0,000064 0,000067 0,000069 0,000072
-3,7 0,000075 0,000078 0,000082 0,000085 0,000088 0,000092 0,000096 0,000100 0,000104 0,000108
-3,6 0,000112 0,000117 0,000121 0,000126 0,000131 0,000136 0,000142 0,000147 0,000153 0,000159
-3,5 0,000165 0,000172 0,000178 0,000185 0,000193 0,000200 0,000208 0,000216 0,000224 0,000233
-3,4 0,000242 0,000251 0,000260 0,000270 0,000280 0,000291 0,000302 0,000313 0,000325 0,000337
-3,3 0,000349 0,000362 0,000376 0,000390 0,000404 0,000419 0,000434 0,000450 0,000466 0,000483
-3,2 0,000501 0,000519 0,000538 0,000557 0,000577 0,000598 0,000619 0,000641 0,000664 0,000687
-3,1 0,000711 0,000736 0,000762 0,000789 0,000816 0,000845 0,000874 0,000904 0,000935 0,000968
-3,0 0,001001 0,001035 0,001070 0,001107 0,001144 0,001183 0,001223 0,001264 0,001306 0,001350
                     
-2,9 0,00139 0,00144 0,00149 0,00154 0,00159 0,00164 0,00169 0,00175 0,00181 0,00187
-2,8 0,00193 0,00199 0,00205 0,00212 0,00219 0,00226 0,00233 0,00240 0,00248 0,00256
-2,7 0,00264 0,00272 0,00280 0,00289 0,00298 0,00307 0,00317 0,00326 0,00336 0,00347
-2,6 0,00357 0,00368 0,00379 0,00391 0,00402 0,00415 0,00427 0,00440 0,00453 0,00466
-2,5 0,00480 0,00494 0,00508 0,00523 0,00539 0,00554 0,00570 0,00587 0,00604 0,00621
-2,4 0,00639 0,00657 0,00676 0,00695 0,00714 0,00734 0,00755 0,00776 0,00798 0,00820
-2,3 0,00842 0,00866 0,00889 0,00914 0,00939 0,00964 0,00990 0,01017 0,01044 0,01072
-2,2 0,01101 0,01130 0,01160 0,01191 0,01222 0,01255 0,01287 0,01321 0,01355 0,01390
-2,1 0,01426 0,01463 0,01500 0,01539 0,01578 0,01618 0,01659 0,01700 0,01743 0,01786
-2,0 0,01831 0,01876 0,01923 0,01970 0,02018 0,02068 0,02118 0,02169 0,02222 0,02275
                     
-1,9 0,02330 0,02385 0,02442 0,02500 0,02559 0,02619 0,02680 0,02743 0,02807 0,02872
-1,8 0,02938 0,03005 0,03074 0,03144 0,03216 0,03288 0,03362 0,03438 0,03515 0,03593
-1,7 0,03673 0,03754 0,03836 0,03920 0,04006 0,04093 0,04182 0,04272 0,04363 0,04457
-1,6 0,04551 0,04648 0,04746 0,04846 0,04947 0,05050 0,05155 0,05262 0,05370 0,05480
-1,5 0,05592 0,05705 0,05821 0,05938 0,06057 0,06178 0,06301 0,06426 0,06552 0,06681
-1,4 0,06811 0,06944 0,07078 0,07215 0,07353 0,07493 0,07636 0,07780 0,07927 0,08076
-1,3 0,08226 0,08379 0,08534 0,08691 0,08851 0,09012 0,09176 0,09342 0,09510 0,09680
-1,2 0,09853 0,10027 0,10204 0,10383 0,10565 0,10749 0,10935 0,11123 0,11314 0,11507
-1,1 0,11702 0,11900 0,12100 0,12302 0,12507 0,12714 0,12924 0,13136 0,13350 0,13567
-1,0 0,13786 0,14007 0,14231 0,14457 0,14686 0,14917 0,15151 0,15386 0,15625 0,15866
                     
-0,9 0,16109 0,16354 0,16602 0,16853 0,17106 0,17361 0,17619 0,17879 0,18141 0,18406
-0,8 0,18673 0,18943 0,19215 0,19489 0,19766 0,20045 0,20327 0,20611 0,20897 0,21186
-0,7 0,21476 0,21770 0,22065 0,22363 0,22663 0,22965 0,23270 0,23576 0,23885 0,24196
-0,6 0,24510 0,24825 0,25143 0,25463 0,25785 0,26109 0,26435 0,26763 0,27093 0,27425
-0,5 0,27760 0,28096 0,28434 0,28774 0,29116 0,29460 0,29806 0,30153 0,30503 0,30854
-0,4 0,31207 0,31561 0,31918 0,32276 0,32636 0,32997 0,33360 0,33724 0,34090 0,34458
-0,3 0,34827 0,35197 0,35569 0,35942 0,36317 0,36693 0,37070 0,37448 0,37828 0,38209
-0,2 0,38591 0,38974 0,39358 0,39743 0,40129 0,40517 0,40905 0,41294 0,41683 0,42074
-0,1 0,42465 0,42858 0,43251 0,43644 0,44038 0,44433 0,44828 0,45224 0,45620 0,46017
-0,0 0,46414 0,46812 0,47210 0,47608 0,48006 0,48405 0,48803 0,49202 0,49601 0,50000
Estadística para comunicadores 115

TABLA DE LA DISTRIBUCION NORMAL ESTANDAR

Área bajo la curva normal: P (Z ≤ z) = 

Z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
0,0 0,50000 0,50399 0,50798 0,51197 0,51595 0,51994 0,52392 0,52790 0,53188 0,53586
0,1 0,53983 0,54380 0,54776 0,55172 0,55567 0,55962 0,56356 0,56749 0,57142 0,57535
0,2 0,57926 0,58317 0,58706 0,59095 0,59483 0,59871 0,60257 0,60642 0,61026 0,61409
0,3 0,61791 0,62172 0,62552 0,62930 0,63307 0,63683 0,64058 0,64431 0,64803 0,65173
0,4 0,65542 0,65910 0,66276 0,66640 0,67003 0,67364 0,67724 0,68082 0,68439 0,68793
0,5 0,69146 0,69497 0,69847 0,70194 0,70540 0,70884 0,71226 0,71566 0,71904 0,72240
0,6 0,72575 0,72907 0,73237 0,73565 0,73891 0,74215 0,74537 0,74857 0,75175 0,75490
0,7 0,75804 0,76115 0,76424 0,76730 0,77035 0,77337 0,77637 0,77935 0,78230 0,78524
0,8 0,78814 0,79103 0,79389 0,79673 0,79955 0,80234 0,80511 0,80785 0,81057 0,81327
0,9 0,81594 0,81859 0,82121 0,82381 0,82639 0,82894 0,83147 0,83398 0,83646 0,83891
                     
1,0 0,84134 0,84375 0,84614 0,84849 0,85083 0,85314 0,85543 0,85769 0,85993 0,86214
1,1 0,86433 0,86650 0,86864 0,87076 0,87286 0,87493 0,87698 0,87900 0,88100 0,88298
1,2 0,88493 0,88686 0,88877 0,89065 0,89251 0,89435 0,89617 0,89796 0,89973 0,90147
1,3 0,90320 0,90490 0,90658 0,90824 0,90988 0,91149 0,91309 0,91466 0,91621 0,91774
1,4 0,91924 0,92073 0,92220 0,92364 0,92507 0,92647 0,92785 0,92922 0,93056 0,93189
1,5 0,93319 0,93448 0,93574 0,93699 0,93822 0,93943 0,94062 0,94179 0,94295 0,94408
1,6 0,94520 0,94630 0,94738 0,94845 0,94950 0,95053 0,95154 0,95254 0,95352 0,95449
1,7 0,95543 0,95637 0,95728 0,95818 0,95907 0,95994 0,96080 0,96164 0,96246 0,96327
1,8 0,96407 0,96485 0,96562 0,96638 0,96712 0,96784 0,96856 0,96926 0,96995 0,97062
1,9 0,97128 0,97193 0,97257 0,97320 0,97381 0,97441 0,97500 0,97558 0,97615 0,97670
                     
2,0 0,97725 0,97778 0,97831 0,97882 0,97932 0,97982 0,98030 0,98077 0,98124 0,98169
2,1 0,98214 0,98257 0,98300 0,98341 0,98382 0,98422 0,98461 0,98500 0,98537 0,98574
2,2 0,98610 0,98645 0,98679 0,98713 0,98745 0,98778 0,98809 0,98840 0,98870 0,98899
2,3 0,98928 0,98956 0,98983 0,99010 0,99036 0,99061 0,99086 0,99111 0,99134 0,99158
2,4 0,99180 0,99202 0,99224 0,99245 0,99266 0,99286 0,99305 0,99324 0,99343 0,99361
2,5 0,99379 0,99396 0,99413 0,99430 0,99446 0,99461 0,99477 0,99492 0,99506 0,99520
2,6 0,99534 0,99547 0,99560 0,99573 0,99585 0,99598 0,99609 0,99621 0,99632 0,99643
2,7 0,99653 0,99664 0,99674 0,99683 0,99693 0,99702 0,99711 0,99720 0,99728 0,99736
2,8 0,99744 0,99752 0,99760 0,99767 0,99774 0,99781 0,99788 0,99795 0,99801 0,99807
2,9 0,99813 0,99819 0,99825 0,99831 0,99836 0,99841 0,99846 0,99851 0,99856 0,99861
                     
3,0 0,998650 0,998694 0,998736 0,998777 0,998817 0,998856 0,998893 0,998930 0,998965 0,998999
3,1 0,999032 0,999065 0,999096 0,999126 0,999155 0,999184 0,999211 0,999238 0,999264 0,999289
3,2 0,999313 0,999336 0,999359 0,999381 0,999402 0,999423 0,999443 0,999462 0,999481 0,999499
3,3 0,999517 0,999534 0,999550 0,999566 0,999581 0,999596 0,999610 0,999624 0,999638 0,999651
3,4 0,999663 0,999675 0,999687 0,999698 0,999709 0,999720 0,999730 0,999740 0,999749 0,999758
3,5 0,999767 0,999776 0,999784 0,999792 0,999800 0,999807 0,999815 0,999822 0,999828 0,999835
3,6 0,999841 0,999847 0,999853 0,999858 0,999864 0,999869 0,999874 0,999879 0,999883 0,999888
3,7 0,999892 0,999896 0,999900 0,999904 0,999908 0,999912 0,999915 0,999918 0,999922 0,999925
3,8 0,999928 0,999931 0,999933 0,999936 0,999938 0,999941 0,999943 0,999946 0,999948 0,999950
3,9 0,999952 0,999954 0,999956 0,999958 0,999959 0,999961 0,999963 0,999964 0,999966 0,999967
Estadística para comunicadores 116

Ejemplo 50
La carrera de Ciencias de la Comunicación se posiciona en el noveno lugar de preferencias en el
mercado laboral, según el portal Ponte en carrera en una publicación de marzo del 2019. Los egre -
sados de la Universidad Peruana de Ciencias Aplicadas son los segundos mejor pagados, con un in-
greso medio de 3741 soles con una desviación estándar de 650 soles. Los ingresos se modelan con
una variable normal.
a. Si se escoge a un egresado de la UPC al azar ¿cuál es la probabilidad gane menos de 3500 soles
al mes?
b. Si se escoge a un egresado de la UPC al azar ¿cuál es la probabilidad gane más 4000 soles al
mes?
c. Si se escoge a un egresado de la UPC al azar ¿cuál es la probabilidad gane entre 3600 y 4200
soles al mes?
Solución
a. Si se escoge a un egresado de la UPC al azar ¿cuál es la probabilidad gane menos de 3500 soles
al mes?

Solución
La variable en estudio es X : ingreso mensual, en soles

Sus parámetros son:  = 3741 y 2 = 6502

X N ( μ=3741 ; σ 2 =6502 )

La probabilidad pedida es:


P ( X <3500 )

Cálculo usando la estandarización de la variable

Para calcular la probabilidad pedida debemos estandarizar la variable X, para ello, restamos la
media y dividimos entre la desviación estándar.

P ( X <3500 )=P ( X−μ


σ
<
3500−μ
σ )
(
¿ P Z<
3500−3741
650 )
=P ( Z <0,3708 )

Si usamos la tabla normal estándar, el valor de Z se redondea dos decimales por redondeo sim -
ple. En este caso:

¿ P ( Z ←0,37 ) =0,35569

Z -0,09 -0,08 -0,07 -0,06 -0,05 -0,04 -0,03 -0,02 -0,01 -0,00
-0,4 0,31207 0,31561 0,31918 0,32276 0,32636 0,32997 0,33360 0,33724 0,34090 0,34458
-0,3 0,34827 0,35197 0,35569 0,35942 0,36317 0,36693 0,37070 0,37448 0,37828 0,38209
-0,2 0,38591 0,38974 0,39358 0,39743 0,40129 0,40517 0,40905 0,41294 0,41683 0,42074

Cálculo usando Excel


Estadística para comunicadores 117
En Excel, usamos la función =DISTR.NORM.N(3500;3741;650;1) = 0,35540. La diferencia se
debe al redondeo del valor de Z al usar la tabla.

b. Si se escoge a un egresado de la UPC al azar ¿cuál es la probabilidad gane más 4000 soles al
mes?

Solución
La probabilidad pedida es:

P ( X > 4000 )

Cálculo usando la estandarización de la variable

Para calcular la probabilidad pedida debemos estandarizar la variable X, para ello, restamos la
media y dividimos entre la desviación estándar. Además, la tabla normal solo nos da el área iz -
quierda, así que debemos calcular la probabilidad usando el complemento.

P ( X > 4000 )=1−P ( X ≤ 4000 )

Estandarizando se tiene:

(
¿ 1−P Z ≤
4000−3741
650 )
¿ 1−P ( Z ≤ 0,39846 )

Si usamos la tabla normal estándar, el valor de Z se redondea dos decimales por redondeo sim -
ple. En este caso:

¿ 1−P ( Z ≤ 0,40 )

¿ 1−0,65542=0,34458

Z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08


0,3 0,61791 0,62172 0,62552 0,62930 0,63307 0,63683 0,64058 0,64431 0,64803
0,4 0,65542 0,65910 0,66276 0,66640 0,67003 0,67364 0,67724 0,68082 0,68439
0,5 0,69146 0,69497 0,69847 0,70194 0,70540 0,70884 0,71226 0,71566 0,71904

Cálculo usando Excel

En Excel, usamos la función =1-DISTR.NORM.N(4000;3741;650;1) = 0,34515

c. Si se escoge a un egresado de la UPC al azar ¿cuál es la probabilidad gane entre 3600 y 4200
soles al mes?

Solución

La probabilidad pedida es:

P ( 3600< X < 4200 )


Estadística para comunicadores 118
Cálculo usando la estandarización de la variable

Para calcular la probabilidad pedida debemos estandarizar la variable X, para ello, restamos la
media y dividimos entre la desviación estándar a los dos valores.

P ( 3600−3741
650
< Z<
4200−3741
650 )
¿P ( 3600−3741
650
<Z <
4200−3741
650 )
¿ P (−0,21692<Z <0,70615 )

Si usamos la tabla normal estándar, el valor de Z se redondea dos decimales por redondeo sim -
ple. En este caso:

¿ P (−0,22<Z <0,71 )

¿ 0.76115−0,41294=0,34825

Z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08


0,7 0,75804 0,76115 0,76424 0,76730 0,77035 0,77337 0,77637 0,77935 0,78230
0,8 0,78814 0,79103 0,79389 0,79673 0,79955 0,80234 0,80511 0,80785 0,81057

Z -0,09 -0,08 -0,07 -0,06 -0,05 -0,04 -0,03 -0,02 -0,01


-0,3 0,34827 0,35197 0,35569 0,35942 0,36317 0,36693 0,37070 0,37448 0,37828
-0,2 0,38591 0,38974 0,39358 0,39743 0,40129 0,40517 0,40905 0,41294 0,41683

Cálculo usando Excel

La probabilidad pedida es:

P ( 3600< X < 4200 )=0,75995−0,41413=0,34582

En Excel, usamos la función =DISTR.NORM.N(4200;3741;650;1) = 0,75995


En Excel, usamos la función =DISTR.NORM.N(3600;3741;650;1) = 0,41413

d. Calcule el ingreso mensual mínimo para estar en el 20% de los egresados de la UPC que más
ganan.

Solución

Cálculo usando la estandarización de la variable

Nos piden calcular el percentil 80.

(
P ( X <c )=P Z <
c−3741
650 )
=0,80
Estadística para comunicadores 119
Usando la tabla normal, buscamos el valor más cercano a 0,80 dentro de la tabla y salimos ha -
cia los bordes. En este caso, el valor más cercano es 0,79955 y en los bordes el valor es 0,84.

Z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08


0,7 0,75804 0,76115 0,76424 0,76730 0,77035 0,77337 0,77637 0,77935 0,78230
0,8 0,78814 0,79103 0,79389 0,79673 0,79955 0,80234 0,80511 0,80785 0,81057

De donde se tiene que:

c−3741
=0,84
650

Despejando:

c=0,84 ×650+3741

c=4287

El ingreso mensual mínimo para estar en el 20% de los egresados de la UPC que más ganan es
4287 soles.

Cálculo usando Excel

En Excel, usamos la función =INV.NORM(0.8;3741;650) = 4288,05 soles. La diferencia se debe al


redondeo del valor de Z al usar la tabla.

Ejemplo 51
La cantidad de dinero destinada al ahorro mensual de los clientes de un banco es una variable alea -
toria normal con una media igual a 500 soles y una desviación estándar igual a 60 soles.

a. Si se escoge a un cliente al azar ¿cuál es la probabilidad que ahorre menos de 550 soles al mes?
b. Si se escoge a un cliente al azar ¿cuál es la probabilidad que ahorre más de 570 soles al mes?
c. Calcule el ahorro máximo para estar en el 15% de los que menos ahorran.

Solución

La variable en estudio es X: Cantidad de dinero destinada al ahorro mensual, en soles

Sus parámetros son:  = 500 y 2 = 602.


Estadística para comunicadores 120

P ( X <550 )=0,79767

Cálculo usando Excel

En Excel, usamos la función =DISTR.NORM.N(550;500;60;1) = 0,79673

a. Si se escoge a un cliente al azar ¿cuál es la probabilidad que ahorre más de 570 soles al mes?

Solución

P ( X >570 )=1−P ( X ≤570 ) =1−0.87833=0.12167

Cálculo usando Excel

En Excel, usamos la función =1-DISTR.NORM.N(570;500;60;1) = 0,12100

b. Si se escoge a un cliente al azar ¿cuál es la probabilidad que ahorre entre 480 y 520 soles?

Solución

La probabilidad pedida es:

P ( 480< X< 520 )=P ( X <520 ) −P ( X <480 ) =0,63056−0,36944=0,26112

Cálculo usando Excel


En Excel, usamos la función =DISTR.NORM.N(520;500;60;1) = 0.63056
En Excel, usamos la función =DISTR.NORM.N(480;500;60;1) = 0.36944

c. Calcule el ahorro máximo para estar en el 15% de los que menos ahorran.

Solución

Cálculo usando la estandarización de la variable

Nos piden calcular el percentil 15.

(
P ( X <c )=P Z <
c−500
60 )
=0,15

Usando la tabla normal, buscamos el valor más cercano a 0,15 dentro de la tabla y salimos ha -
cia los bordes. En este caso, el valor más cercano es 0,14917 y en los bordes el valor es -1,04.

Z -0,09 -0,08 -0,07 -0,06 -0,05 -0,04 -0,03 -0,02 -0,01


-1,1 0,11702 0,11900 0,12100 0,12302 0,12507 0,12714 0,12924 0,13136 0,13350
-1,0 0,13786 0,14007 0,14231 0,14457 0,14686 0,14917 0,15151 0,15386 0,15625
-0,9 0,16109 0,16354 0,16602 0,16853 0,17106 0,17361 0,17619 0,17879 0,18141
Estadística para comunicadores 121

De donde se tiene que:

c−500
=−104
60

Despejando:
c=−1,04 ×60+500

c=437,6

El ahorro máximo para estar en el 15% de los que menos ahorran es 437,6 soles.

Cálculo usando Excel

En Excel, usamos la función =INV.NORM(0.15;500;60) = 437,81 soles. La diferencia se debe al


redondeo del valor de Z al usar la tabla.

Ejemplo 52
El pago diario de los corresponsales de una cadena de televisión se modela con una variable nor-
mal con una media de 12 dólares y una desviación estándar de 0,75 dólares.

a. ¿Qué porcentaje de corresponsales reciben pagos diarios menores de 12,5?


b. ¿Qué porcentaje de corresponsales reciben pagos diarios mayores a 12,25?
c. ¿Qué porcentaje de corresponsales reciben pagos diarios entre 12,5 y 13,5?
d. ¿Cuál debe ser el pago mínimo para estar en el 20% de los corresponsales que más ganan?
e. ¿Cuál debe ser el pago máximo para estar en el 20% de los corresponsales que menos ganan?

Solución
La variable en estudio es X: pago diario, en soles

Sus parámetros son:  = 12 y 2 = 0,752.

a. ¿Qué porcentaje de corresponsales reciben pagos diarios menores de 12,5?


Solución
La probabilidad pedida es:

P ( X <12,5 )

Cálculo usando la estandarización de la variable

Estandarizando, es decir, le restamos la media y dividimos entre la desviación estándar.


Estadística para comunicadores 122

P ( X −μ
σ
<
12,5−μ
σ )=P ( Z <
0,75 )
12,5−12

¿ P ( Z <0,66667 ) ≈ P ( Z <0,67 ) =0,74857

Z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
0,5 0,69146 0,69497 0,69847 0,70194 0,70540 0,70884 0,71226 0,71566 0,71904 0,72240
0,6 0,72575 0,72907 0,73237 0,73565 0,73891 0,74215 0,74537 0,74857 0,75175 0,75490
0,7 0,75804 0,76115 0,76424 0,76730 0,77035 0,77337 0,77637 0,77935 0,78230 0,78524

El porcentaje de corresponsales que reciben pagos diarios menores a 12,50 es 74,86%.

Cálculo usando Excel

En Excel se usa =DISTR.NORM.N(12.5;12;0.75;1) = 0,74751.

El porcentaje de corresponsales reciben pagos diarios menores de 12,5 es 74,75%. La diferencia


se debe al redondeo del valor de Z al usar la tabla.

b. ¿Qué porcentaje de corresponsales reciben pagos diarios mayores a 12,25?

Solución

La probabilidad pedida es:

P ( X >12,25 )

Cálculo usando la estandarización de la variable

P ( X >12,25 )

¿ 1−P ( X ≤ 12,25 )

(
¿ 1−P Z ≤
12,25−12
0,75 )
¿ 1−P ( Z ≤ 0,33 )=1−0,62930=0,3707

Z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
0,2 0,57926 0,58317 0,58706 0,59095 0,59483 0,59871 0,60257 0,60642 0,61026 0,61409
0,3 0,61791 0,62172 0,62552 0,62930 0,63307 0,63683 0,64058 0,64431 0,64803 0,65173
0,4 0,65542 0,65910 0,66276 0,66640 0,67003 0,67364 0,67724 0,68082 0,68439 0,68793

El porcentaje de corresponsales que reciben pagos diarios mayores a 12,25 es 37,07%.

Cálculo usando Excel

En Excel se usa =1-DISTR.NORM.N(12.25;12;0.75;1) = 0,36944.

c. ¿Qué porcentaje de corresponsales reciben pagos diarios entre 12,5 y 13,5?


Estadística para comunicadores 123

Solución

La probabilidad pedida es:

P ( 12,5< X <13,5 )

¿ 0,97725−0,74751=0,22974

Cálculo usando Excel

En Excel se usa =DISTR.NORM.N(13.5;12;0.75;1) = 0,97725


En Excel se usa =DISTR.NORM.N(12.5;12;0.75;1) = 0,74751

d. ¿Cuál debe ser el pago mínimo para estar en el 20% de los corresponsales que más ganan?

Solución

Nos piden calcular el percentil 80.

P ( X <c )=0,80

Cálculo usando Excel

En Excel se usa =INV.NORM(0.8;12;0.75) = 12,631

e. ¿Cuál debe ser el pago máximo para estar en el 20% de los corresponsales que menos ganan?

Solución

Nos piden calcular el percentil 20.

P ( X <c )=0,20

Cálculo usando Excel

En Excel se usa =INV.NORM(0.2;12;0.75) = 11,369


Estadística para comunicadores 124

Ejercicios de aplicación

37.El consumo mensual de energía eléctrica de los hogares, en kilowatts, de una ciudad tiene
distribución normal con media de 160 kW y con una desviación estándar de 35 kW. Si se elige
un hogar de esta ciudad al azar:

a. ¿Cuál es la probabilidad que un hogar tenga un consumo menor de 170 kW?

b. ¿Cuál es la probabilidad que un hogar tenga un consumo mayor a 180 kW?

c. ¿Qué porcentaje de hogares registran un consumo entre 110 y 190 kW?

d. Calcule el consumo mínimo de energía eléctrica para estar en el 10% de los mayores consu -
midores.
Estadística para comunicadores 125
38.Suponga que el tiempo que emplean los suscriptores de la revista Focus en leer la publicación
tiene distribución normal con media de 49 minutos y variabilidad de 256 minutos 2.

a. ¿Cuál es la probabilidad de que un suscriptor seleccionado al azar tarde por lo menos una
hora en leer la publicación?

b. ¿Cuál es la probabilidad de que un suscriptor seleccionado al azar tarde más 30 pero me-
nos de 50 minutos en leer la publicación?

c. ¿Cuál es el tiempo máximo que debe emplear un suscriptor de esta revista para pertenecer
al 34% de suscriptores que emplean menos tiempo en leer la publicación?

39.El ingreso mensual de los redactores de noticia tiene distribución normal con media $900 y una
desviación estándar de $100.

a. Si se elige al azar un redactor de noticia, ¿cuál es la probabilidad de que su ingreso sea me-
nor que $800?
Estadística para comunicadores 126

b. Si se elige al azar un redactor de noticia, ¿cuál es la probabilidad de que su ingreso sea ma-
yor que $850?

c. Si el 5% de los redactores de noticia con mayores ingresos deben pagar impuestos, ¿a par -
tir de qué ingreso se debe pagar impuestos?

40.Las puntuaciones de una prueba de aptitud académica tomada a 900 postulantes de una
cadena internacional de noticias están distribuidas normalmente con media de 60 puntos y
desviación estándar de 10 puntos.

a. ¿Qué porcentaje de postulantes obtuvo una puntuación mayor a 75 puntos?


Rpta: 6,68%
b. ¿Cuántos postulantes recibieron una puntuación entre 40 y 50 puntos?
Rpta: 122
c. Si el 12,3 % de los postulantes con mayor puntuación reciben el calificativo A y el 20% de
los postulantes con menor puntuación reciben el calificativo C. Calcular la mínima puntua-
ción que debe tener un postulante a esta cadena internacional de noticias para recibir un A
y la máxima puntuación que debe tener un postulante para recibir un calificativo C.
Rpta: 71,6;
51,58

41.Una estación de noticias encuentra que el tiempo que los radioescuchas sintonizan la estación
sigue una distribución normal con media de 15 minutos y desviación estándar de 3,5 minutos. Si
se elige un radioescucha al azar.

a. ¿Cuál es la probabilidad sintonice la estación más de 20 minutos? Rpta: 0,07656


b. ¿Cuál es el tiempo máximo para que un radioescucha se encuentre en el 12,1% de radioes -
cuchas que menos tiempo escuchan esta estación? Rpta: 10,9

42.Supóngase que los gastos durante un ciclo académico de los estudiantes de diseño publicitario
tienen distribución normal con media de 30 soles y desviación estándar de cinco soles.
Estadística para comunicadores 127

a. ¿Cuál es la probabilidad de que un alumno seleccionado al azar haya tenido un gasto supe -
rior a 35 soles? Rpta: 0,15866
b. ¿Cuál es la probabilidad de que un alumno seleccionado al azar haya tenido un gasto entre
27,5 y 32,50 soles? Rpta: 0,38292

43.Las compañías que miden las audiencias de programas de televisión y estaciones de radio para
los anunciantes y transmisoras se conocen como servicios de ratings. Si una de estas compañías
determinó que los puntos de ratings de las ediciones diarias del programa magazín ABC siguen
una distribución normal con media 23,1 puntos y una desviación estándar de 1,6 puntos.

a. Si se selecciona al azar una edición de este programa, ¿cuál es la probabilidad de que su ra-
ting se encuentren entre 21,2 puntos y 25,3 puntos? Rpta: 0,79792
b. ¿Cuánto debe ser el rating mínimo para estar comprendido en el 12,1% de las ediciones de
este programa con mayores puntos de ratings? Rpta: 24,97

44.La duración de un spot publicitario sigue una distribución normal con una media de 48
segundos y una desviación estándar de 12 segundos.

a. Calcule la probabilidad de que un spot publicitario dure más de 45 segundos.


Rpta: 0,59871
b. ¿Cuál es la duración mínima aproximada que debe tener un spot publicitario para estar
dentro del 18% de los spots que más duran? Rpta: 58,98

45.Se tiene información que los costos de los spots publicitarios realizado por la empresa Publix se
distribuye normalmente con moda igual a 42 000 dólares y desviación estándar de 3500
dólares.

a. Si se selecciona al azar un spot publicitario elaborado por dicha empresa ¿cuál es la proba-
bilidad que su costo haya sido menor de 40 000 dólares? Rpta: 0,2839
b. ¿Qué porcentaje de los spots publicitarios elaborados por la empresa Publix tienen costos
entre 41 000 y 43 000 dólares? Rpta: 0,22490
c. El 30% de los spots más costos se los va a clasificar como “muy rentables” ¿cuál es el valor
mínimo que debe tener un spot para estar considerado en este grupo? Rpta: 43835,4
Estadística para comunicadores 128

Unidad 3. Inferencia estadística

Logro

Al término de la unidad 3, el estudiante aplica las herramientas inferenciales


para la toma de decisiones en base a una muestra seleccionada.

Temario

Tamaño de muestra y muestreo

Conceptos
Tamaño de muestra para estimar el promedio
Tamaño de muestra para estimar la proporción
Tipos de muestreo: muestreo simple aleatorio, sistemático y estratificado

Prueba de hipótesis

Prueba de hipótesis para el promedio


Prueba de hipótesis para la proporción

Regresión lineal simple

Diagrama de dispersión
Modelo de regresión lineal e interpretación de los coeficientes
Validez del modelo
Coeficiente de determinación
Coeficiente de correlación
Estadística para comunicadores 129

Censo
Es una investigación estadística que consiste en el recuento de la totalidad de los elementos que
componen la población por investigar. Es necesario que se especifique el espacio y el tiempo al que
se refiere el recuento.

Por ejemplo, el 22 de octubre del 2017 se realizaron los Censos Nacionales 2017: XII de Población,
VII de Vivienda y III de Comunidades Indígenas. Su finalidad es proveer información sobre la com -
posición, distribución geográfica y crecimiento de la población, los patrones de la concentración ur-
bana y rural, las características y servicios básicos de la vivienda para la ejecución de las políticas
públicas.

Tomado: http://www.censos2017.pe/etapas-censo/

Muestreo
Cuando se opta por una investigación usando una muestra en vez de la población, el estudio esta -
dístico comprende por lo menos cuatro etapas:

 Definición de la población objetivo y búsqueda del marco muestral.


 Determinación del tamaño de la muestra.
 Selección de las unidades.
 Registro de las observaciones
Estadística para comunicadores 130
Por ejemplo, la Asociación Peruana de Empresas de Investigación realizaba una encuesta para de-
terminar el nivel socioeconómico de una persona. Hoy en día, ya no encuesta, sino más bien usa la
Encuesta Nacional de Hogares (ENAHO) realizada por el Instituto Nacional de Estadística e Informá-
tica (INEI).

Niveles socioeconómicos en Lima Metropolitana y Callao

Ficha técnica

Universo de estudio
 Se consideró como universo de estudio a todos los hogares pertenecientes a
Lima Metropolitana entendida como los distritos de Lima ubicados en el nú-
cleo urbano (sin considerar balnearios) y la Provincia Constitucional del Callao.
Se definió como hogar, al conjunto de personas que, habitando en la misma vi-
vienda, preparan y consumen sus alimentos en común.

 La persona informante fue el jefe de familia, definido como aquella persona que más
aporta económicamente en el hogar.

Marco muestral
Para el desarrollo de la investigación se consideró como marco muestral:
 La base de datos de viviendas del Instituto Nacional de Estadística e Informática (INEI).
 Actualización mediante aplicación de rastreo de campo efectuada por APEIM en las zonas de
mayor crecimiento de la ciudad (conos)

Tamaño de la muestra
 Se entrevistó a un total de 3 598 hogares distribuidos en 41 distritos.
 El margen de error fue de 1,63% con un nivel de confianza del 95%.
 Dentro de esta muestra se realizaron 200 entrevistas en distritos con predominio de los N.S.E.
Muy Alto/Alto con el propósito de obtener una submuestra estadísticamente significativa para
este segmento.
 El total de entrevistas fue desagregado proporcionalmente a la distribución poblacional de
cada uno de los distritos de Lima Metropolitana.

Selección de la muestra

 Determinada la cantidad de entrevistas a aplicar por distrito, se procedió a


sortear tantas manzanas como entrevistas se requerían.
 Dentro de cada manzana se seleccionó por un sistema aleatorio simple cin-
co viviendas: una vivienda titular y cuatro viviendas suplen-
tes.
 Los hogares titulares fueron visitados hasta en tres oportu-
nidades antes de proceder al reemplazo. Se controló que la
tasa de reemplazo no excediera el 10% del total de entrevistas originalmente
sorteadas.
Estadística para Comunicadores 131

Tamaño de muestra

Al iniciar una investigación nos hacemos las siguientes preguntas:

 ¿A cuántas personas debemos entrevistar?


 ¿Qué tan precisos deben ser nuestros pronósticos?
 ¿Qué tanto debemos confiar en nuestras afirmaciones a partir de la muestra?
 ¿Cómo influye la variabilidad de los datos?

Para determinar el tamaño mínimo de una muestra, debe tener en cuenta si el parámetro que de -
sea estimar es el promedio a la proporción. Recuerde que, para estimar el promedio, la variable
debe ser numérica y para estimar la proporción, la variable debe ser no numérica.

Ejemplo 53
Indique en cada situación si debe estimarse la media poblacional  o la proporción poblacional p.

Situación Estimador
Si deseamos pronosticar quién ganará las próximas elecciones
¿a cuántas personas se debe entrevistar?
Si deseamos estimar la media poblacional del ingreso diario de
un conductor de taxi por aplicación ¿se debe entrevistar a 500
taxistas o basta con 200?
Si deseamos estimar la media del número de kilómetros que
un futbolista profesional corre durante un partido en el cam-
peonato nacional ¿a cuántos futbolistas hay que registrar?
Si queremos estimar el porcentaje poblacional de dueños que
llevan todos los meses a su perro al veterinario ¿a cuántos
dueños se debe entrevistar?

Solución
Situación Estimador
Si deseamos pronosticar quién ganará las próximas elecciones
¿a cuántas personas se debe entrevistar? Proporción

Si deseamos estimar la media poblacional del ingreso diario de


un conductor de taxi por aplicación ¿se debe entrevistar a 500
Media
taxistas o basta con 200?

Si deseamos estimar la media del número de kilómetros que


un futbolista profesional corre durante un partido en el cam-
Media
peonato nacional ¿a cuántos futbolistas hay que registrar?

Si queremos estimar el porcentaje poblacional de dueños que


llevan todos los meses a su perro al veterinario ¿a cuántos
Proporción
dueños se debe entrevistar?
Estadística para comunicadores 132
Estadística para comunicadores 133

Margen de error o error de estimación (e)


Es la diferencia entre un estadístico y su parámetro correspondiente.

Nos da una idea clara de cuánto se aleja el valor de un estadístico, basado en una muestra, del va -
lor del parámetro al que se está estimando. Un estadístico será más preciso cuando su error sea
más pequeño.

Nivel de confianza (1 - )%


Es la probabilidad de que el intervalo construido en torno a un estadístico contenga al verdadero
valor del parámetro.

Tamaño de muestra para estimar la media poblacional  cuando no se conoce la


varianza poblacional

La fórmula para determinar el tamaño de muestra n es:

(( ) )
2
z α
×s
1−
2
n=
e

El valor de s puede ser estimado a partir de una muestra preliminar o piloto.

Tamaño de muestra para estimar una proporción poblacional cuando se dispone de


información muestral

Si p
^ se utiliza como una estimación de la proporción poblacional p , podemos tener una confianza
del ( 1−α ) x 100% de que el error será menor o igual de una cantidad específica e cuando el tama-
ño de la muestra es:
z2 × ^p × (1− ^p )
(1−α2 )
n=
e2

Tamaño de muestra para estimar una proporción poblacional cuando no se dispone de


información muestral
Si no se tiene una estimación previa de p, entonces, se puede usar p = 0,5; por lo tanto la fórmula
para calcular el tamaño de muestra es la siguiente:
2
z × 0,5× ( 1−0,5 )
(1−α2 )
n= 2
e

Tamaño de muestra si se conoce el tamaño de la población N


Para para la media o para la proporción, si se conoce el tamaño de la población N, entonces el ta-
maño de muestra se corrige con la siguiente fórmula:
Estadística para comunicadores 134
n
nc=
n
1+
N
En resumen,

Redondear n al entero mayor

Redondear nc al entero mayor


Estadística para comunicadores 135

Ejemplo 54
El jefe de la oficina de seguridad del distrito de San Martin de Porres desea realizar una estimación
de cuánto tiempo, en promedio, estarían dispuestos a permanecer en las charlas sobre rondas ve -
cinales los vecinos del distrito. En estudios anteriores se estimó que el tiempo medio era de 45,25
minutos con una varianza de 18,75 minutos 2.

¿A cuántas personas se debería entrevistar si se estima un error máximo de 1,25 minutos y una
confianza del 95%?

Solución

El margen de error es e = 1,25

La desviación estándar muestral es s = √ 18,75 = 4,3301.

El nivel de confianza es del 95%, por lo tanto, el valor en la tabla normal estándar es Z(0,975) = 1,96

Z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
1,8 0,96407 0,96485 0,96562 0,96638 0,96712 0,96784 0,96856 0,96926 0,96995 0,97062
1,9 0,97128 0,97193 0,97257 0,97320 0,97381 0,97441 0,97500 0,97558 0,97615 0,97670
                     
2,0 0,97725 0,97778 0,97831 0,97882 0,97932 0,97982 0,98030 0,98077 0,98124 0,98169

Reemplazando los valores en la fórmula, el tamaño de muestra (n) para un margen de error (e) de
1,25 minutos y un nivel de confianza del 95% es:

( )
2
z α s
( )
1,96 ×4,3301 2
1−
2
n= = =46,1=47
e 1,25

Se necesitará seleccionar una muestra de 47 vecinos del distrito de San Martin de Porres.
Estadística para comunicadores 136

Ejemplo 55
Universal es una nueva emisora de carácter político y a una semana de estar al aire cuenta ya con
3000 radioescuchas. El gerente de Universal desea realizar un estudio para estimar el tiempo de
conexión medio de los oyentes. ¿Cuál debe ser el tamaño de muestra de oyentes que se necesita si
desea tener un error de estimación de 0,15 horas con un nivel de confianza del 95%?

Al seleccionar una muestra piloto se obtuvieron los siguientes resultados, en horas:

3,2 4,8 5,3 9,1 6,3 8,2 6,5 9,6 10,3 8,6
6,3 7,9 8,2 7,9 6,9 9,3 8,6 6,8 10,1 9,0

Solución
El margen de error es e = 0,15.

La desviación estándar muestral, s = 1,8597.

El nivel de confianza es del 95%, por lo tanto, el valor en la tabla normal estándar es Z(0,975) = 1,96

Z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
1,8 0,96407 0,96485 0,96562 0,96638 0,96712 0,96784 0,96856 0,96926 0,96995 0,97062
1,9 0,97128 0,97193 0,97257 0,97320 0,97381 0,97441 0,97500 0,97558 0,97615 0,97670
                     
2,0 0,97725 0,97778 0,97831 0,97882 0,97932 0,97982 0,98030 0,98077 0,98124 0,98169

El tamaño de la muestra se obtiene con la siguiente fórmula:

( )
2
z α s
(1,96 ×1,8597 2
)
1−
2
n= = =590,49
e 0,15

Se redondea al entero mayor, por lo tanto, serán 591 radioescuchas

Como el tamaño de la población es conocida se debe corregir el tamaño de la muestra:


n 591
nc= = =493,7 ≈ 494
n 591
1+ 1+
N 3000

Se necesitará entrevistar una muestra de 494 radioescuchas


Estadística para comunicadores 137

Ejemplo 56
En un estudio piloto, el 32% de los encuestados dijeron que el programa espacial debe enfatizar la
exploración científica. ¿Qué tan grande se necesita que sea la muestra definitiva si se desea una
confianza del 99% de que el porcentaje estimado esté dentro del 2% del porcentaje real?

Solución

El margen de error es del 2%, por lo tanto, e = 0,02.

La estimación de la proporción poblacional de personas que manifiestan que se debe enfatizar en


la exploración científica es la proporción muestral ^p, es decir, ^p = 0,32.

El nivel de confianza es del 99%, por lo tanto, el valor en la tabla normal estándar es Z(0,995) = 2,58.

Z 0.00 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09
2.3 0.98928 0.98956 0.98983 0.99010 0.99036 0.99061 0.99086 0.99111 0.99134 0.99158
2.4 0.99180 0.99202 0.99224 0.99245 0.99266 0.99286 0.99305 0.99324 0.99343 0.99361
2.5 0.99379 0.99396 0.99413 0.99430 0.99446 0.99461 0.99477 0.99492 0.99506 0.99520
2.6 0.99534 0.99547 0.99560 0.99573 0.99585 0.99598 0.99609 0.99621 0.99632 0.99643

Remplazando en la fórmula del tamaño de muestra:

z2 α ^p ( 1− ^p )
1−
2 2,582 ×0,32 × ( 1−0,32 )
n= 2
= 2
=3621,08=3622
e 0,02

El tamaño de muestra con las condiciones solicitadas será 3622 personas


Estadística para comunicadores 138

Ejemplo 57
Una agencia publicitaria desea hacer una afirmación en su spot publicitario. Para ello lleva a cabo
un estudio para estimar el porcentaje de ciudadanos de una gran ciudad que están a favor de que
el agua se trate con flúor.

¿Qué tan grande debe ser la muestra que debe seleccionar si se desea tener una confianza de 95%
de que la estimación esté dentro del 1% del porcentaje real?

Solución

Se desea que la estimación esté dentro del 1% del porcentaje real, esto quiere decir que el margen
de error debe ser del 1%, esto es, e = 0,01.

El nivel de confianza es del 95%, por lo tanto, el valor en la tabla normal estándar es Z(0,975) = 1,96

Z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
1,8 0,96407 0,96485 0,96562 0,96638 0,96712 0,96784 0,96856 0,96926 0,96995 0,97062
1,9 0,97128 0,97193 0,97257 0,97320 0,97381 0,97441 0,97500 0,97558 0,97615 0,97670
                     
2,0 0,97725 0,97778 0,97831 0,97882 0,97932 0,97982 0,98030 0,98077 0,98124 0,98169

En Excel, se usa la función =INV.NORM.ESTAND(0.975) = 1,96

Reemplazando los valores en la fórmula, el tamaño de muestra (n) para un margen de error (e) de
1% y un nivel de confianza del 95% es:

z2 α ^p ( 1− ^p ) 2
1−
2 1,96 ×0,5 ×(1−0,5)
n= = =9604
e2 0,012

Luego el tamaño de muestra solicitado será 9604 ciudadanos.


Estadística para comunicadores 139

Ejemplo 58
¿Cuál debe ser el tamaño de muestra si se desea estimar el tiempo promedio, en minutos, que de -
moran los estudiantes en llegar a la universidad con un nivel de confianza del 97% y con un margen
de error de 5 minutos? Una muestra piloto de 10 alumnos arrojó los siguientes resultados:

120 90 35 80 60 40 15 30 40 100

Solución
El margen de error: e = 5 minutos

La desviación estándar: s=¿ 34,7051 minutos

En Excel, se usa la función =DESVEST.M(A1:J1) = 34,7051

El nivel de confianza es del 97%; por lo tanto, el valor en la tabla normal estándar es Z(0,985) = 2,17

0,985

0,015 0,97 0,015

97

2,17

Z 0.00 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09
2.0 0.97725 0.97778 0.97831 0.97882 0.97932 0.97982 0.98030 0.98077 0.98124 0.98169
2.1 0.98214 0.98257 0.98300 0.98341 0.98382 0.98422 0.98461 0.98500 0.98537 0.98574
2.2 0.98610 0.98645 0.98679 0.98713 0.98745 0.98778 0.98809 0.98840 0.98870 0.98899
2.3 0.98928 0.98956 0.98983 0.99010 0.99036 0.99061 0.99086 0.99111 0.99134 0.99158

En Excel, se usa la función =INV.NORM.ESTAND(0.985) = 2,17

Reemplazando los valores en la fórmula:

( )
2
z α s
( )
2
1−
2 2,17 ×34,7051
n= = =226,9=227
e 5

Se debe en= ( 1.961.5x 9.6 )ncuestar a 227 estudiantes


Estadística para comunicadores 140

Ejemplo 59

La gerencia de un diario desea estimar la media del gasto mensual que las familias destinan a la
compra de diarios. Se desea tener un nivel de confianza del 98% y un margen de error de dos soles.

Si la desviación estándar de los gastos en compra de diarios en una muestra piloto fue de 30 soles
¿Qué tamaño de muestra deberá seleccionar?

Solución

El margen de error: e = 2 soles

La desviación estándar: s = 30 soles

El nivel de confianza es del 98%, por lo tanto, el valor en la tabla normal estándar es Z(0,99) = 2,33.

0,99

0,01 0,98 0,01

98

2,33

Z 0.00 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09
2.1 0.98214 0.98257 0.98300 0.98341 0.98382 0.98422 0.98461 0.98500 0.98537 0.98574
2.2 0.98610 0.98645 0.98679 0.98713 0.98745 0.98778 0.98809 0.98840 0.98870 0.98899
2.3 0.98928 0.98956 0.98983 0.99010 0.99036 0.99061 0.99086 0.99111 0.99134 0.99158

En Excel, se usa la función =INV.NORM.ESTAND(0.99) = 2,33

Reemplazando los valores en la fórmula:

( )
2
z α s
( )
2,33 ×30 2
1−
2
n= = =1221,5
e 2

Luego, se debe en= ( 1.961.5x 9.6 )ncuestar a 1222 estudiantes


No se corrige el tamaño de muestra porque no se conoce el tamaño de la población.
Estadística para comunicadores 141

Ejemplo 60

Un estudio realizado hace cinco años atrás, arrojó que, de 300 personas mayores de edad 105 leían
el diario Siglo XXI. Calcule el tamaño de muestra necesario para para estimar actualmente la pro -
porción de lectores de este diario si se desea tener un margen de error del 3% y un nivel de con-
fianza del 99%.

Solución
La estimación de la proporción poblacional p es la proporción muestral, ^p.

105
^p=
300

El margen de error: e = 0,03

El nivel de confianza es del 99%, por lo tanto, el valor de Z(0,995) = 2,58.

0,995

0,005 0,99 0,005

2,58

Z 0.00 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09
2.4 0.99180 0.99202 0.99224 0.99245 0.99266 0.99286 0.99305 0.99324 0.99343 0.99361
2.5 0.99379 0.99396 0.99413 0.99430 0.99446 0.99461 0.99477 0.99492 0.99506 0.99520
2.6 0.99534 0.99547 0.99560 0.99573 0.99585 0.99598 0.99609 0.99621 0.99632 0.99643

En Excel, se usa la función =INV.NORM.ESTAND(0.995) = 2,58

Reemplazando los valores en la fórmula:

n=
z2
1−
α
2
^p ( 1− ^p )
=
2
2,58 ×
105
300
× 1−(105
300 ) =1682,59=1683
2 2
e 0,03

Luego, se deben en= ( 1.961.5x 9.6 )ncuestar a 1683 personas mayores de edad.
Estadística para comunicadores 142

Ejemplo 61
El alcalde de un distrito desea estimar la proporción poblacional de residentes que conocen la pro -
puesta respecto al uso de fondos municipales para mejorar la limpieza del distrito. Calcule el tama-
ño de muestra necesario parar llevar a cabo dicha estimación si se requiere una confianza del 94%
y un margen de error del 2%.

Solución
La estimación de la proporción poblacional p es la proporción muestral ^p=0,5; pues no te dicen
ninguna información anterior.

El margen de error (e) es del 2%, por lo tanto, e = 0,02.

El nivel de confianza es del 94%, por lo tanto, el valor en la tabla normal estándar es Z(0,97) = 1,88.

0,97

0,03 0,94 0,03

1,88

Z 0.00 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09
1.6 0.94520 0.94630 0.94738 0.94845 0.94950 0.95053 0.95154 0.95254 0.95352 0.95449
1.7 0.95543 0.95637 0.95728 0.95818 0.95907 0.95994 0.96080 0.96164 0.96246 0.96327
1.8 0.96407 0.96485 0.96562 0.96638 0.96712 0.96784 0.96856 0.96926 0.96995 0.97062
1.9 0.97128 0.97193 0.97257 0.97320 0.97381 0.97441 0.97500 0.97558 0.97615 0.97670

En Excel, se usa la función =INV.NORM.ESTAND(0.97) = 1,88.

Reemplazando los valores en la fórmula:

z2 α ^p ( 1− ^p ) 2
1−
2 1,88 0,5× × ( 1−0,5 )
n= = =2209
e2 0,022

Luego, se debe en= ( 1.961.5x 9.6 )ncuestar a 2209 ciudadanos.


Estadística para comunicadores 143

Ejercicios de aplicación

46.Se desea realizar una encuesta para estimar el número promedio de amigos que los jóvenes
tienen en su cuenta de Facebook. Con un error de estimación de cinco amigos y con un nivel de
confianza del 95%, determine el tamaño de muestra adecuado si en una muestra piloto se
obtuvo que el valor de la desviación estándar del número de amigos es igual a 42.

El margen de error (e) es …

La desviación estándar (s) es …

El nivel de confianza es del 95%, por lo tanto, el valor en la tabla normal estándar es Z() = ...

Z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
1,8 0,96407 0,96485 0,96562 0,96638 0,96712 0,96784 0,96856 0,96926 0,96995 0,97062
1,9 0,97128 0,97193 0,97257 0,97320 0,97381 0,97441 0,97500 0,97558 0,97615 0,97670
2,0 0,97725 0,97778 0,97831 0,97882 0,97932 0,97982 0,98030 0,98077 0,98124 0,98169

En Excel, se usa la función =INV.NORM.ESTAND() = …

Reemplazando los valores en la fórmula:

( )
2
z α s
1−
2
n= =…
e

Luego, el tamaño de muestra es …

47.La alcaldía de Lima desea concientizar a la población a través de la campaña “Si toma no
maneje” encargada a una importante agencia publicitaria. Con un 95% de confianza y con un
error de estimación no mayor a 3,5% ¿de qué tamaño necesita tomar la muestra la agencia para
estimar el porcentaje de todos los ciudadanos a favor de esta campaña?

La estimación de la proporción poblacional p es la proporción muestral ^p=…

El margen de error (e) es …

El nivel de confianza es del 95%, por lo tanto, el valor en la tabla normal estándar es Z() = ...

Z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
1,8 0,96407 0,96485 0,96562 0,96638 0,96712 0,96784 0,96856 0,96926 0,96995 0,97062
1,9 0,97128 0,97193 0,97257 0,97320 0,97381 0,97441 0,97500 0,97558 0,97615 0,97670
2,0 0,97725 0,97778 0,97831 0,97882 0,97932 0,97982 0,98030 0,98077 0,98124 0,98169

En Excel, se usa la función =INV.NORM.ESTAND() = …

Reemplazando los valores en la fórmula:

z2 α ^p ( 1− ^p )
1−
n=
2 =…
2
e
Estadística para comunicadores 144

Luego, el tamaño de muestra es …


48.La máquina de refrescos de una universidad está ajustada de tal manera que la cantidad de
líquido despachada se distribuye aproximadamente en forma normal. ¿Qué tan grande se
requiere que sea la muestra si se desea tener una confianza de 98% de que su media muestral
esté dentro de 0,05 centilitros del promedio real? Se cuenta con la siguiente información de
una muestra preliminar o piloto de tamaño 24.

1,99 1,98 2,04 1,97 2,18 2,04 2,13 2,03 2,08 2,72 2,04 2,09
2,11 2,13 2,14 1,98 2,29 2,02 1,94 1,82 2,02 2,10 2,19 2.13

El margen de error (e) es …

La desviación estándar (s) es …

El nivel de confianza es del 98%, por lo tanto, el valor en la tabla normal estándar es Z() = ...

Z 0.00 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09
2.1 0.98214 0.98257 0.98300 0.98341 0.98382 0.98422 0.98461 0.98500 0.98537 0.98574
2.2 0.98610 0.98645 0.98679 0.98713 0.98745 0.98778 0.98809 0.98840 0.98870 0.98899
2.3 0.98928 0.98956 0.98983 0.99010 0.99036 0.99061 0.99086 0.99111 0.99134 0.99158

En Excel, se usa la función =INV.NORM.ESTAND() = …

Reemplazando los valores en la fórmula:

( )
2
z α s
1−
2
n= =…
e

Luego, el tamaño de muestra es …

49.Se realiza un estudio para estimar la proporción de residentes en una ciudad que están a favor
de la construcción de una vía expresa. ¿Qué tan grande deber ser una muestra si se quiere un
nivel de confianza de 97% y un margen de error del 3%?

La estimación de la proporción poblacional p es la proporción muestral ^p=¿…

El margen de error (e) es …

El nivel de confianza es del 97%, por lo tanto, el valor en la tabla normal estándar es Z() = …

Z 0.00 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09
2.1 0.98214 0.98257 0.98300 0.98341 0.98382 0.98422 0.98461 0.98500 0.98537 0.98574
2.2 0.98610 0.98645 0.98679 0.98713 0.98745 0.98778 0.98809 0.98840 0.98870 0.98899
2.3 0.98928 0.98956 0.98983 0.99010 0.99036 0.99061 0.99086 0.99111 0.99134 0.99158

En Excel, se usa la función =INV.NORM.ESTAND() = …

Reemplazando los valores en la fórmula:


Estadística para comunicadores 145
2
z α ^p ( 1− ^p )
1−
2
n= =…
e2

Luego, se debe en= ( 1.961.5x 9.6 )ncuestar a ...


50.Una editorial desea estimar la media muestral del tiempo de distribución de su último best
seller en cada uno de sus 400 puntos de venta. Para este estudio se desea tener un error de
estimación de tres minutos con un nivel de confianza del 90%. Además, se sabe que la
desviación estándar de los tiempos de distribución es de 17 minutos. ¿Qué tamaño de muestra
debe emplear la editorial para llevar a cabo esta estimación?
Rpta: 72

51.La gerencia de un diario local desea estimar el gasto promedio mensual que las familias
destinan en compra de diarios. En una muestra piloto se obtuvo que la desviación estándar del
gasto fue de 20 soles. Si la gerencia desea tener una confianza del 93% en la información
recopilada y no quiere que el error de estimación sea mayor a tres soles. ¿Qué tamaño de
muestra deberá seleccionar para conocer dicha estimación?
Rpta: 146

52.Una empresa desea estimar la proporción de trabajadores del área de diseño publicitario que
están a favor de que se corrija el programa de capacitación que se viene dando actualmente en
el área. La estimación debe quedar a menos de 0,08 de la proporción verdadera de los que
favorecen el programa de capacitación. Con una confianza del 95% ¿cuántos trabajadores se
deben seleccionar? Rpta: 151

53.Un supermercado ha adquirido un lote de 2 000 revistas. En adquisiciones anteriores se ha


obtenido que la proporción de revistas defectuosas es alrededor de 0,18. ¿Qué tamaño de
muestra debe seleccionarse para estimar la proporción de revistas defectuosas en este lote si se
desea tener un error de estimación de 0,04 con una confianza del 90%? Rpta: 222

54.Una reportera de la revista Byte desea realizar una encuesta para estimar la proporción de
estudiantes universitarios que poseen tablet Suponga que en un estudio previo se obtuvo que
el 29% de estudiantes universitarios poseen tablet. ¿A cuántos estudiantes universitarios
deberá encuestar ahora si desea tener una confianza del 96% y un error del 3,5%?
Rpta: 707

55.El gerente comercial de la red profesional Conexión desea estimar la proporción de jóvenes que
egresaron el año pasado de una maestría en Publicidad y que han utilizado Conexión para
obtener un mejor empleo ¿Cuál debe ser el tamaño de muestra mínimo si se desea tener un
nivel de confianza del 94% y un margen de error del 5%? Además, se sabe que el año pasado
egresaron 2620 jóvenes de todas las maestrías en Publicidad de Lima.
Rpta: 784

56.El jefe de la oficina de seguridad del distrito de San Borja desea realizar una estimación de
cuánto tiempo, en promedio, estarían dispuestos a permanecer los vecinos escuchando charlas
sobre seguridad vecinal. En estudios anteriores se estimó que el tiempo promedio era de 45,25
minutos con una varianza de 18,75 minutos 2, ¿A cuántas personas se debería entrevistar si se
estima un error máximo de un minuto y una confianza del 95%? Suponga que esta variable se
distribuye normalmente.
Rpta: 73
Estadística para comunicadores 146
Estadística para comunicadores 147

Muestreo probabilístico

Los métodos de muestreo probabilísticos son aquellos que se basan en el principio de equiprobabi-
lidad. Es decir, aquellos en los que todos los individuos tienen la misma probabilidad de ser elegi-
dos para formar parte de una muestra y, consiguientemente, todas las posibles muestras de tama -
ño n tienen la misma probabilidad de ser seleccionadas.

Sólo estos métodos de muestreo probabilísticos nos aseguran la representatividad de la muestra


extraída y son, por tanto, los más recomendables.

Dentro de los métodos de muestreo probabilísticos encontramos los siguientes tipos:

aleatorio simple sistemático estratificado

Se selecciona una muestra Se selecciona un primer Se selecciona la muestra de


en forma aleatoria y sin elemento aleatoriamente y, los diversos estratos. Un
reemplazo a n unidades de luego, los demás elementos estrato es una parte de la
muestreo de una población que conformarán la muestra población, cuyos elementos
que contiene un total de N cada cierto intervalo. Este tienen características
unidades. Se garantiza que muestreo supone que se similares. El objetivo de
cada una de las muestras cuenta con una estratificar la población es
posibles tiene la misma enumeración completa de buscar homogeneidad entre
probabilidad de ser elegida. los elementos de la los estratos.
población.
Estadística para comunicadores 148

Ficha técnica

La ficha técnica es el documento donde consta la metodología y el proceso que se ha seguido para
realizar un estudio social o de mercado.

En el caso de los estudios cuantitativos, se suele incluir la información siguiente:


 Descripción del universo
 Metodología de selección de la muestra
 Tamaño muestral
 Nivel de confianza y margen de error con el que se presentan los resultados
 Técnica aplicada para realizar el trabajo de campo
 Período de recogida de la información
Ejemplo de ficha técnica
Estadística para comunicadores 149

Población muestreada
Es el conjunto de todas las unidades elementales posibles que podrían extraerse en una muestra;
es decir, es la población de donde se extrae la muestra.

Unidad de muestreo
Es la unidad donde realizamos la muestra. Por ejemplo, si queremos estudiar a las personas pero
no tenemos la lista de todos los individuos que pertenecen a la población objetivo, la unidad de
muestreo sería cada familia y la unidad elemental sería cada individuo que vive en la familia

Marco muestral
Es una lista de las unidades de muestreo que estan disponibles para elección

Para las encuestas telefónicas el marco de muestreo podría ser una lista de todos los números tele -
fónicos residenciales de la ciudad; para las entrevistas personales una lista de las direcciones de to -
das las calles; para una encuesta de agricultura una lista de todas las granjas o un mapa con todas
las áreas que contienen granjas.
Estadística para comunicadores 150
El muestreo se ilustrará con el siguiente esquema:

Se tiene una población de tamaño N

Marco muestral: N trabajadores registrados

Se registran las N unidades elementales en el


marco muestral.

Para realizar la estimación del promedio, es necesario determinar, en primer lugar, ¿a cuántas
unidades elementales debemos entrevistar?

Si se conoce el tamaño de la población N, el tamaño


Establecemos un nivel de confianza, un de la muestra se corrige con la siguiente fórmula:
margen de error y estimamos la desviación ݊
estándar de la variable en estudio. La ݊௖ ൌ ݊
fórmula es la siguiente: ͳ൅
ܰ
‫ ݏ‬ଶ
‫ݖ‬ቀଵିఈቁ ൈ

݊ൌ
൭ ൱
݁

Para seleccionar a las n unidades elementales usaremos muestreo aleatorio simple. La tabla de números
aleatorios nos permitirá seleccionar a estos elementos.
C1 C2 C3 C4 C5 C6 C7 C8 C9 C10 C11 C12 C13 C14 C15 C16 C17 C18 C19 C20
4 8 2 4 6 6 3 5 4 5 6 0 5 2 6 9 8 0 0 9
9 2 9 8 1 4 4 1 9 8 5 1 1 9 7 9 8 5 9 0
0 2 1 3 3 9 1 6 2 9 7 1 2 6 6 0 7 5 6 4

Una vez obtenida la muestra, realizar la


estimación
Estadística para Comunicadores 151

Ejemplo 62
Se tiene una población de 108 trabajadores de una empresa y se desea estimar el tiempo prome-
dio de servicio a partir de una muestra elegida al azar.

N = 108 trabajadores

Si queremos estimar el tiempo pro-


medio, en años, que tienen los traba-
jadores en la empresa, ¿a cuántos
trabajadores debemos entrevistar?

(( ) )
2
z α
×s
1−
2 = 9,8 = … trabajadores
n=
e

n=…

Para seleccionar una muestra de trabajado-


res mediante muestreo aleatorio simple,
usar las columnas: C12, C5, C10 de la tabla
de números aleatorios (completar la tabla)

Una vez obtenida la muestra,


¿qué le preguntaremos a cada
elemento?

Posición
Trabajador X= …
(en la tabla de números aleatorios)
1
2
3
4
5
6
7
8
9
10
Promedio
Estadística para comunicadores 152
Se seleccionarán los elementos del marco muestral que conformarán la muestra usando la Tabla
de números aleatorios.

Marco muestral: Trabajadores registrados


Nº Ingreso Tiempo   Nº Ingreso Tiempo   Nº Ingreso Tiempo
1 2300 5   37 2600 16   73 1800 3
2 2800 11   38 2700 18   74 1700 5
3 2400 4   39 2100 11   75 1700 4
4 2500 2   40 2300 14   76 1700 0
5 2300 3   41 1700 0   77 1700 1
6 2100 2   42 2200 13   78 2100 6
7 1700 2   43 2900 20   79 2600 17
8 2000 0   44 1800 5   80 2400 9
9 2200 7   45 2100 16   81 2600 19
10 2100 4   46 2000 12   82 1900 7
11 1700 0   47 2000 12   83 1600 0
12 2500 2   48 2900 20   84 1900 3
13 2800 13   49 2100 13   85 2100 14
14 2400 9   50 2100 9   86 1700 0
15 1700 1   51 1800 1   87 2100 15
16 2400 9   52 2000 9   88 1700 1
17 2200 10   53 2100 10   89 2300 14
18 2200 4   54 1900 4   90 2500 16
19 2300 10   55 2000 10   91 2600 18
20 2800 11   56 2300 11   92 1900 3
21 2100 7   57 2000 7   93 2500 19
22 1700 1   58 1700 1   94 1800 6
23 2500 6   59 1900 6   95 1700 2
24 2400 9   60 2000 9   96 2000 10
25 2700 17   61 2400 17   97 2400 16
26 1700 0   62 1700 0   98 1700 0
27 1600 2   63 1700 2   99 2500 12
28 2600 17   64 2400 17   100 1700 3
29 2500 13   65 2500 13   101 2400 17
30 2500 16   66 2600 16   102 2400 16
31 2700 17   67 2100 14   103 1900 7
32 1700 1   68 1900 7   104 1700 1
33 1600 1   69 2000 9   105 2100 6
34 2400 11   70 1800 7   106 2000 5
35 1900 3   71 2100 10   107 2000 3
36 1800 5   72 2300 12   108 2500 13

Tabla de números aleatorios

C1 C2 C3 C4 C5 C6 C7 C8 C9 C10 C11 C12 C13 C14 C15 C16 C17 C18 C19 C20
4 8 2 4 6 6 3 5 4 5 6 0 5 2 6 9 8 0 0 9
Estadística para comunicadores 153
9 2 9 8 1 4 4 1 9 8 5 1 1 9 7 9 8 5 9 0
0 2 1 3 3 9 1 6 2 9 7 1 2 6 6 0 7 5 6 4
9 6 0 8 3 5 6 6 6 4 0 8 6 3 4 8 1 8 5 4
1 6 4 1 6 5 2 7 7 2 9 9 9 9 7 4 1 5 4 9
2 9 0 5 5 0 8 4 8 7 4 6 2 1 7 0 1 5 8 7
6 1 2 9 5 0 4 0 9 8 2 0 2 6 8 7 0 1 9 7
1 3 1 8 9 9 0 1 2 6 3 7 1 9 6 1 7 9 9 8
4 5 8 1 1 4 5 6 7 9 9 9 2 1 3 2 3 7 7 9
0 0 3 6 9 6 5 0 6 4 7 9 8 1 2 4 4 8 3 6
7 2 4 5 4 1 2 4 4 6 9 2 6 6 6 5 2 0 0 4
4 9 3 4 4 2 4 5 9 0 8 7 4 8 4 2 1 2 5 4
6 1 2 8 1 3 3 2 0 2 6 0 7 2 7 9 1 4 6 5
9 3 4 0 8 1 3 3 7 3 2 4 8 6 7 9 0 6 2 8
1 8 7 1 3 4 3 9 3 1 7 8 3 7 3 3 0 8 3 5
0 2 1 4 7 5 7 3 1 1 9 3 3 8 7 4 8 0 2 5
3 6 3 4 1 9 8 1 0 9 0 1 1 0 9 3 6 8 6 0
9 4 6 7 6 7 9 1 2 2 7 2 3 9 3 4 6 9 8 1
5 9 9 8 4 4 5 9 1 5 4 7 3 0 6 8 1 6 8 1
8 1 8 8 2 3 9 1 4 2 4 9 1 4 0 6 0 3 2 8
0 5 3 8 0 4 3 9 4 6 0 8 8 3 8 7 1 2 2 3
9 7 1 4 2 7 5 5 2 8 6 6 3 5 5 9 9 0 6 8
6 9 5 9 4 9 1 8 2 0 2 5 3 9 1 2 0 3 0 8
7 4 9 1 4 8 8 6 6 8 5 9 4 8 5 7 7 9 6 7
3 8 1 2 2 4 0 1 4 5 7 7 4 0 4 8 9 4 7 0
9 9 9 7 8 0 0 9 3 2 7 0 5 0 2 7 8 7 3 6
4 8 1 5 8 5 5 1 4 9 6 4 4 4 7 4 5 7 5 0
8 6 7 3 6 1 7 1 1 3 5 5 7 4 4 7 6 7 2 8
4 7 1 4 0 3 6 2 4 4 4 4 0 3 6 3 4 1 2 8
6 5 5 8 8 4 3 4 8 9 0 6 7 6 0 0 8 6 8 4
9 2 0 9 8 2 8 3 4 3 2 8 9 4 8 7 9 4 9 4
1 3 7 9 4 8 3 7 0 8 6 6 6 8 4 1 1 3 1 3
3 3 2 5 6 7 6 1 6 6 1 7 6 5 8 1 6 2 2 7
9 9 9 8 2 8 8 1 9 1 6 2 7 5 1 8 6 1 4 4
1 7 5 4 0 9 5 7 8 7 5 0 8 6 6 2 5 3 2 3
2 7 1 7 8 8 3 8 6 9 9 2 7 4 5 9 5 6 6 6
6 0 9 2 6 1 5 1 2 3 1 8 1 2 0 8 6 4 4 0
3 3 6 3 4 9 6 4 4 9 8 5 7 3 3 4 2 3 2 8
0 1 9 7 9 7 9 4 4 1 6 6 7 7 0 7 9 8 6 8
4 7 1 5 3 7 0 9 2 5 2 1 0 0 4 0 4 6 8 8
7 8 9 9 6 8 5 6 8 1 9 2 7 5 1 7 0 1 5 5
2 2 3 3 1 8 1 9 8 4 2 8 5 2 8 1 7 6 4 6
2 6 6 4 1 4 8 1 0 6 0 1 3 4 0 9 1 2 8 6
5 1 9 0 3 9 1 6 1 7 8 8 2 8 0 7 8 4 8 0
9 0 5 8 4 9 2 2 3 9 8 5 9 5 7 8 4 9 9 4
8 6 1 9 2 5 0 0 7 9 0 0 7 4 5 4 8 6 2 3
1 9 1 0 9 7 5 1 2 7 1 9 4 8 4 8 9 6 6 9
5 6 0 6 1 3 3 5 2 1 0 1 9 2 8 0 2 6 6 3
8 6 9 9 8 0 8 1 8 2 6 6 8 4 0 7 8 2 5 1
3 1 6 1 0 5 7 5 7 0 6 3 0 4 1 4 0 3 0 8
Estadística para comunicadores 154

Técnicas de muestreo
Muestreo aleatorio simple
Es el procedimiento por el cual se selecciona una muestra en forma aleatoria y sin reemplazo a n
unidades de muestreo de una población que contiene un total de N unidades.

Se garantiza que cada una de las muestras posibles tiene la misma probabilidad de ser elegida.

Pasos por seguir para seleccionar una muestra simple aleatoria

1. Enumere las unidades del marco muestral con números sucesivos.


2. Seleccione tantos elementos del marco muestral como sea el tamaño requerido de la muestra
usando una tabla de números aleatorios. La selección de las unidades debe ser sin reemplazo.

El muestreo aleatorio simple presenta dos propiedades:

 Equiprobable: Cada unidad tiene las mismas posibilidades de ser elegida.

 Independencia: La selección de una unidad no influye en la selección de otras unidades.

Pero en el mundo real es difícil encontrar muestras completamente independientes y representati -


vas.

Por ejemplo, hacer una encuesta a los votantes marcando números de teléfono al azar es un méto -
do no representativo pues no tiene en cuenta a los votantes que no disponen de teléfono y cuenta
varias veces a los que tienen varios números.
Estadística para comunicadores 155

Ejemplo 63
El director de una revista tiene información de todo su personal y desea obtener una muestra alea -
toria de trabajadores. El registro se muestra a continuación:

Trabajadores registrados
N° Tiempo de servicio Edad N° Tiempo de servicio Edad N° Tiempo de servicio Edad
1 73 23 41 106 45 81 99 49
2 96 46 42 99 49 82 131 32
3 110 67 43 94 35 83 131 32
4 105 60 44 98 30 84 93 42
5 91 43 45 98 30 85 104 53
6 90 36 46 99 49 86 81 29
7 129 46 47 98 30 87 124 56
8 129 46 48 98 30 88 98 56
9 91 43 49 73 23 89 98 56
10 96 46 50 73 23 90 106 45
11 110 67 51 95 33 91 129 46
12 129 46 52 95 33 92 106 45
13 100 35 53 96 46 93 129 46
14 99 49 54 96 46 94 124 56
15 113 55 55 110 67 95 98 56
16 101 39 56 124 56 96 98 56
17 86 45 57 90 36 97 104 53
18 104 42 58 90 36 98 106 45
19 126 57 59 101 35 99 129 46
20 98 30 60 101 35 100 124 56
21 126 58 61 124 56 101 98 56
22 98 30 62 95 33 102 117 30
23 101 39 63 95 33 103 99 49
24 86 40 64 96 42 104 104 33
25 104 42 65 96 46 105 94 35
26 99 49 66 110 67 106 101 39
27 113 55 67 124 56 107 123 44
28 98 30 68 99 49 108 98 30
29 126 57 69 131 32 109 88 60
30 98 31 70 131 33 110 123 40
31 104 53 71 113 55 111 98 30
32 104 53 72 94 35 112 88 59
33 81 29 73 93 42 113 101 39
34 124 56 74 91 47 114 117 30
35 91 43 75 91 47 115 90 36
36 106 45 76 86 41 116 98 30
37 106 45 77 93 42 117 88 59
38 91 43 78 91 47 118 123 40
39 104 63 79 91 47 119 98 30
40 104 53 80 86 45 120 88 59

a. Para seleccionar una muestra de 12 trabajadores aplique el muestreo simple aleatorio. Elabore
un listado con el número seleccionado y el valor de su tiempo de servicio y edad. Utilice para la
selección las columnas: C14; C7; C10; C15 y C1 de la tabla de números aleatorios.
b. Con la muestra seleccionada, calcule el tiempo promedio de servicio y el porcentaje de trabaja -
dores mayores de 40 años.
Estadística para comunicadores 156

Solución
Como el marco muestral tiene 120 elementos o unidades elementales, comenzar a usar las co -
lumnas C14, C15 y C16 para elegir números de tres cifras del 1 al 120.
a. Elabore un listado con el número seleccionado y el valor de su tiempo de servicio y lugar de pro-
cedencia.
Tabla de números aleatorios
C1 C2 C3 C4 C5 C6 C7 C8 C9 C10 C11 C12 C13 C14 C15 C16 C17 C18 C19 C20
4 8 2 4 6 6 3 5 4 5 6 0 5 2 6 9 8 0 0 9
9 2 9 8 1 4 4 1 9 8 5 1 1 9 7 9 8 5 9 0
0 2 1 3 3 9 1 6 2 9 7 1 2 6 6 0 7 5 6 4
9 6 0 8 3 5 6 6 6 4 0 8 6 3 4 8 1 8 5 4
1 6 4 1 6 5 2 7 7 2 9 9 9 9 7 4 1 5 4 9
2 9 0 5 5 0 8 4 8 7 4 6 2 1 7 0 1 5 8 7
6 1 2 9 5 0 4 0 9 8 2 0 2 6 8 7 0 1 9 7
1 3 1 8 9 9 0 1 2 6 3 7 1 9 6 1 7 9 9 8
4 5 8 1 1 4 5 6 7 9 9 9 2 1 3 2 3 7 7 9
0 0 3 6 9 6 5 0 6 4 7 9 8 1 2 4 4 8 3 6
7 2 4 5 4 1 2 4 4 6 9 2 6 6 6 5 2 0 0 4
4 9 3 4 4 2 4 5 9 0 8 7 4 8 4 2 1 2 5 4
6 1 2 8 1 3 3 2 0 2 6 0 7 2 7 9 1 4 6 5
9 3 4 0 8 1 3 3 7 3 2 4 8 6 7 9 0 6 2 8
1 8 7 1 3 4 3 9 3 1 7 8 3 7 3 3 0 8 3 5
0 2 1 4 7 5 7 3 1 1 9 3 3 8 7 4 8 0 2 5
3 6 3 4 1 9 8 1 0 9 0 1 1 0 9 3 6 8 6 0
9 4 6 7 6 7 9 1 2 2 7 2 3 9 3 4 6 9 8 1
5 9 9 8 4 4 5 9 1 5 4 7 3 0 6 8 1 6 8 1
8 1 8 8 2 3 9 1 4 2 4 9 1 4 0 6 0 3 2 8
0 5 3 8 0 4 3 9 4 6 0 8 8 3 8 7 1 2 2 3
9 7 1 4 2 7 5 5 2 8 6 6 3 5 5 9 9 0 6 8
6 9 5 9 4 9 1 8 2 0 2 5 3 9 1 2 0 3 0 8
7 4 9 1 4 8 8 6 6 8 5 9 4 8 5 7 7 9 6 7
3 8 1 2 2 4 0 1 4 5 7 7 4 0 4 8 9 4 7 0
9 9 9 7 8 0 0 9 3 2 7 0 5 0 2 7 8 7 3 6
4 8 1 5 8 5 5 1 4 9 6 4 4 4 7 4 5 7 5 0
8 6 7 3 6 1 7 1 1 3 5 5 7 4 4 7 6 7 2 8
4 7 1 4 0 3 6 2 4 4 4 4 0 3 6 3 4 1 2 8
6 5 5 8 8 4 3 4 8 9 0 6 7 6 0 0 8 6 8 4
9 2 0 9 8 2 8 3 4 3 2 8 9 4 8 7 9 4 9 4
1 3 7 9 4 8 3 7 0 8 6 6 6 8 4 1 1 3 1 3
3 3 2 5 6 7 6 1 6 6 1 7 6 5 8 1 6 2 2 7
9 9 9 8 2 8 8 1 9 1 6 2 7 5 1 8 6 1 4 4
1 7 5 4 0 9 5 7 8 7 5 0 8 6 6 2 5 3 2 3
2 7 1 7 8 8 3 8 6 9 9 2 7 4 5 9 5 6 6 6
6 0 9 2 6 1 5 1 2 3 1 8 1 2 0 8 6 4 4 0
3 3 6 3 4 9 6 4 4 9 8 5 7 3 3 4 2 3 2 8
0 1 9 7 9 7 9 4 4 1 6 6 7 7 0 7 9 8 6 8
4 7 1 5 3 7 0 9 2 5 2 1 0 0 4 0 4 6 8 8
7 8 9 9 6 8 5 6 8 1 9 2 7 5 1 7 0 1 5 5
2 2 3 3 1 8 1 9 8 4 2 8 5 2 8 1 7 6 4 6
2 6 6 4 1 4 8 1 0 6 0 1 3 4 0 9 1 2 8 6
5 1 9 0 3 9 1 6 1 7 8 8 2 8 0 7 8 4 8 0
9 0 5 8 4 9 2 2 3 9 8 5 9 5 7 8 4 9 9 4
8 6 1 9 2 5 0 0 7 9 0 0 7 4 5 4 8 6 2 3
1 9 1 0 9 7 5 1 2 7 1 9 4 8 4 8 9 6 6 9
5 6 0 6 1 3 3 5 2 1 0 1 9 2 8 0 2 6 6 3
8 6 9 9 8 0 8 1 8 2 6 6 8 4 0 7 8 2 5 1
3 1 6 1 0 5 7 5 7 0 6 3 0 4 1 4 0 3 0 8
Estadística para comunicadores 157

Trabajador Posición Tiempo de servicio Edad


1 93 129 46
2 68 99 49
3 48 98 30
4 27 113 55
5 40 104 53
6 12 129 46
7 14 99 49
8 92 106 45
9 7 129 46
10 87 124 56
11 25 104 42
12 101 98 56

b. Con la muestra seleccionada, calcule el tiempo promedio de servicio y el porcentaje de trabaja -


dores mayores de 40 años.

Solución
El tiempo promedio de servicio es x=111meses.

11
El porcentaje de trabajadores mayores de 40 años es ×100 %=91,67 % .
12
Estadística para comunicadores 158

Ejercicio de aplicación

57.Una empresa tiene un total de 150 trabajadores y ha registrado información acerca de las
variables: ingreso mensual, en soles (Ingreso) y años cumplidos en la empresa (Años).

Marco muestral: Trabajadores de la empresa


Nº Ingreso Años Nº Ingreso Años Nº Ingreso Años Nº Ingreso Años
1 2300 5 39 2600 16 77 1800 3 115 1700 3
2 2800 11 40 2700 18 78 1700 5 116 2600 19
3 2400 4 41 2100 11 79 1700 4 117 1600 1
4 2500 2 42 2300 14 80 1700 0 118 1800 6
5 2300 3 43 1700 0 81 1700 1 119 2100 10
6 2100 2 44 2200 13 82 2100 6 120 1700 0
7 1700 2 45 2900 20 83 2600 17 121 2400 16
8 2000 0 46 1800 5 84 2400 9 122 2600 17
9 2200 7 47 2100 16 85 2600 19 123 2100 10
10 2100 4 48 2000 12 86 1900 7 124 2100 8
11 1700 0 49 2000 12 87 1600 0 125 2400 17
12 2500 2 50 2900 20 88 1900 3 126 1700 1
13 2800 13 51 2100 13 89 2100 14 127 2600 20
14 2400 9 52 2100 9 90 1700 0 128 2400 16
15 1700 1 53 1800 1 91 2100 15 129 2700 17
16 2400 9 54 2000 9 92 1700 1 130 2100 12
17 2200 10 55 2100 10 93 2300 14 131 1600 0
18 2200 4 56 1900 4 94 2500 16 132 2100 15
19 2300 10 57 2000 10 95 2600 18 133 1900 5
20 2800 11 58 2300 11 96 1900 3 134 2100 12
21 2100 7 59 2000 7 97 2500 19 135 2200 12
22 1700 1 60 1700 1 98 1800 6 136 2400 13
23 2500 6 61 1900 6 99 1700 2 137 1800 4
24 2400 9 62 2000 9 100 2000 10 138 2600 17
25 2700 17 63 2400 17 101 2400 16 139 2700 20
26 1700 0 64 1700 0 102 1700 0 140 2500 16
27 1600 2 65 1700 2 103 2500 12 141 2500 16
28 2600 17 66 2400 17 104 1700 3 142 1900 6
29 2500 13 67 2500 13 105 2400 17 143 2100 15
30 2500 16 68 2600 16 106 2400 16 144 1700 9
31 2700 17 69 2100 14 107 1900 7 145 1500 0
32 1700 1 70 1900 7 108 1700 1 146 1800 18
33 1600 1 71 2000 9 109 2100 6 147 2100 10
34 2400 11 72 1800 7 110 2000 5 148 2700 19
35 1900 3 73 2100 10 111 2000 3 149 1800 9
36 1800 5 74 2300 12 112 2500 13 150 2100 15
37 1800 3 75 2700 20 113 1700 0
38 2400 14 76 2800 20 114 2500 19

a. Seleccione una muestra de 16 trabajadores usando muestreo simple aleatorio. Elabore un lista-
do con el número seleccionado y el valor del ingreso mensual y años en la empresa. Use las co -
lumnas C2, C10, C11 y C15 de la tabla de números aleatorios.
b. Con la muestra, estime e interprete las medidas de tendencia central para el ingreso mensual.
c. Con la muestra, estime e interprete los cuartiles para la variable años en la empresa.
Estadística para comunicadores 159

Solución
Seleccionemos tantos elementos del marco muestral como sea el tamaño requerido de la muestra.
Como el marco muestral tiene ………. elementos usaremos las columnas ………………………. para elegir
números de ………. cifras.

a. Elabore un listado con el número seleccionado y el valor del ingreso mensual y años en la em-
presa:

Posición

Ingreso mensual

Años en la empresa

Posición

Ingreso mensual

Años en la empresa

b. Con la muestra obtenida estime e interprete las medidas de tendencia central para la variable
ingreso mensual.

Valor Interpretación

Media

Mediana

Moda

c. Con la muestra obtenida estime e interprete los cuartiles para la variable años en la empresa.

Ordenamos los datos.

Años en la empresa

Años en la empresa

Valor Interpretación

Cuartil 1

Cuartil 2

Cuartil 3
Estadística para comunicadores 160

Muestreo estratificado
Estratificar significa dividir a la población en varias partes de acuerdo con ciertas características de
sus elementos. El objetivo del diseño estratificado es dar un tratamiento especial a cada estrato, ya
sea por razones administrativas, de costo, logísticas o minimizar variabilidad.

Pasos a seguir para seleccionar una muestra estratificada


1. Divida a la población en estratos que sean mutuamente excluyentes. Esto es, que incluyan a to-
dos los elementos de la población y que cada elemento pertenezca solamente a un estrato.
2. Una vez conocido el tamaño de muestra a seleccionar, calcule la cantidad de elementos a selec -
cionar en cada estrato de manera proporcional al tamaño del estrato. Use redondeo simple. El
tamaño de muestra para cada estrato se obtiene mediante la siguiente fórmula:

Nh
n h= ×n
N

3. La selección de los elementos para cada uno de los estratos puede ser mediante muestreo alea -
torio simple o muestreo sistemático.

N Estrato 1: N1 Estrato 2: N2 Estrato h: Nh

n n1 n2 nh

El tamaño de muestra para cada estrato se obtiene por asignación proporcional


Nh
nh = ×n
N

Debe cumplir:
1. Homogeneidad entre elementos de cada estrato
2. Heterogeneidad entre los elementos de cada estrato
Estadística para comunicadores 161

Recomendaciones para el uso de muestras estratificadas


 Si se tiene que usar más de una variable para formar los estratos, cuidar que estas no estén re -
lacionadas entre sí.
 No se deben considerar la formación de muchos estratos, generalmente se usan entre tres y
ocho estratos.
 Los estratos pequeños no contribuyen mucho a la reducción del error, por lo tanto, pueden no
ser considerados.
 La variable de estratificación la suele sugerir el investigador o el estadístico.
Estadística para Comunicadores 162

Ejemplo 64
La empresa de telecomunicaciones RVTV tiene 120 empleados de los cuales tiene información de
las variables: ingreso mensual, en soles; nivel de educación y años en la empresa (Años).
In- Nivel de In- Nivel de In- Nivel de
Nº Años Nº Años Nº Años
greso educación greso educación greso educación
1 2300 Secundaria 5 41 2100 Técnica 13 81 2000 Superior 3
2 2800 Secundaria 11 42 2100 Técnica 9 82 2500 Superior 13
3 2400 Secundaria 4 43 1800 Técnica 1 83 1700 Superior 0
4 2500 Secundaria 2 44 2000 Técnica 9 84 2500 Superior 19
5 2300 Secundaria 3 45 2100 Técnica 10 85 1700 Superior 3
6 2100 Secundaria 2 46 1900 Técnica 4 86 2600 Superior 19
7 1700 Secundaria 2 47 2000 Técnica 10 87 1600 Superior 1
8 2000 Secundaria 0 48 2300 Técnica 11 88 1800 Superior 6
9 2200 Secundaria 7 49 2000 Técnica 7 89 2100 Superior 10
10 2100 Secundaria 4 50 1700 Técnica 1 90 1700 Superior 0
11 1700 Secundaria 0 51 1700 Técnica 1 91 2400 Superior 16
12 2500 Secundaria 2 52 2100 Técnica 6 92 2600 Superior 17
13 2800 Secundaria 13 53 2600 Técnica 17 93 2100 Superior 10
14 2400 Secundaria 9 54 2400 Técnica 9 94 2100 Superior 8
15 1700 Secundaria 1 55 2600 Técnica 19 95 2400 Superior 17
16 2400 Secundaria 9 56 1900 Técnica 7 96 1700 Superior 1
17 2200 Secundaria 10 57 1600 Técnica 0 97 2600 Superior 20
18 2200 Secundaria 4 58 1900 Técnica 3 98 2400 Superior 16
19 2300 Secundaria 10 59 2100 Técnica 14 99 2700 Superior 17
20 2800 Secundaria 11 60 1700 Técnica 0 100 2100 Superior 12
21 2100 Secundaria 7 61 2100 Técnica 15 101 1600 Superior 0
22 1700 Secundaria 1 62 1700 Técnica 1 102 2100 Superior 15
23 2500 Secundaria 6 63 2300 Técnica 14 103 1900 Superior 5
24 2400 Secundaria 9 64 2500 Técnica 16 104 2100 Superior 12
25 2700 Secundaria 17 65 2600 Técnica 18 105 2200 Superior 12
26 1700 Secundaria 0 66 1900 Técnica 3 106 2400 Superior 13
27 1600 Secundaria 2 67 2500 Técnica 19 107 1800 Superior 4
28 2600 Secundaria 17 68 1800 Técnica 6 108 2600 Superior 17
29 2500 Secundaria 13 69 1700 Técnica 2 109 2700 Superior 20
30 2500 Secundaria 16 70 2000 Técnica 10 110 2500 Superior 16
31 2100 Técnica 11 71 2400 Técnica 16 111 2500 Superior 16
32 2300 Técnica 14 72 1700 Técnica 0 112 1900 Superior 6
33 1700 Técnica 0 73 2500 Técnica 12 113 2100 Superior 15
34 2200 Técnica 13 74 1700 Técnica 3 114 1700 Superior 9
35 2900 Técnica 20 75 2400 Técnica 17 115 1500 Superior 0
36 1800 Técnica 5 76 2400 Técnica 16 116 1800 Superior 18
37 2100 Técnica 16 77 1900 Técnica 7 117 2100 Superior 10
38 2000 Técnica 12 78 1700 Técnica 1 118 2700 Superior 19
39 2000 Técnica 12 79 2100 Técnica 6 119 1800 Superior 9
40 2900 Técnica 20 80 2000 Técnica 5 120 2100 Superior 15

a. Aplique el muestreo estratificado para seleccionar una muestra de 16 empleados. Use como va-
riable de estratificación el nivel de educación. Elabore un listado identificando el número selec -
cionado y el valor respectivo de los años cumplidos en la empresa. Para el estrato 1 use las co -
lumnas C1, C3 y C5, para el estrato 2 use las columnas C8, C9, C10 y C11 y para el estrato 3 use
C4, C3, C5 y C7.
b. Con la muestra, calcule la proporción de empleados que tienen más de 12 años en la empresa.
Estadística para comunicadores 163

Solución
a. Aplique el muestreo estratificado para seleccionar una muestra de 16 empleados. Use como va -
riable de estratificación el nivel de educación. Elabore un listado identificando el número selec -
cionado y el valor respectivo de los años cumplidos en la empresa.

Para el estrato 1 use las columnas C1, C3 y C5, para el estrato 2 use las columnas C8, C9, C10 y
C11 y para el estrato 3 use C4, C3, C5 y C7.

Se divide a la población en estratos que sean mutuamente excluyentes, luego los estratos 1, 2 y
3 son: secundaria, técnica y superior, respectivamente. Para cada uno de los estratos, seleccio-
namos muestras aleatorias simples.

Cantidad seleccionada por estrato


Números de elemen- Posiciones Nh
Estrato
tos en el estrato Nh (desde – hasta) n h= ×n
N
N1 30
Secundaria N1 = 30 1 – 30 n1 = × n= × 16=4
N 120
N2 50
Técnica N2 = 50 31 – 80 n2 = × n= × 16=6,67 ≈7
N 120
N 40
Superior N3 = 40 81 – 120 n3 = 3 × n= ×16=5,33≈ 5
N 120
Total N = 120 n = 16

Para el estrato Secundaria, realizamos un muestreo aleatorio simple usando las columnas C1,
C3 y C5. Observemos que las posiciones de los primeros elementos a elegir están entre 1 y 30.

Tabla de números aleatorios


C1 C2 C3 C4 C5 C6 C7 C8 C9 C10 C11 C12 C13 C14 C15 C16 C17 C18
4 8 2 4 6 6 3 5 4 5 6 0 5 2 6 9 8 0
9 2 9 8 1 4 4 1 9 8 5 1 1 9 7 9 8 5
0 2 1 3 3 9 1 6 2 9 7 1 2 6 6 0 7 5
9 6 0 8 3 5 6 6 6 4 0 8 6 3 4 8 1 8
1 6 4 1 6 5 2 7 7 2 9 9 9 9 7 4 1 5
2 9 0 5 5 0 8 4 8 7 4 6 2 1 7 0 1 5
6 1 2 9 5 0 4 0 9 8 2 0 2 6 8 7 0 1
1 3 1 8 9 9 0 1 2 6 3 7 1 9 6 1 7 9

Luego, el cuadro con los datos elementos seleccionados para el estrato Secundaria es:
Estrato Secundaria
Posición 2 16 29 13
Años en la empresa 11 9 13 13

Para el estrato Técnica, realizamos un muestreo aleatorio simple usando las columnas C8, C9,
C10 y C11. Observemos que las posiciones de los elementos a elegir están entre 31 y 80.

Tabla de números aleatorios


C1 C2 C3 C4 C5 C6 C7 C8 C9 C10 C11 C12 C13 C14 C15 C16 C17 C18 C19 C20
4 8 2 4 6 6 3 5 4 5 6 0 5 2 6 9 8 0 0 9
9 2 9 8 1 4 4 1 9 8 5 1 1 9 7 9 8 5 9 0
Estadística para comunicadores 164
0 2 1 3 3 9 1 6 2 9 7 1 2 6 6 0 7 5 6 4
9 6 0 8 3 5 6 6 6 4 0 8 6 3 4 8 1 8 5 4
1 6 4 1 6 5 2 7 7 2 9 9 9 9 7 4 1 5 4 9
2 9 0 5 5 0 8 4 8 7 4 6 2 1 7 0 1 5 8 7

Luego, el cuadro con los datos elementos seleccionados para el estrato Técnica es:

Estrato Técnica
Posición 54 62 66 77 48 67 44

Años en la empresa 9 1 3 7 11 19 9

Para el estrato Superior, realizamos un muestreo aleatorio simple usando las columnas C4, C3,
C5 y C7. Observemos que las posiciones de los elementos a elegir están entre 81 y 120.

Tabla de números aleatorios


C1 C2 C3 C4 C5 C6 C7 C8 C9 C10 C11 C12 C13 C14 C15 C16 C17 C18 C19 C20
4 8 2 4 6 6 3 5 4 5 6 0 5 2 6 9 8 0 0 9
9 2 9 8 1 4 4 1 9 8 5 1 1 9 7 9 8 5 9 0
1 3 1 8 9 9 0 1 2 6 3 7 1 9 6 1 7 9 9 8
4 5 8 1 1 4 5 6 7 9 9 9 2 1 3 2 3 7 7 9
0 0 3 6 9 6 5 0 6 4 7 9 8 1 2 4 4 8 3 6
7 2 4 5 4 1 2 4 4 6 9 2 6 6 6 5 2 0 0 4
4 9 3 4 4 2 4 5 9 0 8 7 4 8 4 2 1 2 5 4
6 1 2 8 1 3 3 2 0 2 6 0 7 2 7 9 1 4 6 5
9 3 4 0 8 1 3 3 7 3 2 4 8 6 7 9 0 6 2 8
1 8 7 1 3 4 3 9 3 1 7 8 3 7 3 3 0 8 3 5

Luego, el cuadro con los datos elementos seleccionados para el estrato Superior es:

Estrato Superior
Posición 114 81 97 105 83
Años en la empresa 9 3 20 12 0

b. Con la muestra obtenida calcule la proporción de empleados que tienen más de 12 años en la
empresa.
Solución
Luego, con los elementos seleccionados se tiene que la proporción de empleados con más de
12 años en la empresa es igual a 4/16 = 0,25.
Estadística para comunicadores 165

Ejemplo 65
La siguiente tabla muestra a los 120 alumnos de la especialidad de Comunicaciones, de la universi-
dad A, a quienes se les preguntó por su aplicación preferida para escuchar música y por la cantidad
de horas a la semana que la usaba.

Posición App Horas Posición App Horas Posición App Horas


1 Spotify 8 41 Spotify 16 81 YouTube Music 14
2 Spotify 9 42 Spotify 9 82 YouTube Music 8
3 Spotify 14 43 Spotify 8 83 YouTube Music 7
4 Spotify 12 44 Spotify 9 84 YouTube Music 15
5 Spotify 10 45 Spotify 4 85 YouTube Music 5
6 Spotify 9 46 Spotify 6 86 YouTube Music 8
7 Spotify 4 47 Spotify 7 87 YouTube Music 7
8 Spotify 10 48 Spotify 9 88 Amazon Music 6
9 Spotify 12 49 Spotify 8 89 Amazon Music 9
10 Spotify 10 50 Spotify 10 90 Amazon Music 9
11 Spotify 11 51 Spotify 12 91 Amazon Music 4
12 Spotify 13 52 Spotify 11 92 Amazon Music 2
13 Spotify 4 53 Spotify 9 93 Amazon Music 11
14 Spotify 2 54 Spotify 8 94 Amazon Music 2
15 Spotify 6 55 Spotify 4 95 Amazon Music 3
16 Spotify 4 56 Spotify 6 96 Amazon Music 8
17 Spotify 9 57 Spotify 7 97 Amazon Music 6
18 Spotify 5 58 Spotify 8 98 Amazon Music 7
19 Spotify 12 59 Spotify 7 99 Amazon Music 9
20 Spotify 7 60 Spotify 3 100 Amazon Music 4
21 Spotify 4 61 Spotify 6 101 Amazon Music 8
22 Spotify 6 62 Spotify 9 102 Amazon Music 7
23 Spotify 7 63 Spotify 2 103 Amazon Music 7
24 Spotify 8 64 Spotify 5 104 Amazon Music 9
25 Spotify 9 65 Spotify 1 105 Amazon Music 6
26 Spotify 10 66 Spotify 4 106 Amazon Music 7
27 Spotify 5 67 YouTube Music 7 107 Amazon Music 9
28 Spotify 4 68 YouTube Music 6 108 Amazon Music 8
29 Spotify 7 69 YouTube Music 7 109 Amazon Music 3
30 Spotify 4 70 YouTube Music 8 110 Amazon Music 11
31 Spotify 4 71 YouTube Music 4 111 Amazon Music 13
32 Spotify 6 72 YouTube Music 5 112 Amazon Music 14
33 Spotify 7 73 YouTube Music 3 113 Amazon Music 9
34 Spotify 5 74 YouTube Music 6 114 Amazon Music 8
35 Spotify 8 75 YouTube Music 5 115 Amazon Music 6
36 Spotify 9 76 YouTube Music 8 116 Amazon Music 5
37 Spotify 4 77 YouTube Music 7 117 Amazon Music 7
38 Spotify 5 78 YouTube Music 9 118 Amazon Music 3
39 Spotify 2 79 YouTube Music 10 119 Amazon Music 6
40 Spotify 9 80 YouTube Music 3 120 Amazon Music 5
Estadística para comunicadores 166
a. Seleccione una muestra aleatoria de tamaño 12 mediante muestreo estratificado. Use la varia-
ble <aplicación preferida> como variable de estratificación. Elabore un listado con el alumno se -
leccionado y la cantidad de horas a la semana que escucha música con la aplicación de su prefe-
rencia.
Para el estrato 1 use las columnas C1, C5 y C9, para el estrato 2 use las columnas C7, C3, C8 y
C15 y para el estrato 3 use C15, C5, C8, C14, C1, y C7.

Solución

Posición Nh
Estrato Nh n h= ×n
(desde – hasta) N
N1 66
1. Spotify N1 = 66 1 - 66 n1 = × n= × 12=6,6 ≈ 7
N 120
N2 21
2. Youtube Music N2 = 21 67 - 87 n2 = × n= × 12=2,1 ≈ 2
N 120
N3 33
3. Amazon Music N3 = 33 88 - 120 n3 = × n= ×12=3,3 ≈ 3
N 120
Total N = 120 n=12

Estrato 1: Estrato 2: Estrato 3:


Spotify YouTube Music Amazon Music

Posición Horas Posición Horas Posición Horas


48 9 84 15 119 6
2 9 73 3 110 11
16 4 100 4
29 7
61 6
13 4
45 4

b. Con la muestra obtenida calcule el promedio de horas a la semana que los alumnos escuchan
música con la aplicación de su preferencia.

Solución
Entonces, con los doce elementos seleccionados en la muestra se tiene que la media muestral
de horas a la semana que los alumnos escuchan música a través de la aplicación de su preferen -
cia es 6,83 horas.
Estadística para comunicadores 167
Tabla de números aleatorios

C1 C2 C3 C4 C5 C6 C7 C8 C9 C10 C11 C12 C13 C14 C15 C16 C17 C18 C19 C20
4 8 2 4 6 6 3 5 4 5 6 0 5 2 6 9 8 0 0 9
9 2 9 8 1 4 4 1 9 8 5 1 1 9 7 9 8 5 9 0
0 2 1 3 3 9 1 6 2 9 7 1 2 6 6 0 7 5 6 4
9 6 0 8 3 5 6 6 6 4 0 8 6 3 4 8 1 8 5 4
1 6 4 1 6 5 2 7 7 2 9 9 9 9 7 4 1 5 4 9
2 9 0 5 5 0 8 4 8 7 4 6 2 1 7 0 1 5 8 7
6 1 2 9 5 0 4 0 9 8 2 0 2 6 8 7 0 1 9 7
1 3 1 8 9 9 0 1 2 6 3 7 1 9 6 1 7 9 9 8
4 5 8 1 1 4 5 6 7 9 9 9 2 1 3 2 3 7 7 9
0 0 3 6 9 6 5 0 6 4 7 9 8 1 2 4 4 8 3 6
7 2 4 5 4 1 2 4 4 6 9 2 6 6 6 5 2 0 0 4
4 9 3 4 4 2 4 5 9 0 8 7 4 8 4 2 1 2 5 4
6 1 2 8 1 3 3 2 0 2 6 0 7 2 7 9 1 4 6 5
9 3 4 0 8 1 3 3 7 3 2 4 8 6 7 9 0 6 2 8
1 8 7 1 3 4 3 9 3 1 7 8 3 7 3 3 0 8 3 5
0 2 1 4 7 5 7 3 1 1 9 3 3 8 7 4 8 0 2 5
3 6 3 4 1 9 8 1 0 9 0 1 1 0 9 3 6 8 6 0
9 4 6 7 6 7 9 1 2 2 7 2 3 9 3 4 6 9 8 1
5 9 9 8 4 4 5 9 1 5 4 7 3 0 6 8 1 6 8 1
8 1 8 8 2 3 9 1 4 2 4 9 1 4 0 6 0 3 2 8
0 5 3 8 0 4 3 9 4 6 0 8 8 3 8 7 1 2 2 3
9 7 1 4 2 7 5 5 2 8 6 6 3 5 5 9 9 0 6 8
6 9 5 9 4 9 1 8 2 0 2 5 3 9 1 2 0 3 0 8
7 4 9 1 4 8 8 6 6 8 5 9 4 8 5 7 7 9 6 7
3 8 1 2 2 4 0 1 4 5 7 7 4 0 4 8 9 4 7 0
9 9 9 7 8 0 0 9 3 2 7 0 5 0 2 7 8 7 3 6
4 8 1 5 8 5 5 1 4 9 6 4 4 4 7 4 5 7 5 0
8 6 7 3 6 1 7 1 1 3 5 5 7 4 4 7 6 7 2 8
4 7 1 4 0 3 6 2 4 4 4 4 0 3 6 3 4 1 2 8
6 5 5 8 8 4 3 4 8 9 0 6 7 6 0 0 8 6 8 4
9 2 0 9 8 2 8 3 4 3 2 8 9 4 8 7 9 4 9 4
1 3 7 9 4 8 3 7 0 8 6 6 6 8 4 1 1 3 1 3
3 3 2 5 6 7 6 1 6 6 1 7 6 5 8 1 6 2 2 7
9 9 9 8 2 8 8 1 9 1 6 2 7 5 1 8 6 1 4 4
1 7 5 4 0 9 5 7 8 7 5 0 8 6 6 2 5 3 2 3
2 7 1 7 8 8 3 8 6 9 9 2 7 4 5 9 5 6 6 6
6 0 9 2 6 1 5 1 2 3 1 8 1 2 0 8 6 4 4 0
3 3 6 3 4 9 6 4 4 9 8 5 7 3 3 4 2 3 2 8
0 1 9 7 9 7 9 4 4 1 6 6 7 7 0 7 9 8 6 8
4 7 1 5 3 7 0 9 2 5 2 1 0 0 4 0 4 6 8 8
7 8 9 9 6 8 5 6 8 1 9 2 7 5 1 7 0 1 5 5
2 2 3 3 1 8 1 9 8 4 2 8 5 2 8 1 7 6 4 6
2 6 6 4 1 4 8 1 0 6 0 1 3 4 0 9 1 2 8 6
5 1 9 0 3 9 1 6 1 7 8 8 2 8 0 7 8 4 8 0
9 0 5 8 4 9 2 2 3 9 8 5 9 5 7 8 4 9 9 4
8 6 1 9 2 5 0 0 7 9 0 0 7 4 5 4 8 6 2 3
1 9 1 0 9 7 5 1 2 7 1 9 4 8 4 8 9 6 6 9
5 6 0 6 1 3 3 5 2 1 0 1 9 2 8 0 2 6 6 3
8 6 9 9 8 0 8 1 8 2 6 6 8 4 0 7 8 2 5 1
3 1 6 1 0 5 7 5 7 0 6 3 0 4 1 4 0 3 0 8
Estadística para comunicadores 168

Ejercicios de aplicación
58.Los siguientes datos han sido extraídos de una investigación realizada por La Defensoría del
Pueblo, Comisión de la Verdad y Reconciliación, Comité Internacional Cruz Roja y Coordinadora
Nacional de Derechos Humanos sobre un total de 150 personas extraviadas en el Perú entre los
años 1980 y 1996 en los tres principales departamentos donde hubo el brote terrorista:
Ayacucho, Huánuco y San Martín.

Las variables que se consideraron fueron: lugar de procedencia, sexo y edad al momento de la
desaparición. Los datos se presentan a continuación:

Nº Procedencia Sexo Edad Nº Procedencia Sexo Edad Nº Procedencia Sexo Edad Nº Procedencia Sexo Edad
1 Ayacucho M 12 39 Ayacucho M 22 77 Ayacucho M 33 115 Huánuco M 28
2 Ayacucho M 40 40 Ayacucho F 23 78 Ayacucho M 22 116 Huánuco M 36
3 Ayacucho M 20 41 Ayacucho M 50 79 Ayacucho M 70 117 Huánuco M 27
4 Ayacucho M 43 42 Ayacucho M 26 80 Ayacucho M 34 118 Huánuco M 24
5 Ayacucho M 28 43 Ayacucho F 19 81 Ayacucho M 69 119 Huánuco M 45
6 Ayacucho M 12 44 Ayacucho M 54 82 Ayacucho F 31 120 Huánuco M 21
7 Ayacucho F 15 45 Ayacucho M 13 83 Huánuco M 21 121 Huánuco M 66
8 Ayacucho M 28 46 Ayacucho M 46 84 Huánuco M 27 122 Huánuco F 70
9 Ayacucho M 13 47 Ayacucho M 28 85 Huánuco F 19 123 Huánuco F 26
10 Ayacucho M 45 48 Ayacucho M 46 86 Huánuco M 27 124 Huánuco M 26
11 Ayacucho M 10 49 Ayacucho M 42 87 Huánuco M 20 125 Huánuco M 14
12 Ayacucho F 25 50 Ayacucho M 40 88 Huánuco M 25 126 Huánuco M 18
13 Ayacucho M 24 51 Ayacucho M 44 89 Huánuco M 18 127 Huánuco M 28
14 Ayacucho M 32 52 Ayacucho M 39 90 Huánuco M 47 128 San Martín M 25
15 Ayacucho M 48 53 Ayacucho M 17 91 Huánuco M 28 129 San Martín M 32
16 Ayacucho M 23 54 Ayacucho F 19 92 Huánuco M 32 130 San Martín M 22
17 Ayacucho F 7 55 Ayacucho M 24 93 Huánuco M 18 131 San Martín M 21
18 Ayacucho F 5 56 Ayacucho F 15 94 Huánuco M 22 132 San Martín M 28
19 Ayacucho M 4 57 Ayacucho M 17 95 Huánuco M 28 133 San Martín M 18
20 Ayacucho F 9 58 Ayacucho M 22 96 Huánuco M 31 134 San Martín M 29
21 Ayacucho M 6 59 Ayacucho M 50 97 Huánuco M 34 135 San Martín M 20
22 Ayacucho M 66 60 Ayacucho M 42 98 Huánuco M 25 136 San Martín M 18
23 Ayacucho M 18 61 Ayacucho M 19 99 Huánuco M 27 137 San Martín M 21
24 Ayacucho F 36 62 Ayacucho M 21 100 Huánuco M 19 138 San Martín M 26
25 Ayacucho M 26 63 Ayacucho M 15 101 Huánuco M 24 139 San Martín M 23
26 Ayacucho M 17 64 Ayacucho M 43 102 Huánuco M 28 140 San Martín M 35
27 Ayacucho M 28 65 Ayacucho M 16 103 Huánuco F 4 141 San Martín M 17
28 Ayacucho M 30 66 Ayacucho M 30 104 Huánuco F 2 142 San Martín M 32
29 Ayacucho F 19 67 Ayacucho M 48 105 Huánuco M 33 143 San Martín F 32
30 Ayacucho M 17 68 Ayacucho M 45 106 Huánuco M 25 144 San Martín M 41
31 Ayacucho F 20 69 Ayacucho M 41 107 Huánuco M 21 145 San Martín M 26
32 Ayacucho M 21 70 Ayacucho M 23 108 Huánuco M 21 146 San Martín M 20
33 Ayacucho M 37 71 Ayacucho M 22 109 Huánuco M 30 147 San Martín M 21
34 Ayacucho M 58 72 Ayacucho M 20 110 Huánuco M 21 148 San Martín M 15
35 Ayacucho M 18 73 Ayacucho M 22 111 Huánuco M 21 149 San Martín M 22
36 Ayacucho F 18 74 Ayacucho M 16 112 Huánuco M 54 150 San Martín M 45
37 Ayacucho M 19 75 Ayacucho M 45 113 Huánuco M 38        
38 Ayacucho M 18 76 Ayacucho F 56 114 Huánuco M 16        
Estadística para comunicadores 169
a. Aplique el muestreo estratificado para obtener una muestra de 10 personas desaparecidas. Ela-
bore un listado con el elemento seleccionado y el valor de la edad al momento de la desapari-
ción. Utilice como variable de estratificación: Lugar de procedencia.

Estrato 1: Ayacucho C3; C5; C7


Estrato 2: Huánuco C5; C9; C10; C12
Estrato 3: San Martín C4; C8; C11; C15

Solución

Posición Nh
Estrato Nh nh = ×n
(desde – hasta) N
Ayacucho N1= n1=

Huánuco N2= n2=

San Martín N3= n3=

Total

Estrato 1: Ayacucho Estrato 2: Huánuco Estrato 3: San Martín


Posición Edad Posición Edad Posición Edad

b. Con la muestra obtenida calcule el promedio de la edad al momento de la desaparición.

Solución

Entonces, con los elementos seleccionados se tiene que el promedio de la edad al momento de
la desaparición es ……................. años.
Estadística para comunicadores 170
Tabla de números aleatorios

C1 C2 C3 C4 C5 C6 C7 C8 C9 C10 C11 C12 C13 C14 C15 C16 C17 C18 C19 C20
4 8 2 4 6 6 3 5 4 5 6 0 5 2 6 9 8 0 0 9
9 2 9 8 1 4 4 1 9 8 5 1 1 9 7 9 8 5 9 0
0 2 1 3 3 9 1 6 2 9 7 1 2 6 6 0 7 5 6 4
9 6 0 8 3 5 6 6 6 4 0 8 6 3 4 8 1 8 5 4
1 6 4 1 6 5 2 7 7 2 9 9 9 9 7 4 1 5 4 9
2 9 0 5 5 0 8 4 8 7 4 6 2 1 7 0 1 5 8 7
6 1 2 9 5 0 4 0 9 8 2 0 2 6 8 7 0 1 9 7
1 3 1 8 9 9 0 1 2 6 3 7 1 9 6 1 7 9 9 8
4 5 8 1 1 4 5 6 7 9 9 9 2 1 3 2 3 7 7 9
0 0 3 6 9 6 5 0 6 4 7 9 8 1 2 4 4 8 3 6
7 2 4 5 4 1 2 4 4 6 9 2 6 6 6 5 2 0 0 4
4 9 3 4 4 2 4 5 9 0 8 7 4 8 4 2 1 2 5 4
6 1 2 8 1 3 3 2 0 2 6 0 7 2 7 9 1 4 6 5
9 3 4 0 8 1 3 3 7 3 2 4 8 6 7 9 0 6 2 8
1 8 7 1 3 4 3 9 3 1 7 8 3 7 3 3 0 8 3 5
0 2 1 4 7 5 7 3 1 1 9 3 3 8 7 4 8 0 2 5
3 6 3 4 1 9 8 1 0 9 0 1 1 0 9 3 6 8 6 0
9 4 6 7 6 7 9 1 2 2 7 2 3 9 3 4 6 9 8 1
5 9 9 8 4 4 5 9 1 5 4 7 3 0 6 8 1 6 8 1
8 1 8 8 2 3 9 1 4 2 4 9 1 4 0 6 0 3 2 8
0 5 3 8 0 4 3 9 4 6 0 8 8 3 8 7 1 2 2 3
9 7 1 4 2 7 5 5 2 8 6 6 3 5 5 9 9 0 6 8
6 9 5 9 4 9 1 8 2 0 2 5 3 9 1 2 0 3 0 8
7 4 9 1 4 8 8 6 6 8 5 9 4 8 5 7 7 9 6 7
3 8 1 2 2 4 0 1 4 5 7 7 4 0 4 8 9 4 7 0
9 9 9 7 8 0 0 9 3 2 7 0 5 0 2 7 8 7 3 6
4 8 1 5 8 5 5 1 4 9 6 4 4 4 7 4 5 7 5 0
8 6 7 3 6 1 7 1 1 3 5 5 7 4 4 7 6 7 2 8
4 7 1 4 0 3 6 2 4 4 4 4 0 3 6 3 4 1 2 8
6 5 5 8 8 4 3 4 8 9 0 6 7 6 0 0 8 6 8 4
9 2 0 9 8 2 8 3 4 3 2 8 9 4 8 7 9 4 9 4
1 3 7 9 4 8 3 7 0 8 6 6 6 8 4 1 1 3 1 3
3 3 2 5 6 7 6 1 6 6 1 7 6 5 8 1 6 2 2 7
9 9 9 8 2 8 8 1 9 1 6 2 7 5 1 8 6 1 4 4
1 7 5 4 0 9 5 7 8 7 5 0 8 6 6 2 5 3 2 3
2 7 1 7 8 8 3 8 6 9 9 2 7 4 5 9 5 6 6 6
6 0 9 2 6 1 5 1 2 3 1 8 1 2 0 8 6 4 4 0
3 3 6 3 4 9 6 4 4 9 8 5 7 3 3 4 2 3 2 8
0 1 9 7 9 7 9 4 4 1 6 6 7 7 0 7 9 8 6 8
4 7 1 5 3 7 0 9 2 5 2 1 0 0 4 0 4 6 8 8
7 8 9 9 6 8 5 6 8 1 9 2 7 5 1 7 0 1 5 5
2 2 3 3 1 8 1 9 8 4 2 8 5 2 8 1 7 6 4 6
2 6 6 4 1 4 8 1 0 6 0 1 3 4 0 9 1 2 8 6
5 1 9 0 3 9 1 6 1 7 8 8 2 8 0 7 8 4 8 0
9 0 5 8 4 9 2 2 3 9 8 5 9 5 7 8 4 9 9 4
8 6 1 9 2 5 0 0 7 9 0 0 7 4 5 4 8 6 2 3
1 9 1 0 9 7 5 1 2 7 1 9 4 8 4 8 9 6 6 9
5 6 0 6 1 3 3 5 2 1 0 1 9 2 8 0 2 6 6 3
8 6 9 9 8 0 8 1 8 2 6 6 8 4 0 7 8 2 5 1
3 1 6 1 0 5 7 5 7 0 6 3 0 4 1 4 0 3 0 8
Estadística para comunicadores 171
59.En la siguiente tabla se muestran los datos de 120 mujeres de un asentamiento humano de San
Juan de Lurigancho que han sufrido algún tipo maltrato familiar.

Obtenga una muestra aleatoria de tamaño 12 mediante muestreo estratificado. Considere


como variable de estratificación <razón de violencia>. Elabore un listado con el número del ele -
mento seleccionado (posición) y el valor respectivo para la variable edad actual. Para realizar la
selección considere las siguientes columnas de la tabla de números aleatorios. Con la muestra
obtenida, estime el porcentaje de mujeres que tienen por lo menos 25 años y la moda de esta-
do civil.

Estrato Columnas
Celos C1, C17, C51, C8
Infidelidad C7, C13, C7, C19, C7
Problemas económicos C8, C1, C14, C5, C10, C15

Solución

Posición Nh
Estrato Nh nh = ×n
(desde – hasta) N
N1= n1=

N2= n2=

N3= n3=

Total

Estrato Posición Edad Estado civil

Con la muestra obtenida, el porcentaje de mujeres que tienen por lo menos 25 años es ………….
y la moda de estado civil es ………………..
Estadística para comunicadores 172
Marco muestral
Id. Razón de violencia Estado civil Edad actual Id. Razón de violencia Estado civil Edad actual
1 Celos Conviviente 18 61 Infidelidad Conviviente 20
2 Celos Conviviente 25 62 Infidelidad Casada 28
3 Celos Conviviente 29 63 Infidelidad Conviviente 25
4 Celos Casada 20 64 Infidelidad Conviviente 29
5 Celos Conviviente 27 65 Infidelidad Casada 35
6 Celos Conviviente 19 66 Infidelidad Conviviente 27
7 Celos Casada 22 67 Infidelidad Conviviente 19
8 Celos Conviviente 26 68 Infidelidad Conviviente 22
9 Celos Casada 45 69 Infidelidad Casada 26
10 Celos Casada 39 70 Infidelidad Casada 35
11 Celos Casada 52 71 Infidelidad Conviviente 39
12 Celos Conviviente 35 72 Infidelidad Casada 22
13 Celos Conviviente 41 73 Infidelidad Conviviente 32
14 Celos Casada 32 74 Infidelidad Casada 35
15 Celos Conviviente 35 75 Infidelidad Conviviente 27
16 Celos Casada 27 76 Infidelidad Conviviente 43
17 Celos Conviviente 33 77 Infidelidad Casada 35
18 Celos Conviviente 28 78 Infidelidad Casada 36
19 Celos Casada 26 79 Infidelidad Casada 28
20 Celos Conviviente 28 80 Infidelidad Conviviente 27
21 Celos Conviviente 27 81 Problemas económicos Casada 21
22 Celos Conviviente 21 82 Problemas económicos Casada 33
23 Celos Casada 33 83 Problemas económicos Conviviente 33
24 Celos Casada 23 84 Problemas económicos Conviviente 28
25 Celos Conviviente 41 85 Problemas económicos Conviviente 44
26 Celos Casada 25 86 Problemas económicos Casada 32
27 Celos Conviviente 35 87 Problemas económicos Casada 22
28 Celos Casada 33 88 Problemas económicos Conviviente 50
29 Infidelidad Conviviente 28 89 Problemas económicos Conviviente 30
30 Infidelidad Conviviente 23 90 Problemas económicos Casada 20
31 Infidelidad Casada 31 91 Problemas económicos Conviviente 35
32 Infidelidad Casada 23 92 Problemas económicos Casada 38
33 Infidelidad Conviviente 29 93 Problemas económicos Conviviente 35
34 Infidelidad Conviviente 24 94 Problemas económicos Casada 20
35 Infidelidad Casada 36 95 Problemas económicos Casada 43
36 Infidelidad Conviviente 33 96 Problemas económicos Casada 28
37 Infidelidad Casada 25 97 Problemas económicos Conviviente 23
38 Infidelidad Conviviente 33 98 Problemas económicos Conviviente 31
39 Infidelidad Casada 30 99 Problemas económicos Conviviente 33
40 Infidelidad Casada 32 100 Problemas económicos Casada 29
41 Infidelidad Conviviente 28 101 Problemas económicos Casada 24
42 Infidelidad Conviviente 23 102 Problemas económicos Conviviente 36
43 Infidelidad Conviviente 31 103 Problemas económicos Conviviente 33
44 Infidelidad Casada 43 104 Problemas económicos Casada 45
45 Infidelidad Conviviente 29 105 Problemas económicos Conviviente 43
46 Infidelidad Casada 24 106 Problemas económicos Casada 43
47 Infidelidad Conviviente 36 107 Problemas económicos Casada 36
48 Infidelidad Casada 33 108 Problemas económicos Conviviente 21
49 Infidelidad Casada 45 109 Problemas económicos Conviviente 19
50 Infidelidad Conviviente 43 110 Problemas económicos Conviviente 38
51 Infidelidad Conviviente 36 111 Problemas económicos Casada 48
52 Infidelidad Casada 21 112 Problemas económicos Casada 29
53 Infidelidad Casada 19 113 Problemas económicos Conviviente 31
54 Infidelidad Conviviente 38 114 Problemas económicos Casada 29
55 Infidelidad Conviviente 48 115 Problemas económicos Casada 35
56 Infidelidad Casada 29 116 Problemas económicos Conviviente 32
57 Infidelidad Conviviente 31 117 Problemas económicos Conviviente 42
58 Infidelidad Casada 29 118 Problemas económicos Casada 33
59 Infidelidad Casada 35 119 Problemas económicos Casada 25
60 Infidelidad Casada 40 120 Problemas económicos Conviviente 43

Tabla de números aleatorios


Estadística para comunicadores 173

C1 C2 C3 C4 C5 C6 C7 C8 C9 C10 C11 C12 C13 C14 C15 C16 C17 C18 C19 C20
4 8 2 4 6 6 3 5 4 5 6 0 5 2 6 9 8 0 0 9
9 2 9 8 1 4 4 1 9 8 5 1 1 9 7 9 8 5 9 0
0 2 1 3 3 9 1 6 2 9 7 1 2 6 6 0 7 5 6 4
9 6 0 8 3 5 6 6 6 4 0 8 6 3 4 8 1 8 5 4
1 6 4 1 6 5 2 7 7 2 9 9 9 9 7 4 1 5 4 9
2 9 0 5 5 0 8 4 8 7 4 6 2 1 7 0 1 5 8 7
6 1 2 9 5 0 4 0 9 8 2 0 2 6 8 7 0 1 9 7
1 3 1 8 9 9 0 1 2 6 3 7 1 9 6 1 7 9 9 8
4 5 8 1 1 4 5 6 7 9 9 9 2 1 3 2 3 7 7 9
0 0 3 6 9 6 5 0 6 4 7 9 8 1 2 4 4 8 3 6
7 2 4 5 4 1 2 4 4 6 9 2 6 6 6 5 2 0 0 4
4 9 3 4 4 2 4 5 9 0 8 7 4 8 4 2 1 2 5 4
6 1 2 8 1 3 3 2 0 2 6 0 7 2 7 9 1 4 6 5
9 3 4 0 8 1 3 3 7 3 2 4 8 6 7 9 0 6 2 8
1 8 7 1 3 4 3 9 3 1 7 8 3 7 3 3 0 8 3 5
0 2 1 4 7 5 7 3 1 1 9 3 3 8 7 4 8 0 2 5
3 6 3 4 1 9 8 1 0 9 0 1 1 0 9 3 6 8 6 0
9 4 6 7 6 7 9 1 2 2 7 2 3 9 3 4 6 9 8 1
5 9 9 8 4 4 5 9 1 5 4 7 3 0 6 8 1 6 8 1
8 1 8 8 2 3 9 1 4 2 4 9 1 4 0 6 0 3 2 8
0 5 3 8 0 4 3 9 4 6 0 8 8 3 8 7 1 2 2 3
9 7 1 4 2 7 5 5 2 8 6 6 3 5 5 9 9 0 6 8
6 9 5 9 4 9 1 8 2 0 2 5 3 9 1 2 0 3 0 8
7 4 9 1 4 8 8 6 6 8 5 9 4 8 5 7 7 9 6 7
3 8 1 2 2 4 0 1 4 5 7 7 4 0 4 8 9 4 7 0
9 9 9 7 8 0 0 9 3 2 7 0 5 0 2 7 8 7 3 6
4 8 1 5 8 5 5 1 4 9 6 4 4 4 7 4 5 7 5 0
8 6 7 3 6 1 7 1 1 3 5 5 7 4 4 7 6 7 2 8
4 7 1 4 0 3 6 2 4 4 4 4 0 3 6 3 4 1 2 8
6 5 5 8 8 4 3 4 8 9 0 6 7 6 0 0 8 6 8 4
9 2 0 9 8 2 8 3 4 3 2 8 9 4 8 7 9 4 9 4
1 3 7 9 4 8 3 7 0 8 6 6 6 8 4 1 1 3 1 3
3 3 2 5 6 7 6 1 6 6 1 7 6 5 8 1 6 2 2 7
9 9 9 8 2 8 8 1 9 1 6 2 7 5 1 8 6 1 4 4
1 7 5 4 0 9 5 7 8 7 5 0 8 6 6 2 5 3 2 3
2 7 1 7 8 8 3 8 6 9 9 2 7 4 5 9 5 6 6 6
6 0 9 2 6 1 5 1 2 3 1 8 1 2 0 8 6 4 4 0
3 3 6 3 4 9 6 4 4 9 8 5 7 3 3 4 2 3 2 8
0 1 9 7 9 7 9 4 4 1 6 6 7 7 0 7 9 8 6 8
4 7 1 5 3 7 0 9 2 5 2 1 0 0 4 0 4 6 8 8
7 8 9 9 6 8 5 6 8 1 9 2 7 5 1 7 0 1 5 5
2 2 3 3 1 8 1 9 8 4 2 8 5 2 8 1 7 6 4 6
2 6 6 4 1 4 8 1 0 6 0 1 3 4 0 9 1 2 8 6
5 1 9 0 3 9 1 6 1 7 8 8 2 8 0 7 8 4 8 0
9 0 5 8 4 9 2 2 3 9 8 5 9 5 7 8 4 9 9 4
8 6 1 9 2 5 0 0 7 9 0 0 7 4 5 4 8 6 2 3
1 9 1 0 9 7 5 1 2 7 1 9 4 8 4 8 9 6 6 9
5 6 0 6 1 3 3 5 2 1 0 1 9 2 8 0 2 6 6 3
8 6 9 9 8 0 8 1 8 2 6 6 8 4 0 7 8 2 5 1
3 1 6 1 0 5 7 5 7 0 6 3 0 4 1 4 0 3 0 8

Muestreo sistemático
En el muestreo sistemático se debe elegir un elemento del marco muestral cada cierto intervalo.
Este muestreo supone que se cuenta con una enumeración completa de los elementos de la pobla -
ción.
Estadística para comunicadores 174

Una característica importante del muestreo sistemático es que presenta menos variabilidad que el
muestreo aleatorio simple, esto debido a la presencia de una estratificación innata en el diseño del
muestreo sistemático.

Procedimiento para seleccionar una muestra sistemática


1. Calcule el valor de k, donde:
N
k=
n
El valor de k se redondea al entero menor.

2. Seleccione aleatoriamente un número entero entre 1 y k llamado arranque aleatorio ( A ).

Para encontrar el valor de A, la cantidad de columnas a usar de la tabla de números aleatorios


dependerá de la cantidad de dígitos que tenga k . Por ejemplo, si el valor de k es un número de
dos cifras, entonces deberá agregar a la columna dada por enunciado una columna correlativa
para completar un número de dos cifras.

3. A partir de este número elegido, seleccione el siguiente que ocupa la posición ( A+ k ) del lista-
do del marco muestral y así sucesivamente hasta completar la muestra.
Estadística para comunicadores 175

Ejemplo 66
Se tiene a continuación una población de 15 personas a quienes se les consultó su edad. Se desea
elegir a cuatro de ellas mediante un muestreo sistemático. Use la columna C3, C6 y C12 de la tabla
de números aleatorios.

Posición 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

Edad 12 15 23 10 32 65 34 23 43 54 22 34 56 34 25

Solución

Calculemos el valor de k, donde:

N 15
k= = =3,75
n 4

El valor de k se redondea al valor del entero menor, luego k = 3. Seleccionemos aleatoriamente un


número entero entre 1 y k = 3, llamado arranque aleatorio ( A ).

Observando la columna C3 de la tabla de números aleatorios tenemos que A = 2.

Tabla de números aleatorios


C1 C2 C3 C4 C5 C6 C7 C8 C9 C10 C11 C12 C13 C14 C15 C16 C17 C18 C19 C20
4 8 A=2 4 6 6 3 5 4 5 6 0 5 2 6 9 8 0 0 9
9 2 9 8 1 4 4 1 9 8 5 1 1 9 7 9 8 5 9 0

Los elementos seleccionados serán:

Posición A=2 A+k=2+3=5 A + 2k = 2 + 2 x 3 = 8 A + 3k = 2 + 3 x 3 = 11

Edad 15 32 23 22

Ejemplo 67

Se tiene una población de 15 personas a quienes se les consultó su edad y se desea elegir a seis de
ellas mediante un muestreo sistemático. Use la columna C7 de la tabla de números aleatorios. Con
la muestra seleccionada, estime la media muestra de la edad.

Posición 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

Edad 45 33 55 45 39 37 43 21 43 32 30 29 35 32 53

Solución

Calculemos el valor de k, donde:


Estadística para comunicadores 176
N 15
k= = =2,5
n 6
El valor de k se redondea al valor del entero menor, luego k = 2. El arranque aleatorio ( A ) es 1.

Tabla de números aleatorios


C1 C2 C3 C4 C5 C6 C7 C8 C9 C10 C11 C12 C13 C14 C15 C16 C17 C18 C19 C20
4 8 2 4 6 6 3 5 4 5 6 0 5 2 6 9 8 0 0 9
9 2 9 8 1 4 4 1 9 8 5 1 1 9 7 9 8 5 9 0
0 2 1 3 3 9 A=1 6 2 9 7 1 2 6 6 0 7 5 6 4
9 6 0 8 3 5 6 6 6 4 0 8 6 3 4 8 1 8 5 4
1 6 4 1 6 5 2 7 7 2 9 9 9 9 7 4 1 5 4 9

Los elementos seleccionados serán:

Posición A=1 A + k = 1 + 2 = 3 A + 2k =1 + 2 x 2 = 5 A + 3k = 7 A + 4k = 9 A + 5k = 11

Edad 45 55 39 43 43 30

Con la muestra seleccionada, estime la edad media.

La media de la edad es 42,5 años.


Estadística para comunicadores 177

Ejercicios de aplicación

60.Se tiene información de 40 personas de un distrito de Lima. Obtenga una muestra de siete
personas usando el muestreo sistemático y elabore una tabla con la posición seleccionada.
Utilice las columnas C9, C10 y C11. Además, con la muestra obtenida, calcule la edad promedio
de las personas y el porcentaje de individuos que son mujeres.

Individuos registrados
Nº Sexo Edad Estatura Nº Sexo Edad Estatura Nº Sexo Edad Estatura
1 Mujer 15 154 15 Mujer 19 178 29 Hombre 33 147
2 Hombre 16 154 16 Mujer 30 163 30 Hombre 17 167
3 Hombre 21 156 17 Hombre 29 180 31 Mujer 34 169
4 Mujer 31 184 18 Mujer 25 174 32 Mujer 20 156
5 Hombre 21 173 19 Hombre 29 137 33 Mujer 26 164
6 Mujer 24 170 20 Hombre 25 153 34 Hombre 25 190
7 Hombre 32 176 21 Mujer 16 168 35 Mujer 23 167
8 Hombre 26 188 22 Hombre 31 161 36 Hombre 20 169
9 Mujer 21 169 23 Hombre 18 270 37 Mujer 34 176
10 Mujer 22 173 24 Hombre 21 173 38 Hombre 35 188
11 Hombre 18 177 25 Hombre 31 187 39 Mujer 30 155
12 Hombre 25 181 26 Mujer 28 161 40 Mujer 29 141
13 Mujer 29 164 27 Mujer 19 172
14 Hombre 25 159 28 Hombre 31 162

Calculemos el valor de k, donde:

N ❑
k= = =¿
n ❑

El valor de k se redondea al valor del entero menor, luego k = ……..

El arranque aleatorio ( A ) es …...

Tabla de números aleatorios


C1 C2 C3 C4 C5 C6 C7 C8 C9 C10 C11 C12 C13 C14 C15 C16 C17 C18 C19 C20
4 8 2 4 6 6 3 5 4 5 6 0 5 2 6 9 8 0 0 9
9 2 9 8 1 4 4 1 9 8 5 1 1 9 7 9 8 5 9 0
0 2 1 3 3 9 1 6 2 9 7 1 2 6 6 0 7 5 6 4
9 6 0 8 3 5 6 6 6 4 0 8 6 3 4 8 1 8 5 4
1 6 4 1 6 5 2 7 7 2 9 9 9 9 7 4 1 5 4 9

Los elementos seleccionados serán:

Posición

Edad

Con la muestra seleccionada, la edad promedio de las personas es …………………. y el porcentaje de


individuos que son mujeres es ……………
Estadística para comunicadores 178
61.En la siguiente tabla se muestran los datos de 120 mujeres de un asentamiento humano de San
Juan de Lurigancho que han sufrido algún tipo maltrato familiar.

a. Obtenga una muestra aleatoria de tamaño 11 mediante muestreo sistemático. Elabore un


listado con la posición del elemento seleccionado y el valor respectivo para las variables ra-
zón de violencia y estado civil. Para realizar la selección considere las columnas de la tabla de
números aleatorios: C15, C7, C9. Con la muestra obtenida estime el porcentaje de mujeres
convivientes y el promedio de la edad actual.

Posición Razón de violencia Estado civil

Con la muestra obtenida, el porcentaje de mujeres convivientes es …………... y el promedio


de la edad actual es ………………

b. Obtenga una muestra aleatoria de tamaño 12 mediante muestreo aleatorio simple. Elabore
un listado con la posición del elemento seleccionado y el valor respectivo para la variable
edad actual. Para realizar la selección considere las columnas de la tabla de números aleato -
rios: C8, C1, C14, C19. Con la muestra obtenida estime la edad máxima para pertenecer al
20% de las mujeres maltratadas más jóvenes y la proporción de mujeres maltratadas mayo -
res de 30 años.

Posición Edad actual

Con la muestra obtenida, la edad máxima para pertenecer al 20% de las mujeres maltratadas
más jóvenes es …………… y la proporción de mujeres maltratadas mayores de 30 años es
…………...
Estadística para comunicadores 179
Marco muestral
Id. Estado civil Edad actual Id. Estado civil Edad actual
1 Conviviente 18 61 Conviviente 20
2 Conviviente 25 62 Casada 28
3 Conviviente 29 63 Conviviente 25
4 Casada 20 64 Conviviente 29
5 Conviviente 27 65 Casada 35
6 Conviviente 19 66 Conviviente 27
7 Casada 22 67 Conviviente 19
8 Conviviente 26 68 Conviviente 22
9 Casada 45 69 Casada 26
10 Casada 39 70 Casada 35
11 Casada 52 71 Conviviente 39
12 Conviviente 35 72 Casada 22
13 Conviviente 41 73 Conviviente 32
14 Casada 32 74 Casada 35
15 Conviviente 35 75 Conviviente 27
16 Casada 27 76 Conviviente 43
17 Conviviente 33 77 Casada 35
18 Conviviente 28 78 Casada 36
19 Casada 26 79 Casada 28
20 Conviviente 28 80 Conviviente 27
21 Conviviente 27 81 Casada 21
22 Conviviente 21 82 Casada 33
23 Casada 33 83 Conviviente 33
24 Casada 23 84 Conviviente 28
25 Conviviente 41 85 Conviviente 44
26 Casada 25 86 Casada 32
27 Conviviente 35 87 Casada 22
28 Casada 33 88 Conviviente 50
29 Conviviente 28 89 Conviviente 30
30 Conviviente 23 90 Casada 20
31 Casada 31 91 Conviviente 35
32 Casada 23 92 Casada 38
33 Conviviente 29 93 Conviviente 35
34 Conviviente 24 94 Casada 20
35 Casada 36 95 Casada 43
36 Conviviente 33 96 Casada 28
37 Casada 25 97 Conviviente 23
38 Conviviente 33 98 Conviviente 31
39 Casada 30 99 Conviviente 33
40 Casada 32 100 Casada 29
41 Conviviente 28 101 Casada 24
42 Conviviente 23 102 Conviviente 36
43 Conviviente 31 103 Conviviente 33
44 Casada 43 104 Casada 45
45 Conviviente 29 105 Conviviente 43
46 Casada 24 106 Casada 43
47 Conviviente 36 107 Casada 36
48 Casada 33 108 Conviviente 21
49 Casada 45 109 Conviviente 19
50 Conviviente 43 110 Conviviente 38
51 Conviviente 36 111 Casada 48
52 Casada 21 112 Casada 29
53 Casada 19 113 Conviviente 31
54 Conviviente 38 114 Casada 29
55 Conviviente 48 115 Casada 35
56 Casada 29 116 Conviviente 32
57 Conviviente 31 117 Conviviente 42
58 Casada 29 118 Casada 33
59 Casada 35 119 Casada 25
60 Casada 40 120 Conviviente 43
62.La siguiente tabla muestra el registro de todos los clientes de una empresa de señal por cable
del distrito de Los Olivos. Las variables consideradas fueron: ingreso semanal (en dólares),
Estadística para comunicadores 180
número de televisores en el hogar y nivel educativo alcanzado por el jefe de familia.

Marco muestral
Ingreso N° de Nivel Ingreso N° de Nivel Ingreso N° de Nivel
N° N° N°
semanal tv educativo semanal tv educativo semanal tv educativo
1 100 3 Primaria 36 250 2 Primaria 71 400 3 Secundaria
2 80 2 Primaria 37 205 2 Primaria 72 220 2 Secundaria
3 100 3 Primaria 38 220 3 Primaria 73 230 2 Secundaria
4 85 1 Primaria 39 285 4 Primaria 74 300 2 Secundaria
5 105 2 Primaria 40 220 2 Primaria 75 340 3 Superior
6 110 2 Primaria 41 400 3 Primaria 76 420 2 Superior
7 102 4 Primaria 42 350 2 Primaria 77 550 2 Superior
8 110 2 Primaria 43 400 2 Primaria 78 430 2 Superior
9 90 2 Primaria 44 540 2 Primaria 79 690 3 Superior
10 130 3 Primaria 45 250 3 Primaria 80 500 2 Superior
11 180 1 Primaria 46 295 4 Primaria 81 430 2 Superior
12 90 3 Primaria 47 230 1 Primaria 82 620 3 Superior
13 104 3 Primaria 48 240 2 Primaria 83 400 3 Superior
14 100 2 Primaria 49 400 3 Primaria 84 630 2 Superior
15 90 2 Primaria 50 270 5 Primaria 85 585 1 Superior
16 80 1 Primaria 51 320 2 Secundaria 86 350 2 Superior
17 120 1 Primaria 52 295 2 Secundaria 87 520 2 Superior
18 85 1 Primaria 53 200 1 Secundaria 88 402 2 Superior
19 100 2 Primaria 54 335 1 Secundaria 89 220 3 Superior
20 98 3 Primaria 55 250 2 Secundaria 90 690 1 Superior
21 120 2 Primaria 56 250 3 Secundaria 91 420 2 Superior
22 105 2 Primaria 57 120 2 Secundaria 92 450 2 Superior
23 120 1 Primaria 58 130 2 Secundaria 93 530 2 Superior
24 250 3 Primaria 59 235 2 Secundaria 94 300 3 Superior
25 300 4 Primaria 60 500 3 Secundaria 95 335 1 Superior
26 120 2 Primaria 61 200 1 Secundaria 96 330 1 Superior
27 195 3 Primaria 62 395 2 Secundaria 97 380 2 Superior
28 120 3 Primaria 63 330 3 Secundaria 98 230 2 Superior
29 250 2 Primaria 64 310 3 Secundaria 99 385 1 Superior
30 300 3 Primaria 65 300 3 Secundaria 100 303 2 Superior
31 250 2 Primaria 66 530 3 Secundaria 101 540 2 Superior
32 230 2 Primaria 67 540 2 Secundaria 102 490 3 Superior
33 150 2 Primaria 68 200 2 Secundaria 103 495 2 Superior
34 200 3 Primaria 69 285 1 Secundaria 104 340 3 Superior
35 190 1 Primaria 70 430 3 Secundaria        

a. Seleccione una muestra de 12 clientes aplicando el muestreo sistemático. Elabore un listado


con la posición seleccionada y los valores del ingreso semanal (en dólares) y número de tele -
visores en el hogar. Utilice la columna C1, C4 y C8 de la tabla de números aleatorios. Con la
muestra obtenida estime el promedio de cada variable y la proporción de clientes que tie-
nen a lo más dos televisores.

b. Obtenga una muestra aleatoria de tamaño 14 mediante muestreo estratificado. Considere


como variable de estratificación <nivel educativo>. Elabore un listado con el número del ele-
mento seleccionado (posición) y el valor respectivo para las variables ingreso semanal y nú -
mero de televisores. Para realizar la selección considere las siguientes columnas de la tabla
de números aleatorios:

Estrato Columnas
Primaria C17, C15, C8
Estadística para comunicadores 181
Secundaria C7, C11, C4, C1
Superior C5, C10, C15, C3

Con la muestra obtenida, estime el porcentaje de clientes que tienen 2 televisores y la mediana
del ingreso semanal.

63.En octubre del año pasado, los integrantes de la Federación de Periodistas del Perú celebraron
el Congreso Nacional de Periodistas. En ese acto congresal, se elaboró un listado de los
asistentes que laboran en los distintos medios periodísticos de la prensa indicando género y
edad.

Marco muestral
N° Género Edad N° Género Edad N° Género Edad N° Género Edad
1 Masculino 12 11 Masculino 45 21 Masculino 49 31 Femenino 56
2 Masculino 48 12 Femenino 54 22 Femenino 27 32 Femenino 56
3 Femenino 64 13 Femenino 61 23 Femenino 20 33 Femenino 62
4 Masculino 70 14 Masculino 66 24 Masculino 23 34 Masculino 17
5 Femenino 56 15 Masculino 30 25 Masculino 31 35 Masculino 21
6 Masculino 50 16 Masculino 48 26 Masculino 67 36 Masculino 26
7 Masculino 47 17 Femenino 56 27 Masculino 44 37 Masculino 51
8 Femenino 20 18 Femenino 29 28 Masculino 46 38 Femenino 31
9 Masculino 35 19 Masculino 22 29 Masculino 41 39 Femenino 45
10 Masculino 28 20 Masculino 24 30 Masculino 17 40 Femenino 63

a. Seleccione una muestra simple aleatoria de tamaño 13. Elabore un listado con el número se-
leccionado y su valor para la variable edad (en años). Utilice las columnas C12, C7 y C16. Con
la muestra obtenida, estime la proporción de asistentes al evento y la edad promedio de los
asistentes.
b. Seleccione una muestra sistemática de tamaño 11. Elabore un listado con el número del asis -
tente seleccionado y su valor para la variable edad (en años). Utilice las columnas C14, C9 y
C6. Con la muestra, estime la proporción de hombres asistentes al evento y la edad media
de los asistentes.
Estadística para comunicadores 182

Prueba de hipótesis

La prueba de hipótesis involucra una suposición sobre el valor de un parámetro de la población. A


partir de la información proporcionada por la muestra se verificará la suposición sobre el paráme -
tro estudiado.

La hipótesis que se contrasta se llama hipótesis nula (H 0).

La hipótesis que debe ser aceptada si se rechaza la hipótesis nula se llama hipótesis alternativa
(H1).

Partiendo de los resultados obtenidos de la muestra, o bien rechazamos la hipótesis nula H 0 a favor
de la alternativa, o bien no rechazamos la hipótesis nula y suponemos que nuestra estimación ini -
cial del parámetro poblacional podría ser correcto.

El hecho de no rechazar la hipótesis nula no implica que ésta sea cierta; significa que los datos de la
muestra son insuficientes para inducir un rechazo de la hipótesis nula.

Tipos de errores

Conclusión

Condición de la población No rechazar H0 Rechazar H0

H0 verdadera Conclusión correcta Error de tipo I

H0 falsa Error de tipo II Conclusión correcta

Error tipo I
Ocurre cuando se rechaza una hipótesis H 0 que es verdadera.

La probabilidad de error tipo I viene a ser la probabilidad de rechazar H 0 cuando ésta es cierta.

Error tipo II
Ocurre cuando se acepta una hipótesis H 0 que es falsa, la probabilidad de error tipo II es la probabi-
lidad de aceptar H0 cuando ésta es falsa.

Debido a que el valor real del parámetro es desconocido este error no puede ser fijado.

Nivel de significación
El nivel de significancia o nivel de significación es la probabilidad de cometer el error tipo I, es de -
cir, la probabilidad de tomar la decisión de rechazar la hipótesis nula cuando ésta es verdadera.

 = P(Rechazar H0/ H0 es verdadero)


Estadística para comunicadores 183
El valor es fijado por la persona que realiza la investigación. Por lo general varía entre 1% y 10%,
aunque el valor usual es de 5%.

Pasos para realizar una prueba de hipótesis

Pasos Ejemplo

Paso 1 Plantear las hipótesis H0: μ ≤ 10

H1: μ > 10

Paso 2 Fijar el nivel de significación α = 0,05

Paso 3 Calcular el estadístico de la


prueba

Paso 4 Graficar las regiones críticas

Paso 5 Aplicar los criterios de decisión El valor del estadístico de prueba


pertenece a la región crítica

Paso 6 Concluir Rechazo H0 o no rechazar H0


Estadística para comunicadores 184

Prueba de hipótesis para la media poblacional


Consideramos el caso donde la población sigue una distribución normal y la desviación estándar
poblacional σ no es conocida; por lo tanto, se estimará mediante la desviación estándar muestral,
s.

Se utiliza la distribución t para hacer inferencia acerca del valor de la media de la población.

Procedimiento para realizar la prueba de hipótesis para la media poblacional 

1. Plantear las hipótesis nula y alterna

Prueba unilateral izquierda Prueba bilateral Prueba unilateral derecha


¿ H 0 :μ ≥ μ0 ¿ H 0 :μ=μ0 ¿ H 0 :μ ≤ μ0
¿ H 1 : μ< μ 0 ¿ H 1: μ ≠ μ0 ¿ H 1 : μ> μ 0

2. Fijar el nivel de significación 

3. Establecer el estadístico de la prueba


x −μ 0
t c= t n−1
s
√n
El estadístico tiene una distribución t con (n – 1) grados de libertad.

4. Graficar las regiones críticas

Unilateral izquierda H1:  < 0 Unilateral derecha H1:  > 0

Bilateral H1:  ¿ 0

5. Decidir: Rechazar H0 o no rechazar H0.


Estadística para comunicadores 185
6. Concluir

Distribución t-Student

 Se dice que la variable aleatoria t sigue una distribución t con k grados de libertad.
 Para un valor de la variable aleatoria ta,k es tal que el área a su derecha bajo la curva de la dis-
tribución t con k grados de libertad es igual a a.

Características de la distribución t-Student


 Es simétrica y tiene forma de campana.
 Su rango se extiende de -¥ a +¥.
 La media de toda variable es cero.
 Cada valor de grado de libertad determina una distribución t distinta.
 Cuando los grados de libertad son altos, los valores de la distribución t se asemejan con los va-
lores de la distribución normal estándar (n > 29).

Ejemplo 68
Para un valor de la variable aleatoria ta,k = t0,02,42 = 2,11952; es tal que el área a su derecha bajo la
curva de la distribución t con k = 42 grados de libertad es igual a a = 0,02.


 0.15 0.1 0.05 0.04 0.03 0.025 0.02 0.015 0.01 0.005 
41 1.04971 1.30254 1.68288 1.79517 1.93428 2.01954 2.12117 2.24825 2.4208 2.70118 41
42 1.04939 1.30204 1.68195 1.79409 1.93298 2.01808 2.11952 2.24633 2.41847 2.69807 42
43 1.04908 1.30155 1.68107 1.79305 1.93173 2.01669 2.11794 2.24449 2.41625 2.69510 43
44 1.04879 1.30109 1.68023 1.79207 1.93054 2.01537 2.11644 2.24275 2.41413 2.69228 44
Estadística para comunicadores 186

TABLA DE LA DISTRIBUCION T-STUDENT

Área bajo la curva:


7.
 
 0.4 0.3 0.2 0.15 0.1 0.05 0.04 0.03 0.025 0.02 0.015 0.01 0.005
0.3249 0.7265 1.3763 1.9626 3.0776 6.3137 7.9158 10.5788 12.706 15.8945 21.2049 31.8205 63.6567
1 2 4 8 1 8 5 2 9 2 4 5 2 4 1
0.2886 0.6172 1.0606 1.3862 1.8856 2.9199 3.3197 4.3026
2 8 1 6 1 2 9 6 3.89643 5 4.84873 5.64278 6.96456 9.92484 2
0.2766 0.5843 0.9784 1.2497 1.6377 2.3533 2.6054 3.1824
3 7 9 7 8 4 6 3 2.95051 5 3.48191 3.89605 4.5407 5.84091 3
0.2707 0.5686 0.9409 1.1895 1.5332 2.1318 2.3328 2.7764
4 2 5 6 7 1 5 7 2.60076 5 2.99853 3.29763 3.74695 4.60409 4
0.2671 0.5594 0.9195 1.1557 1.4758 2.0150 2.1909 2.5705
5 8 3 4 7 8 5 6 2.42158 8 2.75651 3.00287 3.36493 4.03214 5
0.2648 0.5533 1.1341 1.4397 1.9431 2.1043 2.4469
6 3 8 0.9057 6 6 8 1 2.31326 1 2.61224 2.82893 3.14267 3.70743 6
0.2631 0.5491 0.8960 1.1191 1.4149 1.8945 2.0460 2.3646
7 7 1 3 6 2 8 1 2.24088 2 2.51675 2.71457 2.99795 3.49948 7
0.2619 0.5459 0.8888 1.1081 1.3968 1.8595 2.0041
8 2 3 9 5 2 5 5 2.18915 2.306 2.44898 2.63381 2.89646 3.35539 8
0.2609 0.5434 1.0997 1.3830 1.8331 1.9726 2.2621
9 6 8 0.8834 2 3 1 5 2.15038 6 2.39844 2.5738 2.82144 3.24984 9
1 0.2601 0.5415 0.8790 1.0930 1.3721 1.8124 2.2281 1
0 8 3 6 6 8 6 1.9481 2.12023 4 2.35931 2.52748 2.76377 3.16927 0
   
1 0.2595 0.5399 0.8755 1.0876 1.3634 1.7958 1.9284 2.2009 1
1 6 4 3 7 3 8 3 2.09614 9 2.32814 2.49066 2.71808 3.10581 1
1 0.2590 0.5386 0.8726 1.0832 1.3562 1.7822 1.9123 2.1788 1
2 3 2 1 1 2 9 1 2.07644 1 2.30272 2.46070 2.6810 3.05454 2
1 0.2585 0.8701 1.0794 1.3501 1.7709 1.8988 2.1603 1
3 9 0.5375 5 7 7 3 7 2.06004 7 2.2816 2.43585 2.65031 3.01228 3
1 0.2582 0.5365 0.8680 1.0762 1.3450 1.7613 2.1447 1
4 1 5 5 8 3 1 1.8875 2.04617 9 2.26378 2.4149 2.62449 2.97684 4
1 0.2578 0.5357 0.8662 1.0735 1.3406 1.7530 1.8777 2.1314 1
5 9 3 4 3 1 5 4 2.03429 5 2.24854 2.39701 2.60248 2.94671 5
1 0.2576 0.5350 0.8646 1.0711 1.3367 1.7458 1.8692 2.1199 1
6 0 1 7 4 6 8 8 2.0240 1 2.23536 2.38155 2.58349 2.92078 6
1 0.2573 0.5343 0.8632 1.0690 1.3333 1.7396 1.8618 2.1098 1
7 5 8 8 3 8 1 7 2.015 2 2.22385 2.36805 2.56693 2.89823 7
1 0.2571 0.5338 0.8620 1.0671 1.3303 1.7340 1.8553 2.1009 1
8 2 2 5 7 9 6 4 2.00707 2 2.2137 2.35618 2.55238 2.87844 8
1 0.2569 0.5333 0.8609 1.0655 1.3277 1.7291 1.8495 2.0930 1
9 2 1 5 1 3 3 3 2.00002 2 2.2047 2.34565 2.53948 2.86093 9
2 0.2567 0.5328 0.8599 1.0640 1.3253 1.7247 1.8443 2.0859 2
0 4 6 6 2 4 2 3 1.99371 6 2.19666 2.33624 2.52798 2.84534 0
   
2 0.2565 0.5324 0.8590 1.0626 1.3231 1.7207 1.8396 2.0796 2
1 8 6 7 7 9 4 5 1.98804 1 2.18943 2.32779 2.51765 2.83136 1
2 0.2564 0.5320 0.8582 1.0614 1.3212 1.7171 1.8354 2.0738 2
2 3 8 7 5 4 4 2 1.98291 7 2.18289 2.32016 2.50832 2.81876 2
2 0.2563 0.5317 0.8575 1.0603 1.3194 1.7138 1.8315 2.0686 2
3 0 5 3 4 6 7 7 1.97825 6 2.17696 2.31323 2.49987 2.80734 3
2 0.2561 0.5314 0.8568 1.0593 1.3178 1.7108 1.8280 2
4 7 4 6 2 4 8 5 1.97399 2.0639 2.17154 2.30691 2.49216 2.79694 4
2 0.2560 0.5311 0.8562 1.0583 1.3163 1.7081 1.8248 2.0595 2
5 6 5 4 8 5 4 3 1.9701 4 2.16659 2.30113 2.48511 2.78744 5
2 0.2559 0.5308 0.8556 1.0575 1.3149 1.7056 1.8218 2.0555 2
6 5 9 7 2 7 2 6 1.96651 3 2.16203 2.29581 2.47863 2.77871 6
2 0.2558 0.5306 0.8551 1.0567 1.7032 1.8191 2.0518 2
7 6 5 4 3 1.3137 9 3 1.96320 3 2.15782 2.29091 2.47266 2.77068 7
2 0.2557 0.5304 0.8546 1.0559 1.3125 1.7011 1.8165 2.0484 2
8 7 2 5 9 3 3 9 1.96014 1 2.15393 2.28638 2.46714 2.76326 8
2 0.2556 0.5302 0.8541 1.3114 1.6991 1.8142 2.0452 2
9 8 1 9 1.0553 3 3 4 1.95729 3 2.15033 2.28217 2.46202 2.75639 9
Estadística para comunicadores 187
3 0.2556 0.5300 0.8537 1.0546 1.3104 1.6972 1.8120 2.0422 3
0 1 2 7 6 2 6 5 1.95465 7 2.14697 2.27826 2.45726 2.75000 0
   
3 0.2555 0.5298 0.8533 1.0540 1.3094 1.6955 2.0395 3
1 3 4 7 6 6 2 1.81 1.95218 1 2.14383 2.27461 2.45282 2.74404 1
3 0.2554 0.5296 1.3085 1.6938 1.8080 2.0369 3
2 6 7 0.853 1.0535 7 9 9 1.94987 3 2.1409 2.2712 2.44868 2.73848 2
3 0.2554 0.8526 1.0529 1.3077 1.6923 1.8062 2.0345 3
3 0 0.5295 5 8 4 6 9 1.9477 2 2.13816 2.26801 2.44479 2.73328 3
3 0.2553 0.5293 0.8523 1.0524 1.3069 1.6909 1.8046 2.0322 3
4 4 5 2 8 5 2 1 1.94567 4 2.13558 2.26501 2.44115 2.72839 4
3 0.2552 0.5292 0.8520 1.0520 1.3062 1.6895 1.8030 2.0301 3
5 8 1 1 2 1 7 2 1.94375 1 2.13316 2.26219 2.43772 2.72381 5
3 0.2552 0.5290 0.8517 1.0515 1.3055 1.8015 2.0280 3
6 3 8 2 8 1 1.6883 3 1.94195 9 2.13087 2.25953 2.43449 2.71948 6
3 0.2551 0.5289 0.8514 1.0511 1.3048 1.6870 1.8001 2.0261 3
7 8 5 4 7 5 9 2 1.94024 9 2.12871 2.25702 2.43145 2.71541 7
3 0.2551 0.5288 0.8511 1.0507 1.3042 1.6859 1.7987 2.0243 3
8 3 3 8 7 3 5 8 1.93863 9 2.12667 2.25465 2.42857 2.71156 8
3 0.2550 0.5287 0.8509 1.3036 1.6848 1.7975 2.0226 3
9 8 1 4 1.0504 4 8 1 1.93711 9 2.12474 2.2524 2.42584 2.70791 9
4 0.2550 0.5286 1.0500 1.3030 1.6838 1.7963 2.0210 4
0 4 1 0.8507 5 8 5 1 1.93566 8 2.12291 2.25027 2.42326 2.70446 0

Ejemplo de lectura de la tabla T- Student

La tabla de la t-Student considera los siguientes elementos:

 Grados de libertad: n – 1
 Probabilidad (región de rechazo)

Por lo tanto, se expresa de la siguiente manera: t(probabilidad, grados de libertad)

Para un tamaño de muestra: n = 10 y probabilidad: 0,05

Entonces, la lectura de la tabla t-Student será: t(………., ………) = ….

Ejemplo 69
El fabricante de una marca de cigarrillos le afirma a un publicista que sus cigarrillos contienen, en
promedio, como máximo 18 miligramos de nicotina por cigarrillo. El publicista para verificar esta
afirmación y colocarla en el cartel publicitario examinó una muestra de 20 cigarrillos. Con un nivel
de significancia del 2,5% ¿podrá concluir que la afirmación dada por su cliente es cierta si la mues -
tra arrojó un contenido promedio de 19,2 miligramos con desviación estándar de dos miligramos?
Suponga que el contenido de nicotina se distribuye normalmente.

Solución
Variable X: contenido de nicotina en los cigarrillos (en miligramos)
Parámetro : media poblacional de la cantidad de nicotina por cigarrillo

1. Hipótesis
H 0 ¿ μ ≤ 18?
H1 μ>18
2. Nivel de significación
α =0,025
3. Estadístico de la prueba
Estadística para comunicadores 188

El valor hipotético μ0 es 18.

19,2−18
t c= =2,6833
2
√ 20
4. Regiones críticas

Para la gráfica se debe tener en cuenta el signo de la hipótesis alterna. Como H 1 dice “mayor”,
entonces la prueba es unilateral derecha.

2,09302


 0.15 0.1 0.05 0.04 0.03 0.025 0.02 0.015 0.01 0.005 
1.0671 1.8553
18 1.33039 1.73406 2.00707 2.10092 2.21370 2.35618 2.55238 2.87844
18
7 4
1.0655 1.8495
19 1.32773 1.72913 2.00002 2.09302 2.20470 2.34565 2.53948 2.86093
19
1 3
1.0640 1.8443
20 1.32534 1.72472 1.99371 2.08596 2.19666 2.33624 2.52798 2.84534
20
2 3

5. Decisión
Como 2,6833 pertenece a la región de rechazo, entonces, se rechaza H 0

6. Conclusión
Con 2,5% de nivel de significancia sí es posible afirmar que el contenido medio de nicotina en
los cigarrillos es superior a 18 miligramos. Por lo tanto, no es cierta la afirmación del fabricante.

Ejemplo 70
A partir de los datos de una muestra aleatoria de 101 estudiantes de publicidad seleccionados de
varias universidades de la ciudad capital, se estimó que su gasto promedio semanal en materiales
de estudios (fotocopias e impresiones) es de 32,5 soles con una desviación estándar de 10 soles.
Usando un nivel de significación del 5% ¿proporcionan estos datos suficiente evidencia para decir
que el verdadero gasto promedio semanal en materiales de estudios de los estudiantes de publici-
dad es mayor a 30 soles?

Solución
Variable X: gasto semanal en fotocopias, en soles
Parámetro := media poblacional del gasto semanal en fotocopias

H0 μ ≤30
1. Hipótesis
H 1 ¿ μ>30 ?

2. Nivel de significación  = 0,05


Estadística para comunicadores 189

3. Estadístico de la prueba

El valor hipotético μ0 es 30.

x −μ 0 32,5−30
t c= = =2,51
s 10
√n √101
4. Regiones críticas

Para la gráfica se debe tener en cuenta el signo de la hipótesis alterna. Como H 1 dice “mayor”,
entonces la prueba es unilateral derecha.

1,66023


 0.15 0.1 α =0.05 0.04 0.03 0.025 0.02 0.015 0.01 0.005
1.0421 1.2905 1.7696 1.9035 1.9852 2.0823 2.2031 2.3662 2.6285
95 1.66105
2 3 1 2 5 3 7 4 8
1.0418 1.2900 1.7686 1.9023 1.9839 2.0808 2.2015 2.3642 2.6258
101-1=100 1.66023
4 7 6 7 7 8 0 2 9
1.0415 1.2896 1.7677 1.9013 1.9828 2.0795 2.1999 2.3623 2.6234
105 1.65950
8 7 9 3 2 8 8 9 7

5. Decisión

Como el valor del estadístico de prueba es 2,51 pertenece a la región de rechazo, por tanto, re -
chazamos H0.

6. Conclusión
A un nivel de significancia del 5%, existe evidencia estadística suficiente para afirmar que el
gasto promedio semanal en fotocopias es mayor a 30 soles.

Ejemplo 71
Una cadena de restaurantes de comida rápida afirma en su anuncio publicitario: “Te atendemos en
menos de tres minutos”. Para corroborar esta afirmación se selecciona al azar una muestra de 50
clientes de uno de estos restaurantes encontrando que el tiempo medio de espera era de 2,75 mi -
nutos con una desviación estándar de 1,5 minutos. Si la variable tiene distribución normal ¿será
cierta la afirmación dada por esta cadena de restaurantes? Use un nivel de significancia del 5%.
Solución

Sea X: tiempo de atención, en minutos


: media poblacional de los tiempos de atención
Estadística para comunicadores 190
H0 μ ≥3
1. Hipótesis
H 1 ¿ μ<3 ?

2. Nivel de significación  = 0,05

3. Estadístico de la prueba

El valor hipotético μ0 es 3

x −μ 0 2,75−3
t c= = =−1,1785
s 1,5
√n √50
4. Regiones críticas

Para la gráfica se debe tener en cuenta el signo de la hipótesis alterna. Como H 1 dice “menor”,
entonces la prueba es unilateral izquierda.

-1,67655


 0.15 0.1 =0.05 0.04 0.03 0.025 0.02 0.015 0.01 0.005
1.2994 1.7885
48 1.04775 1.67722 1.92630 2.01063 2.11107 2.23652 2.40658 2.68220
4 5
1.2990 1.7877
n - 1 = 49 1.04752 1.67655 1.92535 2.00958 2.10987 2.23512 2.40489 2.67995
7 6
1.2987 1.7870
50 1.04729 1.67591 1.92444 2.00856 2.10872 2.23379 2.40327 2.67779
1 0

5. Decisión

Como -1,1785 pertenece a la zona de no rechazo, entonces no rechazamos H 0.

6. Conclusión
A un nivel de significancia del 5%, no es posible afirmar que el tiempo promedio de atención es
menor a tres minutos. Por tanto, no aceptaremos la afirmación de la cadena de restaurantes.
Estadística para comunicadores 191

Ejercicios de aplicación

64.Antes de ver una película en una sala de cine se debe esperar hasta el final de los comerciales,
anuncios y cortos de películas. Una cadena de salas de cines afirma que la duración promedio
de cualquier anuncio es menor a dos minutos. Para probar esta afirmación, se seleccionaron al
azar 30 anuncios y se encontró que, en promedio, duraban 1,85 minutos con una desviación
estándar de 0,3 minutos ¿Será cierto lo afirmado por la cadena de salas de cines? Use  = 1%.
Suponga que la duración de los anuncios en las salas de cine se distribuye normalmente.

Solución

Sea X:

:= media poblacional

1. Hipótesis
H0 : μ
H1: μ

2. Nivel de significación =

3. Estadístico de la prueba

μ0 es el valor hipotético es

x −μ 0 −¿
t c= = =¿¿
s ❑
√n √❑
4. Regiones críticas

5. Decisión

6. Conclusión
A un nivel de significancia del ……….
Estadística para Comunicadores 192
65.Un reportaje periodístico sobre consumo de cigarrillos en jóvenes universitarios de Lima
Metropolitana indicó que el gasto promedio mensual en cigarrillos de jóvenes universitarios
fumadores es de 50 soles. Para comprobarlo, la oficina de Apoyo al Alumno de una universidad
selecciona al azar una muestra de 9 estudiantes que fuman y registró el gasto mensual en
cigarrillos, en soles. Los resultados obtenidos se muestran a continuación:

39 48 55 62 35 74 45 52 32

Suponga que el gasto mensual en cigarrillos tiene distribución normal, con un nivel de signifi -
cancia del 2% ¿será cierta la afirmación del reportaje?

Solución

Sea X:

:=

1. Hipótesis
H 0 : … … ..
H 1 : … … ..

2. Nivel de significación =

3. Estadístico de la prueba

μ0 es el valor hipotético

x −μ 0 −¿
t c= = =¿¿
s ❑
√n √❑
4. Regiones críticas

5. Decisión

6. Conclusión
A un nivel de significancia del …
Estadística para Comunicadores 193
66.Unos estudiantes de periodismo y comunicación desean conocer el tiempo promedio que dura
una entrevista a un representante político en los noticieros nocturnos. Para realizar esta prueba
tomaron una muestra al azar de 14 noticieros obteniendo un tiempo promedio de 7,4 minutos y
varianza de 0,64 minutos2. ¿Se puede afirmar que el tiempo promedio que dura una entrevista
es mayor a 7 minutos? Use un nivel de significancia del 10%.

Solución

Sea X:=

:=

1. Hipótesis
H0 : ……….
H 1 : … … ….

2. Nivel de significación =

3. Estadístico de la prueba

μ0 es el valor hipotético

x −μ 0 −¿
t c= = =¿¿
s ❑
√n √❑
4. Regiones críticas

5. Decisión

6. Conclusión
A un nivel de significancia del ……….
Estadística para Comunicadores 194
67.A partir de las utilidades, en dólares, por la producción de ocho vídeos corporativos realizados
por la productora de audiovisuales Vista S.A. para publicitar startup dedicadas a
comercialización de alimentos, se muestran a continuación:

800 1200 1400 1200 1300 1450 1600 1250

¿Se puede afirmar que el promedio de las utilidades de este tipo de audiovisual es menor a
1500 dólares? Si la afirmación es cierta, entonces el gerente de la productora cambiará de tipo
de producción audiovisual ya que considera que las utilidades son muy bajas. Asuma que la va-
riable en estudio sigue una distribución normal y use un nivel de significación del 4%.

68.El gerente de una empresa tiene la sospecha que la media de la utilidad mensual de las
empresas que invierten en publicidad por redes sociales es mayor a 42 miles de soles. De ser
así, aumentará su presupuesto en publicidad por internet. Al seleccionar al azar una muestra de
25 empresas se encontró que la utilidad promedio mensual era de 43 miles de soles con
desviación estándar de 5,2 miles de soles. Con un nivel de significancia del 5%, indique la
decisión que tomará el gerente.

69.El gerente de una empresa afirma que la media de la inversión mensual de las empresas que
invierten en publicidad mediante email marketing es menor a 13 miles de soles. De ser cierta la
afirmación, tomará la decisión de publicitar por internet el próximo semestre. Al seleccionar al
azar una muestra de 30 empresas, encontró que, en promedio, la inversión mensual en email
marketing era de 12,5 miles de soles con desviación estándar de 1,3 miles de soles. Con un nivel
de significancia del 4%, ¿qué decisión tomará?

70.El consejo municipal de una ciudad está considerando aumentar el número de agentes de
policía municipal en un esfuerzo por reducir los delitos. Si el número promedio de robos diarios
es mayor a ocho se aumentará el número de agentes. Para poder tomar una decisión el consejo
municipal tomó una muestra de 36 días y encontró que el número promedio de robos era de
8,5 con una desviación estándar igual a dos. ¿Qué decisión tomará el consejo municipal?
Suponga que el número de robos sigue una distribución normal. Utilice un nivel de significación
del 5%. Rpta: tc = 1,50; RC = ]1,68957; +[;
No rechazo H0

71.De una empresa que se dedica a la venta de cámaras fotográficas profesionales se tomó una
muestra aleatoria de estos artículos y se registró el precio, en dólares. Los datos se presentan a
continuación:

1199 948 799 658 859 859 689 859 895 699 1299

Asumiendo que las ventas siguen una distribución normal. Pruebe la hipótesis que señala que el
verdadero precio promedio de las cámaras fotográficas es superior a 800 dólares. Utilice un ni -
vel de significación del 2%. Rpta: tc = 1,438; RC = ]2,35931; +[; No rechazo H0
Estadística para comunicadores 195

Prueba de hipótesis para una proporción poblacional

Esta prueba se realiza para verificar una suposición que se hace sobre una proporción poblacional.
En este caso se utilizará la distribución Z para realizar la inferencia.

Procedimiento para realizar la prueba de hipótesis para la proporción poblacional

1. Plantear las hipótesis nula y alterna

Prueba unilateral izquierda Prueba bilateral Prueba unilateral derecha


H 0 : p ≥ p0 H 0 : p= p0 H 0 : p ≤ p0
H 1 : p< p 0 H 1 : p ≠ p0 H 1 : p> p 0

2. Fijar el nivel de significación 

3. Establecer el estadístico de la prueba

^p − p0
z= N ( 0,1 )

√ p0 ( 1− p0 )
n

4. Graficar las regiones críticas

Unilateral izquierda H1: p < p0 Unilateral derecha H1: p > p0

Bilateral H1 : p ¿ p0

5. Decidir: Rechazar H0 o no rechazar H0

6. Concluir
Estadística para comunicadores 196

Ejemplo 72
El administrador de un diario local afirma que menos del 5% de los diarios presentan errores de im-
presión. Si en una muestra aleatoria de 60 diarios se encontró que seis de ellos presentaban erro -
res de impresión. Con un nivel de significación del 2,5%, ¿se puede afirmar que el administrador
tiene razón?
Solución

El parámetro es p: proporción poblacional de diarios que presentan errores de impresión

1. Hipótesis
H0 p≥ 0,05
H 1 ¿ p<0,05 ?

2. Nivel de significación
¿ 0,025

3. Estadístico de prueba

El valor hipotético p0 = 0,05.

6
−0,05
^p − p0 60
z= = =1,7770

√ p0 ( 1− p0 )
n √ 0,05 × ( 1−0,05 )
60

4. Regiones críticas

Para la gráfica se debe tener en cuenta el signo de la hipótesis alterna. Como H 1 dice “menor”,
entonces la prueba es unilateral izquierda.

-1,96

Z -0.09 -0.08 -0.07 -0.06 -0.05 -0.04 -0.03 -0.02 -0.01 -0.00
-2.0 0.01831 0.01876 0.01923 0.01970 0.02018 0.02068 0.02118 0.02169 0.02222 0.02275
-1.9 0.02330 0.02385 0.02442 0.02500 0.02559 0.02619 0.02680 0.02743 0.02807 0.02872
-1.8 0.02938 0.03005 0.03074 0.03144 0.03216 0.03288 0.03362 0.03438 0.03515 0.03593

5. Decisión

Como 1,7770 no pertenece a la región crítica, entonces, no se rechaza H0.

6. Conclusión
Estadística para comunicadores 197
Con un nivel de significancia del 2,5% no se puede afirmar que menos el 5% de los diarios pre -
senta error de impresión. La afirmación del administrador no es cierta.

Ejemplo 73
Un programa televisivo de investigación encontró, el año pasado, que el 40% de las denuncias que
recibían sus investigadores por correo electrónico eran por estafa. Este año se realizó un estudio si -
milar, encontrándose que, en una muestra de 420 denuncias por correo, 188 de ellos eran por es -
tafa. ¿Se puede afirmar que este año aumentó la proporción de denuncias por estafa? Use  =
0,05.
Solución
Sea el parámetro p: proporción poblacional de denuncias por correo electrónico que son por estafa

1. Hipótesis
H0 p≤ 0,40
H 1 ¿ p>0,40 ?

2. Nivel de significación
¿ 0,05

3. Estadístico de la prueba

El valor hipotético p0 = 0,40.

188
^p − p0 −0,40
420
z= = =1,9913

√ p0 ( 1− p0 )
n √ 0,40 × ( 1−0,40 )
420

4. Regiones críticas

Para la gráfica se debe tener en cuenta el signo de la hipótesis alterna. Como H 1 dice “mayor”,
entonces la prueba es unilateral derecha.

1,64

Z 0.00 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09
1.5 0.93319 0.93448 0.93574 0.93699 0.93822 0.93943 0.94062 0.94179 0.94295 0.94408
1.6 0.94520 0.94630 0.94738 0.94845 0.94950 0.95053 0.95154 0.95254 0.95352 0.95449
1.7 0.95543 0.95637 0.95728 0.95818 0.95907 0.95994 0.96080 0.96164 0.96246 0.96327

5. Decisión

Como 1,9913 pertenece a la zona de rechazo entonces, se rechaza H 0.


Estadística para comunicadores 198
6. Conclusión

Con 5% de nivel de significación se puede afirmar que más del 40% de las denuncias que los in -
vestigadores reciben por correo electrónico son por estafa. Por lo tanto, la afirmación es verda-
dera, la proporción ha aumentado.
Ejemplo 74
El 70% de las campañas publicitarias manejadas por la compañía Cuarzo tienen éxito. Para verificar
esta afirmación se seleccionaron aleatoriamente 80 campañas publicitarias, encontrándose que 50
de ellas tienen éxito. Con un nivel de significancia del 2% ¿será cierta la afirmación?
Solución

Definamos el parámetro y el estadístico.

p: proporción poblacional de campañas publicitarias que tuvieron éxito (Parámetro)


^p: proporción muestral de campañas publicitarias que tuvieron éxito (Estadístico)

1. Hipótesis
H 0 ¿ p=0,70?
H1 p ≠0,70

2. Nivel de significación
¿ 0,02

3. Estadístico de la prueba

50
^p − p0 −0,70
80
z= = =−1,4638

√ p0 ( 1− p0 )
n √ 0,70 × ( 1−0,70 )
80

4. Regiones críticas

Como H1 dice “diferente” la prueba es bilateral.

-2,33 2,33

En la tabla normal buscamos el valor más cercano a 0,99.

Z 0.00 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08


2.2 0.98610 0.98645 0.98679 0.98713 0.98745 0.98778 0.98809 0.98840 0.98870
2.3 0.98928 0.98956 0.98983 0.99010 0.99036 0.99061 0.99086 0.99111 0.99134
2.4 0.99180 0.99202 0.99224 0.99245 0.99266 0.99286 0.99305 0.99324 0.99343

5. Decisión
Estadística para comunicadores 199

Como -1,4638 no pertenece a la zona de rechazo, entonces no rechazamos H 0.

6. Conclusión
A un nivel de significancia del 2%, no existe evidencia estadística suficiente para afirmar que la
proporción poblacional de campañas publicitarias que tuvieron éxito es diferente a 0,70. Por
tanto, aceptamos la afirmación.
Ejemplo 75
Un diario local informó que más del 33% de los estudiantes de una universidad tienen como plato
preferido el ceviche. El jefe del comedor universitario necesita contrastar dicha hipótesis, para ello
seleccionó una muestra aleatoria de 600 estudiantes preguntándoles ¿Cuál de los platos que ofre-
ce el comedor universitario es su preferido? El resultado se resume en el siguiente gráfico.

Distribución de estudiantes de una universidad según su plato preferido


40%
34.62%
Porcentaje de alumnos

35%

30%

25%
23.08%

20%
15.38% 15.38%
15%

10% 7.69%
3.85%
5%

0%
Lomo Saltado Ceviche de Pato Ají de gallina Carapulcra Tallarines Otros

Fuente: Diario A Plato preferido

Con un nivel de significancia del 10%, es posible afirmar lo manifestado por el diario local.

Solución

Definamos el parámetro y el estadístico.

p:= proporción poblacional de estudiantes que tienen como plato preferido el ceviche (Parámetro)
^p:= proporción muestral de estudiantes que tienen como plato preferido el ceviche (Estadístico)

1. Hipótesis
H0 p≤ 0,33
H 1 ¿ p>0,33 ?

2. Nivel de significación
 = 0,10

3. Estadístico de la prueba
Estadística para comunicadores 200
^p − p0 0,3462−0,33
z= = =0,8439

√ p0 ( 1− p0 )
n √ 0,33 × ( 1−0,33 )
600

4. Regiones críticas

Como H1 dice “mayor” es una prueba unilateral derecha.

1,28

El valor crítico es 1,28.

Z 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09


1,2 0,88686 0,88877 0,89065 0,89251 0,89435 0,89617 0,89796 0,89973 0,90147
1,3 0,90490 0,90658 0,90824 0,90988 0,91149 0,91309 0,91466 0,91621 0,91774

5. Decisión

Como 0,8439 no pertenece a la zona de rechazo, entonces no rechazamos H 0.

6. Conclusión
A un nivel de significancia del 10%, no existe evidencia estadística suficiente para afirmar que
más del 33% de los estudiantes prefieren cebiche.
Estadística para comunicadores 201

Ejercicios de aplicación

72.Una encuesta realizada por una emisora radial a 814 adultos de Lima Metropolitana arrojó que
582 adultos consideraban que el principal problema de los accidentes de tránsito se debía al
estado de ebriedad de los conductores ¿Será cierto que más del 70% de adultos de Lima
Metropolitana considera que el principal problema se debe al estado de ebriedad de los
conductores? Concluya para  = 0,02.
X: ….

1. Hipótesis
H0 : p
H1 : p

2. Nivel de significación
=

3. Estadístico de la prueba

^p − p0 −¿ ¿
z= =

√ p0 ( 1− p0 ) √× ¿ ¿ ¿ ¿
n

4. Regiones críticas

5. Decisión

6. Conclusión
Estadística para Comunicadores 202
73.En abril último, un diario de la capital publicó un artículo acerca de la situación laboral de los
limeños. Los resultados obtenidos a partir de una encuesta, realizada por una prestigiosa
encuestadora de la capital, a una muestra de 2735 limeños de 18 a 70 años se presentan a
continuación:

Distribución porcentual de limeños según situación laboral actual

¿Es posible afirmar, en base a la información muestral, que menos del 60% de los limeños son
trabajadores independientes? Use  = 0,05.

X= ….

1. Hipótesis
H0 : ………
H 1 : … .… …

2. Nivel de significación
=

3. Estadístico de la prueba

^p − p0 −¿ ¿
z= =

√ p0 ( 1− p0 ) √× ¿ ¿ ¿ ¿
n

4. Regiones críticas

5. Decisión

6. Conclusión
Estadística para comunicadores 203

74.Los vendedores de productos tecnológicos decidirán colocar anuncios en Instagram si el


porcentaje de personas que prefieren esta red social es del 35%. Para tomar la decisión, se
seleccionó al azar una muestra de 326 personas mayores de edad de Lima Metropolitana. La
información se resume en el siguiente cuadro:

Distribución de encuestados según red social preferida


Red social preferida Frecuencia Porcentaje
Instagram 96 29.45%
Facebook 67 20.55%
Twitter 87 26.69%
Otros 76 23.31%
Total 326 100.00%

Con un nivel de significancia del 6%, ¿cuál será la decisión de los vendedores?

X: ….

1. Hipótesis
H0 …….
H1 …….

2. Nivel de significación
=

3. Estadístico de la prueba

^p − p0 −¿
z= = ¿

√ p0 ( 1− p0 ) √× ¿ ¿ ¿ ¿
n

4. Regiones críticas

5. Decisión

6. Conclusión
Estadística para Comunicadores 204
75.El gerente de la productora de audiovisuales Vista S.A. afirmó que los cortometrajes
representan más del 25% del total de la producción, por lo que solicita aumentar la inversión en
tecnología acorde y en un especialista en dicho producto. En base a una muestra de 350
audiovisuales se obtuvo la siguiente distribución de frecuencias:

Distribución de audiovisuales según tipo de producción


Tipo de producción fi
Cortometraje 100
Serie de televisión 32
Vídeo corporativo 80
Documental 48
Vídeo streaming 90
Total 350
Fuente: Vista S.A.

Usando un nivel de significación del 3%, ¿se deberá aumentar la inversión en este tipo de pro-
ducción?

76.La gerencia de la recién estrenada área de Experiencia del cliente de una empresa de
radiodifusión se encuentra diseñando la estrategia con la que busca darle una nueva
orientación a su plataforma móvil. Su principal preocupación es cómo hacer para que una
empresa de radio pueda tener presencia en el mundo del smartphone. Cree, que la respuesta
es el marketing de contenidos.
El gerente tiene la sospecha que más del 45% de los usuarios prefieren contenido en social me-
dia, por lo que debería utilizar únicamente este medio en la etapa de lanzamiento, caso contra-
rio deberá emplear equitativamente todos los medios disponibles. Los resultados obtenidos de
una muestra de 120 oyentes se presentan en la siguiente gráfica:

Distribución de oyentes según formato de contenido preferido


60%
52.2%
50%

40%
Porcentaje

30% 27.8%
20.0%
20%

10%

0%
Social media (post, redes Online (newsletter, ebooks, Multimedia (video, podcasts,
siciales, ...) …) …)
Formato de contenido preferido
 Fuente: Empresa de radiodifusión

Con un nivel de significancia del 3%. ¿deberá el gerente usar únicamente el social media en la
etapa de lanzamiento?

77.De acuerdo con los datos provistos por el Observatorio de Movilidad Urbana, en el año 2015 la
mitad de los vehículos de transporte público tenían más de 20 años de antigüedad. Este año, en
un local de la empresa “Revisiones Técnicas Vehiculares S.A.”, se recogió información de una
muestra de 120 vehículos, de los cuales 54 tenían más de 20 años de antigüedad. ¿Se puede
afirmar con un 2,5% de significación, que la proporción de vehículos antiguos de transporte
público se ha reducido?
Estadística para comunicadores 205
78.Las empresas, para promocionar sus productos, invertirán más en publicidad por redes sociales
si se tiene la certeza de que el tiempo que las personas dedican a sus redes sociales es mayor a
85 minutos por día. Para probar esta afirmación, se seleccionaron al azar 115 personas y se
encontró que, en promedio por día, el tiempo que dedica a sus redes sociales es 95.91 minutos
con desviación estándar de 50,688 minutos. Con un nivel de significación del 4%, ¿cuál será la
decisión de las empresas?

79.Se realizó una encuesta a una muestra de 300 estudiantes universitarios de Lima
Metropolitana. Los resultados obtenidos a la pregunta ¿cuál es tu red social favorita? se
muestran en el siguiente gráfico:

Distribución porcentual de estudiantes universitarios según red social favorita


Otros; 11%

Facebook; 34%

Instagram; 21%

Twitter; 11%

Snapchat; 23%
Fuente: Diario A
Usan-
do un nivel de significación del 4% ¿se puede afirmar que más del 30% de los alumnos prefieren
Facebook como red social favorita? Rpta: zc = 1,512; RC = ]1,75; +[; No rechazo H0

80.Diferentes estudios indican que más del 80% de los usuarios usan los buscadores en la web para
encontrar información sobre productos y servicios antes de comprarlos. Para verificar esta
información se seleccionan al azar 200 personas, de las cuales 170 indicaron que realizaron
consultas en la web antes de comprar el producto o servicio. Con un nivel de significación del
2,5% ¿Hay razón para dar credibilidad a dicha afirmación?
Rpta: zc = 0,933; RC = ]2,05; +[; No rechazo H0

81.Se cree que por lo menos el 20% de los estudiantes de la carrera de Ciencias de la Comunicación
desea trabajar en el extranjero al finalizar sus estudios. Una encuesta realizada a una muestra
aleatoria de 560 estudiantes se encontró que 85 estaban dispuestos a trabajar en el extranjero
al finalizar su carrera. A un nivel de significación del 4% ¿cuál es su conclusión?
Rpta: zc = -2,852; RC = ]-; -1,75[; Rechazo H0

82.El director de la empresa de cable Cablemás afirma que más del 75% de los televidentes con
cable tiene instalado Cablemás en los hogares del distrito A. Otra compañía de cable que va a
realizar un estudio, duda de tal afirmación y lo quiere comprobar. Para ello toma una muestra
aleatoria de 600 hogares con servicio de cable y obtiene que 463 hogares tienen instalado el
servicio de cable Cablemás ¿Es cierto lo que afirma el director? Use un nivel de significación del
5%. Rpta: zc = 1,226; RC = ]1,64; +[; No
rechazo H0
Estadística para Comunicadores 206

Regresión lineal simple y correlación


Un aspecto importante de la Estadística es el análisis de dependencia entre dos o más variables.
Usualmente, es interesante conocer el efecto que una o varias variables pueden causar sobre otra,
e incluso predecir en mayor o menor grado valores en una variable a partir de otra.

Por ejemplo, quisiéramos responder a las siguientes preguntas:


¿Cuál será el gasto que incurrirá una familia cuyo ingreso familiar mensual es 4000 soles?
¿Cuál será el monto de ventas de una empresa si invierte en publicidad 10 000 dólares?
¿Existirá relación lineal entre la edad del cliente y el monto de las compras realizadas?

El análisis de regresión lineal y de correlación comprende el estudio de los datos muestrales para
saber si dos variables cuantitativas están relacionadas entre sí en una población.

Análisis de En el análisis de regresión lineal se obtiene una ecuación matemática que


regresión describe cierta relación lineal. La ecuación puede usarse para estimar o
predecir los valores de una variable dependiente, llamada Y, cuando se
lineal conocen o se suponen conocidos los valores de otra variable, variable
independiente, llamada X.

Análisis de En el análisis de correlación se tiene como objetivo principal medir el grado


correlación de asociación o la relación lineal existente entre dos variables. Es útil en un
trabajo exploratorio cuando el investigador desea encontrar el grado o la
fuerza de esa relación.

Se trabajará con variables de tipo cuantitativas, entre las cuales se puede establecer una relación
funcional
Y =f ( X )

Entonces diremos que la variable Y depende de la variable X.

Ejemplo
Para cada par de variables, identifique la variable dependiente (Y ) e independiente ( X ), la
pendiente (positiva o negativa) y el tipo de relación (inversa o directa) y qué significa el tipo de
relación:

Ingreso mensual (soles)


Variables
Consumo mensual (soles)

Variable dependiente

Variable independiente

Pendiente

Tipo de relación
Estadística para comunicadores 207

Significado de la relación

Precio de venta del auto (dólares)


Variables
Antigüedad (años)

Variable dependiente

Variable independiente

Pendiente

Tipo de relación

Significado de la relación

Diagrama de dispersión o gráfico del plot

El primer paso en el análisis de regresión es registrar simultáneamente los valores de las dos
variables asociadas ( X , Y ) en una gráfica bidimensional para ver si existe una tendencia lineal que
podría explicar la relación entre estas dos variables

Esta gráfica denominada diagrama de dispersión, nos permite visualizar el tipo de tendencia entre
las dos variables. Esta tendencia puede ser lineal o no lineal. También se puede observar si es una
relación directamente proporcional o inversamente proporcional.
Estadística para comunicadores 208

Pendiente: … Pendiente: … Relación no lineal


Relación: … entre X e Y Relación: … entre X e Y entre X e Y

Ecuación de regresión
Para encontrar la ecuación lineal se trabajará con los cuadros de resultados (salidas) que se obtie -
ne al procesar los datos con Excel. La gráfica obtenida será la siguiente:

Modelo poblacional

Y = β0 + β 1 X +e

Modelo muestral

^y =b0 +b1 x

Donde:

b 0 es la ordenada en el origen o intercepto de la recta con el eje Y


b 1 es la pendiente de la recta o coeficiente de regresión

Método de los mínimos cuadrados


Mediante este método es posible seleccionar la recta que se ajuste mejor a los datos. La recta
resultante tiene dos características importantes:

 La suma de las desviaciones verticales de los puntos con relación a la recta es cero.
 La suma de los cuadrados de las desviaciones es mínima (es decir, ninguna otra recta daría una
n
menor suma de cuadrados de tales desviaciones). Es decir, ∑ ( y i−^y i ) es mínima.
2

i=1
Estadística para comunicadores 209

Los valores de b 0 y b1 que minimizan la suma de los cuadrados de las desviaciones, son las
soluciones de las llamadas ecuaciones normales de la recta de regresión:

(∑ )
n n

∑ yi =¿ n b0 +b 1 xi ¿
i=1 i=1

( ) (∑ )
n n n

∑ x i y i=¿ b0 ∑ xi +b1 x2i ¿


i=1 i=1 i=1

Este método nos permite estimar los parámetros del modelo de regresión. Resolviendo las
ecuaciones simultáneas para b o y b 1 tenemos:

( ) ( )(∑ )
n n n
n ∑ xi yi − ∑ xi yi
i=1 i=1 i =1
b 1=

(∑ ) (∑ )
n n 2
2
n x −
i xi
i=1 i=1

b o= y−b1 x

La ecuación de la recta estimada mediante Excel se basa en el método de mínimos cuadrados.

Interpretación de los coeficientes de regresión:


Intercepto b0
Indica el valor de la variable respuesta (Y), cuando la variable independiente (X) es igual a cero. Sin
embargo, carece de interpretación práctica si dicho valor está fuera del rango del conjunto de valo-
res de X.
Pendiente b1
Indica el cambio promedio (incremento o disminución) en la variable respuesta (Y), cuando la va-
riable independiente (X) aumenta en una unidad.

Ejemplo 76
Considere las siguientes variables cuantitativas:

X: variable independiente = Tiempo de experiencia profesional (en años)


Y: variable dependiente = Ingreso mensual (en soles)

Complete:

La relación es …

La pendiente es …

¿Qué significa?
Estadística para comunicadores 210

Interprete los coeficientes de regresión:

b0 = …

b 1= …

Validación del modelo de regresión lineal


No siempre la ecuación estimada es válida. Puede ocurrir que no exista pendiente, es decir que la
pendiente poblacional sea igual a 0. Esto significaría que no existe relación lineal entre las variables
X e Y. Es necesario entonces verificar si el modelo es válido.

Se realiza la prueba:

1. H0: β 1=¿ 0 (no es válido el modelo)


H1: β 1 ≠ 0 (sí es válido el modelo)

2. Nivel de significancia: 

3. La regla de decisión es comparar el valor Sig o p-valor con 

 Si Sig es menor que  (Sig < ) entonces, se rechaza H0.


 Si Sig es mayor o igual que  (Sig  ) entonces, no se rechaza H0.

4. Conclusión

Ejemplo 77
Se desea estimar el ingreso por ventas (en miles de dólares) en función del gasto en publicidad (en
miles de dólares). A continuación, se muestran los datos de los últimos ocho meses:

Gasto en publicidad 2 1 3 4 3 2 4 5
Ingresos por ventas 7 5 7 9 8 6 11 13

Valide el modelo de regresión. Use un nivel de significación del 5%.


Estadística para comunicadores 211

Solución
Para validar al modelo debemos probar que la pendiente poblacional es diferente a cero.

1. H0: β 1=¿ 0 (el modelo no es válido)


H1: β 1 ≠ 0 (el modelo sí es válido)

2. Nivel de significancia: = 0,05

3. La regla de decisión es comparar el valor Sig o p-valor con 

Para dar validez al modelo usaremos la tabla de coeficientes de la salida de Excel.

Coeficientes Error típico Estadístico t Probabilidad (sig)


Intercepción (bo) 2.5 0.888780375 2.812843386 0.030641293
Gasto en publicidad (b1) 1.916666667 0.274283579 6.987901633 0.000427476

Sig=p−valor=0,000427476<¿ 0,05, entonces se rechaza H0.

4. Conclusión: Con un nivel de significación del 5%, se puede afirmar que el modelo lineal esti-
mado es válido.

Coeficiente de determinación

El coeficiente de determinación (r2) se calcula de la siguiente manera:

SCReg
R2 = ×100 %
SCTot

r2 siempre es positivo varía entre 0% y 100%; es decir, 0% ≤ r2 ≤ 100%

El coeficiente de determinación expresa en que porcentaje de la variabilidad total de Y es explicada


por X en el modelo lineal estimado. Cuando r2 es más cercano a 100%, mejor será el ajuste de la
recta a los datos.

Coeficiente de correlación

El coeficiente de correlación expresa el grado de asociación lineal que existe entre dos variables X e
Y. El coeficiente de correlación muestral se denota por r y varía dentro del intervalo de -1 a 1. Se
expresa: -1 ≤ r ≤1. El coeficiente de correlación r siempre tiene el signo de la pendiente b1

r=
{√ R2
−√R
2
si b1 >0
si b1 <0

 Si b1 y r son positivos, entonces la relación entre las variables es directa.


 Si b1 y r son negativos, entonces la relación entre las variables es inversa.

Además,

 Cuando r = 0, indica que no existe correlación o asociación entre las variables.


 Cuando r se acerca -1 o a +1 indica que existe una asociación fuerte.
Estadística para comunicadores 212
 Cuando r = -1 o r = +1, la correlación o asociación entre estas variables es perfecta.
En los resultados del Excel, el valor de r siempre se muestra en positivo. En el caso de que la pen -
diente b1 sea negativa, deberá colocar al coeficiente de correlación r el signo negativo.

Los valores que se pueden tomar como referencia para determinar si existe o no una relación lineal
directa o inversa se muestra a continuación y pueden variar de acuerdo con el campo de estudio:

-1,0 -0,65 -0,2 0,2 0,65 1,0


Relación lineal fuerte e inversa No existe relación lineal Relación lineal fuerte y directa

Ejemplo 78
Indique qué valor de r2 y r le corresponde a cada gráfico. Además, indique el tipo de relación entre
las variables.

Situación 1 Situación 2 Situación 3


r2 = 57% r2 = 98% r2 = 82%
Solución

Situación 1
El coeficiente de determinación es 57%.
El coeficiente de correlación es 0,7549; por tanto, la relación entre las variables es directa y fuerte.

Situación 2
El coeficiente de determinación es 98%.
El coeficiente de correlación es 0,9899; por tanto, la relación entre las variables es directa y fuerte.

Situación 3
El coeficiente de determinación es 82%.
El coeficiente de correlación es -0,9055; por tanto, la relación entre las variables es inversa y fuer -
te.

Ejemplo 79
El número de vendedores y los ingresos por ventas, en miles de soles, en una tienda para los pri -
meros seis meses del año fueron los siguientes:

Mes Enero Febrero Marzo Abril Mayo Junio


Número de vendedores 14 22 19 35 30 44
Estadística para comunicadores 213
Ingreso por ventas 17,5 18,5 18,0 26,0 25,0 29,5

a. Interprete el coeficiente de determinación.


b. Interprete el coeficiente de correlación.

Solución
a. Interprete el coeficiente de determinación.

Estadísticas de la regresión
Coeficiente de correlación múltiple 0.97637959
Coeficiente de determinación R^2 0.95331711
R^2 ajustado 0.94164639
Error típico 1.22560973
Observaciones 6

El coeficiente de determinación es r2 = 0,953 y en porcentaje es 95,3%.

Interpretación

El 95,3% de la variación total del <ingreso por ventas>, es explicado por el <número de vende -
dores> en el modelo de regresión lineal estimado.

El 10,9% restante de la variabilidad del <ingreso por ventas>, se debe a otros factores no con -
templados en el modelo.

b. Interprete el coeficiente de correlación.

Excel siempre muestra el valor del coeficiente de correlación positivo. Por tanto, es importante
verificar su signo, que es siempre el mismo de la pendiente de la recta b1.

  Coeficientes Error típico Estadístico t Probabilidad (sig)


Intercepción 10.2505382 1.43609965 7.13776251 0.00203755
Número de vendedores 0.44510226 0.04924816 9.03794776 0.0008303

En este caso b1 = 0,445 es un número positivo, por lo tanto, el coeficiente de correlación es un


número positivo r = 0,976.

Interpretación
Entre el número de vendedores y el ingreso por ventas existe una correlación positiva y fuerte,
por ser su valor cercano a 1.

Ejemplo 80
Se desea determinar un modelo para estimar la audiencia, en miles de televidentes, de un progra -
ma televisivo que se transmite al mediodía en términos del número de regalos que se entregan en
el programa. Para ello se seleccionó al azar 10 días y se midió la cantidad de televidentes.

Número de regalos 11 7 13 17 17 19 3 11 16 8
Audiencia diaria 20 12 21 26 22 30 10 15 26 13
Estadística para comunicadores 214

a. Defina las variables X e Y.


b. Presente el diagrama de dispersión. ¿Qué relación observa? Comente.
c. Estime la ecuación de la recta. Interprete los coeficientes de regresión estimados.
d. Valide el modelo de regresión lineal. Use un nivel de significación del 5%.
e. Estime la audiencia diaria del programa cuando se hicieron 15 regalos.

Solución
a. Defina las variables X e Y.

Variable independiente X: Número de regalos


Variable dependiente Y: Audiencia diaria (miles de televidentes)

b. Presente el diagrama de dispersión. ¿Qué relación observa? Comente.

35
30
25f(x) = 1.24791318864775 x + 4.2754590984975
Audiencia diaria

20
15
10
5
0
2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
Número de regalos

La relación es directa, pues observamos que a más regalos que entregue el programa, mayor au-
diencia tendrá.

c. Estime la ecuación de la recta. Interprete los coeficientes de regresión estimados.

^y =4,275+1,2479 x

b 0=4,275 . b 0significa el valor de Y cuando X = 0. Si un día el programa no entrega regalos se esti-


ma que la audiencia será de 4,275 miles de televidentes.

b 1=1,2479. b 1significa el cambio de Y cuando X aumenta en 1. Por cada regalo adicional que se
entregue en el programa, la audiencia aumentará en 1,2479 miles de televidentes.

d. Valide el modelo de regresión lineal. Use un nivel de significación del 5%.

Validar el modelo lineal significa probar que la pendiente de la recta es diferente de cero.

1. H0: β 1=¿ 0 (el modelo no es válido)


H1: β 1 ≠ 0 (el modelo sí es válido)

2. Nivel de significancia: = 0,05

3. La regla de decisión es comparar el valor Sig o p-valor con 


Estadística para comunicadores 215

Para dar validez al modelo usaremos la tabla de coeficientes de la salida de Excel.

  Coeficientes Error típico Estadístico t Probabilidad (sig)


Intercepción 4.2754591 1.884030798 2.26931487 0.05294702
Número de regalos X 1.24791319 0.143323079 8.70699401 2.3621E-05

El valor p = 0,000023621 < α = 0,05, entonces se rechaza H0.

4. Conclusión: Con un nivel de significación del 5%, se puede afirmar que el modelo lineal esti-
mado es válido.

e. Estime la audiencia diaria del programa cuando se hicieron 15 regalos.

^y =4,275+1,2479 ×15=22,994

La audiencia estimada será 22,994 miles de televidentes si se entregan 15 regalos en el programa.


Estadística para comunicadores 216

Ejercicios de aplicación

83.Una empresa desea estimar el ingreso por ventas (en miles de dólares) en función al gasto en
publicidad (en miles de dólares). A continuación, se muestran los datos de los últimos ocho
meses:

Gasto en publicidad 2 1 3 4 3 2 4 5
Ingresos por ventas 7 5 7 9 8 6 11 13

a. Defina las variables X e Y.

Variable independiente X:
Variable dependiente Y:

b. Presente el diagrama de dispersión. ¿Qué relación observa? Comente.

c. Estime la ecuación de la recta. Interprete los coeficientes de regresión estimados.

d. Estime las ventas cuando se invierte 4500 dólares en publicidad.

e. Valide el modelo de regresión. Use =0,05


Estadística para comunicadores 217
84.El gerente de ventas de una compañía se está preparando para una reunión y le gustaría
mostrar al nuevo grupo de vendedores la forma como se relaciona el número de visitas
realizada por los vendedores a los clientes con el monto de compra del cliente, en miles de
soles. Los datos obtenidos de los registros del último año, de diez clientes seleccionados al azar,
se presentan a continuación:

Clientes 1 2 3 4 5 6 7 8 9 10
Número de visitas 5 4 6 7 8 1 3 4 1 3
Monto de compra (miles de soles) 8,7 7,1 13,7 15,1 16,7 2,2 4,6 7,5 2,3 6,1

a. Defina las variables X e Y

Variable independiente X:
Variable dependiente Y:

b. Realice el diagrama de dispersión. ¿Qué relación observa? Comente

c. Estime el modelo lineal e interprete los coeficientes de regresión.

d. Estime el monto de compra del cliente, en miles de soles, cuando recibió nueve visitas.
Estadística para comunicadores 218
e. Valide el modelo de regresión lineal. Use un nivel de significación del 5%.

f. Interprete los valores de los coeficientes de correlación y de determinación.

85.El gerente de una empresa desea estimar las ventas anuales (en miles de dólares) en función a
los años de experiencia de sus trabajadores. Los resultados de una muestra de nueve
colaboradores se presentan a continuación:

Experiencia (en años) 2 3 4 6 8 10 10 11 13


Ventas anuales (miles de dólares) 97 92 102 103 111 119 123 117 136

a. Defina las variables X e Y.

Variable independiente X:
Variable dependiente Y:

b. Realice el diagrama de dispersión. ¿Qué relación observa? Comente.


Estadística para comunicadores 219
c. Encuentre el modelo estimado e interprete los coeficientes de regresión.

d. Estime la venta anual de un trabajador con 12 años de experiencia.

e. Valide el modelo de regresión. Utilice un nivel de significación del 5%.

f. Interprete el coeficiente de correlación y determinación.

86.Para estimar el costo de la producción (en miles de dólares) por cada 15 minutos de animación
en 2D en función del número de dibujos (en unidades) realizados por las empresas dedicadas a
la animación, se tomó una muestra de 15 producciones realizadas por empresas de animación
del continente asiático. Los resultados obtenidos fueron:

Costo 36 21 34 48 54 56 68 26 19 26 33 42 38 33 32
Número de dibujos 250 150 280 390 460 550 190 200 106 180 250 300 380 294 300

a. Presente el modelo estimado e interprete el valor de la pendiente.


Rpta: ^y = 17,992 + 0,069 x
b. Valide el modelo estimado. Use un nivel de significación de 5%.
Rpta: Sí es válido.
c. Indique el valor del coeficiente de correlación e interprete.
Rpta: 0,604
Estadística para comunicadores 220
d. Estime el costo de animación 2D si la producción está compuesta por 280 dibujos.
Rpta: 37,312

87.Un economista del departamento de recursos humanos de una empresa está preparando un
estudio sobre el comportamiento del consumidor. Él recolectó los datos de doce consumidores,
en miles de dólares, para determinar si existe una relación entre el ingreso del consumidor y los
niveles de consumo.

Consumidor 1 2 3 4 5 6 7 8 9 10 11 12
Ingreso 24,3 12,5 31,2 28,0 35,1 10,5 23,2 10,0 8,5 15,9 14,7 15,0
Consumo 16,2 8,5 15,0 17,0 24,2 11,2 15,0 7,1 3,5 11,5 10,7 9,2

a. Presente el diagrama de dispersión. Rpta:

b. Presente el modelo estimado. Rpta: ^y = 1,778 + 0,558 x


c. Valide e interprete el modelo de regresión. Utilice un nivel de significación del 5%.
Rpta: Sí es válido.
d. ¿Qué proporción de cada dólar adicional del ingreso se destina al consumo?
Rpta: 0,558

88.El número de vendedores y los ingresos por ventas (en miles de soles) en una tienda para los
primeros seis meses del año fueron los siguientes:

Mes Enero Febrero Marzo Abril Mayo Junio


Número de vendedores 14 22 19 35 30 44
Ingreso por ventas 17,5 18,5 18,0 26,0 25,0 29,5

a. Trace el diagrama de dispersión ¿qué tipo de relación se deduce a partir del diagrama?

Rpta: Directa

b. Valide e interprete el modelo de regresión estimado. Utilice un nivel de significación del


5%. Rpta: Sí es válido
c. Estime el ingreso por ventas si el número de vendedores es igual a 25.
Rpta: 21,376
d. ¿Qué porcentaje de la variación de los ingresos por ventas sería explicado por la influencia
lineal del número de vendedores? Rpta: 95,3%.
Estadística para Comunicadores 221

Tablas estadísticas
Estadística para comunicadores 222

Tabla de números aleatorios


C1 C2 C3 C4 C5 C6 C7 C8 C9 C10 C11 C12 C13 C14 C15 C16 C17 C18 C19 C20
4 8 2 4 6 6 3 5 4 5 6 0 5 2 6 9 8 0 0 9
9 2 9 8 1 4 4 1 9 8 5 1 1 9 7 9 8 5 9 0
0 2 1 3 3 9 1 6 2 9 7 1 2 6 6 0 7 5 6 4
9 6 0 8 3 5 6 6 6 4 0 8 6 3 4 8 1 8 5 4
1 6 4 1 6 5 2 7 7 2 9 9 9 9 7 4 1 5 4 9
2 9 0 5 5 0 8 4 8 7 4 6 2 1 7 0 1 5 8 7
6 1 2 9 5 0 4 0 9 8 2 0 2 6 8 7 0 1 9 7
1 3 1 8 9 9 0 1 2 6 3 7 1 9 6 1 7 9 9 8
4 5 8 1 1 4 5 6 7 9 9 9 2 1 3 2 3 7 7 9
0 0 3 6 9 6 5 0 6 4 7 9 8 1 2 4 4 8 3 6
7 2 4 5 4 1 2 4 4 6 9 2 6 6 6 5 2 0 0 4
4 9 3 4 4 2 4 5 9 0 8 7 4 8 4 2 1 2 5 4
6 1 2 8 1 3 3 2 0 2 6 0 7 2 7 9 1 4 6 5
9 3 4 0 8 1 3 3 7 3 2 4 8 6 7 9 0 6 2 8
1 8 7 1 3 4 3 9 3 1 7 8 3 7 3 3 0 8 3 5
0 2 1 4 7 5 7 3 1 1 9 3 3 8 7 4 8 0 2 5
3 6 3 4 1 9 8 1 0 9 0 1 1 0 9 3 6 8 6 0
9 4 6 7 6 7 9 1 2 2 7 2 3 9 3 4 6 9 8 1
5 9 9 8 4 4 5 9 1 5 4 7 3 0 6 8 1 6 8 1
8 1 8 8 2 3 9 1 4 2 4 9 1 4 0 6 0 3 2 8
0 5 3 8 0 4 3 9 4 6 0 8 8 3 8 7 1 2 2 3
9 7 1 4 2 7 5 5 2 8 6 6 3 5 5 9 9 0 6 8
6 9 5 9 4 9 1 8 2 0 2 5 3 9 1 2 0 3 0 8
7 4 9 1 4 8 8 6 6 8 5 9 4 8 5 7 7 9 6 7
3 8 1 2 2 4 0 1 4 5 7 7 4 0 4 8 9 4 7 0
9 9 9 7 8 0 0 9 3 2 7 0 5 0 2 7 8 7 3 6
4 8 1 5 8 5 5 1 4 9 6 4 4 4 7 4 5 7 5 0
8 6 7 3 6 1 7 1 1 3 5 5 7 4 4 7 6 7 2 8
4 7 1 4 0 3 6 2 4 4 4 4 0 3 6 3 4 1 2 8
6 5 5 8 8 4 3 4 8 9 0 6 7 6 0 0 8 6 8 4
9 2 0 9 8 2 8 3 4 3 2 8 9 4 8 7 9 4 9 4
1 3 7 9 4 8 3 7 0 8 6 6 6 8 4 1 1 3 1 3
3 3 2 5 6 7 6 1 6 6 1 7 6 5 8 1 6 2 2 7
9 9 9 8 2 8 8 1 9 1 6 2 7 5 1 8 6 1 4 4
1 7 5 4 0 9 5 7 8 7 5 0 8 6 6 2 5 3 2 3
2 7 1 7 8 8 3 8 6 9 9 2 7 4 5 9 5 6 6 6
6 0 9 2 6 1 5 1 2 3 1 8 1 2 0 8 6 4 4 0
3 3 6 3 4 9 6 4 4 9 8 5 7 3 3 4 2 3 2 8
0 1 9 7 9 7 9 4 4 1 6 6 7 7 0 7 9 8 6 8
4 7 1 5 3 7 0 9 2 5 2 1 0 0 4 0 4 6 8 8
7 8 9 9 6 8 5 6 8 1 9 2 7 5 1 7 0 1 5 5
2 2 3 3 1 8 1 9 8 4 2 8 5 2 8 1 7 6 4 6
2 6 6 4 1 4 8 1 0 6 0 1 3 4 0 9 1 2 8 6
5 1 9 0 3 9 1 6 1 7 8 8 2 8 0 7 8 4 8 0
9 0 5 8 4 9 2 2 3 9 8 5 9 5 7 8 4 9 9 4
8 6 1 9 2 5 0 0 7 9 0 0 7 4 5 4 8 6 2 3
1 9 1 0 9 7 5 1 2 7 1 9 4 8 4 8 9 6 6 9
5 6 0 6 1 3 3 5 2 1 0 1 9 2 8 0 2 6 6 3
8 6 9 9 8 0 8 1 8 2 6 6 8 4 0 7 8 2 5 1
3 1 6 1 0 5 7 5 7 0 6 3 0 4 1 4 0 3 0 8
Estadística para comunicadores 223

Tabla de la distribución normal estándar

Área bajo la curva normal P(Z < z) = 

Z -0.09 -0.08 -0.07 -0.06 -0.05 -0.04 -0.03 -0.02 -0.01 -0.00
-3.9 0.000033 0.000034 0.000036 0.000037 0.000039 0.000041 0.000042 0.000044 0.000046 0.000048
-3.8 0.000050 0.000052 0.000054 0.000057 0.000059 0.000062 0.000064 0.000067 0.000069 0.000072
-3.7 0.000075 0.000078 0.000082 0.000085 0.000088 0.000092 0.000096 0.000100 0.000104 0.000108
-3.6 0.000112 0.000117 0.000121 0.000126 0.000131 0.000136 0.000142 0.000147 0.000153 0.000159
-3.5 0.000165 0.000172 0.000178 0.000185 0.000193 0.000200 0.000208 0.000216 0.000224 0.000233
-3.4 0.000242 0.000251 0.000260 0.000270 0.000280 0.000291 0.000302 0.000313 0.000325 0.000337
-3.3 0.000349 0.000362 0.000376 0.000390 0.000404 0.000419 0.000434 0.000450 0.000466 0.000483
-3.2 0.000501 0.000519 0.000538 0.000557 0.000577 0.000598 0.000619 0.000641 0.000664 0.000687
-3.1 0.000711 0.000736 0.000762 0.000789 0.000816 0.000845 0.000874 0.000904 0.000935 0.000968
-3.0 0.001001 0.001035 0.001070 0.001107 0.001144 0.001183 0.001223 0.001264 0.001306 0.001350
                     
-2.9 0.00139 0.00144 0.00149 0.00154 0.00159 0.00164 0.00169 0.00175 0.00181 0.00187
-2.8 0.00193 0.00199 0.00205 0.00212 0.00219 0.00226 0.00233 0.00240 0.00248 0.00256
-2.7 0.00264 0.00272 0.00280 0.00289 0.00298 0.00307 0.00317 0.00326 0.00336 0.00347
-2.6 0.00357 0.00368 0.00379 0.00391 0.00402 0.00415 0.00427 0.00440 0.00453 0.00466
-2.5 0.00480 0.00494 0.00508 0.00523 0.00539 0.00554 0.00570 0.00587 0.00604 0.00621
-2.4 0.00639 0.00657 0.00676 0.00695 0.00714 0.00734 0.00755 0.00776 0.00798 0.00820
-2.3 0.00842 0.00866 0.00889 0.00914 0.00939 0.00964 0.00990 0.01017 0.01044 0.01072
-2.2 0.01101 0.01130 0.01160 0.01191 0.01222 0.01255 0.01287 0.01321 0.01355 0.01390
-2.1 0.01426 0.01463 0.01500 0.01539 0.01578 0.01618 0.01659 0.01700 0.01743 0.01786
-2.0 0.01831 0.01876 0.01923 0.01970 0.02018 0.02068 0.02118 0.02169 0.02222 0.02275
                     
-1.9 0.02330 0.02385 0.02442 0.02500 0.02559 0.02619 0.02680 0.02743 0.02807 0.02872
-1.8 0.02938 0.03005 0.03074 0.03144 0.03216 0.03288 0.03362 0.03438 0.03515 0.03593
-1.7 0.03673 0.03754 0.03836 0.03920 0.04006 0.04093 0.04182 0.04272 0.04363 0.04457
-1.6 0.04551 0.04648 0.04746 0.04846 0.04947 0.05050 0.05155 0.05262 0.05370 0.05480
-1.5 0.05592 0.05705 0.05821 0.05938 0.06057 0.06178 0.06301 0.06426 0.06552 0.06681
-1.4 0.06811 0.06944 0.07078 0.07215 0.07353 0.07493 0.07636 0.07780 0.07927 0.08076
-1.3 0.08226 0.08379 0.08534 0.08691 0.08851 0.09012 0.09176 0.09342 0.09510 0.09680
-1.2 0.09853 0.10027 0.10204 0.10383 0.10565 0.10749 0.10935 0.11123 0.11314 0.11507
-1.1 0.11702 0.11900 0.12100 0.12302 0.12507 0.12714 0.12924 0.13136 0.13350 0.13567
-1.0 0.13786 0.14007 0.14231 0.14457 0.14686 0.14917 0.15151 0.15386 0.15625 0.15866
                     
-0.9 0.16109 0.16354 0.16602 0.16853 0.17106 0.17361 0.17619 0.17879 0.18141 0.18406
-0.8 0.18673 0.18943 0.19215 0.19489 0.19766 0.20045 0.20327 0.20611 0.20897 0.21186
-0.7 0.21476 0.21770 0.22065 0.22363 0.22663 0.22965 0.23270 0.23576 0.23885 0.24196
-0.6 0.24510 0.24825 0.25143 0.25463 0.25785 0.26109 0.26435 0.26763 0.27093 0.27425
-0.5 0.27760 0.28096 0.28434 0.28774 0.29116 0.29460 0.29806 0.30153 0.30503 0.30854
-0.4 0.31207 0.31561 0.31918 0.32276 0.32636 0.32997 0.33360 0.33724 0.34090 0.34458
-0.3 0.34827 0.35197 0.35569 0.35942 0.36317 0.36693 0.37070 0.37448 0.37828 0.38209
-0.2 0.38591 0.38974 0.39358 0.39743 0.40129 0.40517 0.40905 0.41294 0.41683 0.42074
-0.1 0.42465 0.42858 0.43251 0.43644 0.44038 0.44433 0.44828 0.45224 0.45620 0.46017
-0.0 0.46414 0.46812 0.47210 0.47608 0.48006 0.48405 0.48803 0.49202 0.49601 0.50000
Estadística para comunicadores 224

Tabla de la distribución normal estándar

Área bajo la curva normal P(Z < z) = 

Z 0.00 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09
0.0 0.50000 0.50399 0.50798 0.51197 0.51595 0.51994 0.52392 0.52790 0.53188 0.53586
0.1 0.53983 0.54380 0.54776 0.55172 0.55567 0.55962 0.56356 0.56749 0.57142 0.57535
0.2 0.57926 0.58317 0.58706 0.59095 0.59483 0.59871 0.60257 0.60642 0.61026 0.61409
0.3 0.61791 0.62172 0.62552 0.62930 0.63307 0.63683 0.64058 0.64431 0.64803 0.65173
0.4 0.65542 0.65910 0.66276 0.66640 0.67003 0.67364 0.67724 0.68082 0.68439 0.68793
0.5 0.69146 0.69497 0.69847 0.70194 0.70540 0.70884 0.71226 0.71566 0.71904 0.72240
0.6 0.72575 0.72907 0.73237 0.73565 0.73891 0.74215 0.74537 0.74857 0.75175 0.75490
0.7 0.75804 0.76115 0.76424 0.76730 0.77035 0.77337 0.77637 0.77935 0.78230 0.78524
0.8 0.78814 0.79103 0.79389 0.79673 0.79955 0.80234 0.80511 0.80785 0.81057 0.81327
0.9 0.81594 0.81859 0.82121 0.82381 0.82639 0.82894 0.83147 0.83398 0.83646 0.83891
                     
1.0 0.84134 0.84375 0.84614 0.84849 0.85083 0.85314 0.85543 0.85769 0.85993 0.86214
1.1 0.86433 0.86650 0.86864 0.87076 0.87286 0.87493 0.87698 0.87900 0.88100 0.88298
1.2 0.88493 0.88686 0.88877 0.89065 0.89251 0.89435 0.89617 0.89796 0.89973 0.90147
1.3 0.90320 0.90490 0.90658 0.90824 0.90988 0.91149 0.91309 0.91466 0.91621 0.91774
1.4 0.91924 0.92073 0.92220 0.92364 0.92507 0.92647 0.92785 0.92922 0.93056 0.93189
1.5 0.93319 0.93448 0.93574 0.93699 0.93822 0.93943 0.94062 0.94179 0.94295 0.94408
1.6 0.94520 0.94630 0.94738 0.94845 0.94950 0.95053 0.95154 0.95254 0.95352 0.95449
1.7 0.95543 0.95637 0.95728 0.95818 0.95907 0.95994 0.96080 0.96164 0.96246 0.96327
1.8 0.96407 0.96485 0.96562 0.96638 0.96712 0.96784 0.96856 0.96926 0.96995 0.97062
1.9 0.97128 0.97193 0.97257 0.97320 0.97381 0.97441 0.97500 0.97558 0.97615 0.97670
                     
2.0 0.97725 0.97778 0.97831 0.97882 0.97932 0.97982 0.98030 0.98077 0.98124 0.98169
2.1 0.98214 0.98257 0.98300 0.98341 0.98382 0.98422 0.98461 0.98500 0.98537 0.98574
2.2 0.98610 0.98645 0.98679 0.98713 0.98745 0.98778 0.98809 0.98840 0.98870 0.98899
2.3 0.98928 0.98956 0.98983 0.99010 0.99036 0.99061 0.99086 0.99111 0.99134 0.99158
2.4 0.99180 0.99202 0.99224 0.99245 0.99266 0.99286 0.99305 0.99324 0.99343 0.99361
2.5 0.99379 0.99396 0.99413 0.99430 0.99446 0.99461 0.99477 0.99492 0.99506 0.99520
2.6 0.99534 0.99547 0.99560 0.99573 0.99585 0.99598 0.99609 0.99621 0.99632 0.99643
2.7 0.99653 0.99664 0.99674 0.99683 0.99693 0.99702 0.99711 0.99720 0.99728 0.99736
2.8 0.99744 0.99752 0.99760 0.99767 0.99774 0.99781 0.99788 0.99795 0.99801 0.99807
2.9 0.99813 0.99819 0.99825 0.99831 0.99836 0.99841 0.99846 0.99851 0.99856 0.99861
                     
3.0 0.998650 0.998694 0.998736 0.998777 0.998817 0.998856 0.998893 0.998930 0.998965 0.998999
3.1 0.999032 0.999065 0.999096 0.999126 0.999155 0.999184 0.999211 0.999238 0.999264 0.999289
3.2 0.999313 0.999336 0.999359 0.999381 0.999402 0.999423 0.999443 0.999462 0.999481 0.999499
3.3 0.999517 0.999534 0.999550 0.999566 0.999581 0.999596 0.999610 0.999624 0.999638 0.999651
3.4 0.999663 0.999675 0.999687 0.999698 0.999709 0.999720 0.999730 0.999740 0.999749 0.999758
3.5 0.999767 0.999776 0.999784 0.999792 0.999800 0.999807 0.999815 0.999822 0.999828 0.999835
3.6 0.999841 0.999847 0.999853 0.999858 0.999864 0.999869 0.999874 0.999879 0.999883 0.999888
3.7 0.999892 0.999896 0.999900 0.999904 0.999908 0.999912 0.999915 0.999918 0.999922 0.999925
3.8 0.999928 0.999931 0.999933 0.999936 0.999938 0.999941 0.999943 0.999946 0.999948 0.999950
3.9 0.999952 0.999954 0.999956 0.999958 0.999959 0.999961 0.999963 0.999964 0.999966 0.999967
Estadística para comunicadores 225

Tabla de la distribucion t - Student

Área bajo la curva P(T > c) = 


 0.4 0.3 0.2 0.15 0.1 0.05 0.04 0.03 0.025 0.02 0.015 0.01 0.005 
0.3249 0.7265 1.3763 1.9626 3.0776 6.3137 7.9158 10.5788 12.706 15.8945 21.2049 31.8205 63.6567
1 2 4 8 1 8 5 2 9 2 4 5 2 4 1
0.2886 0.6172 1.0606 1.3862 1.8856 2.9199 3.3197 4.3026
2 8 1 6 1 2 9 6 3.89643 5 4.84873 5.64278 6.96456 9.92484 2
0.2766 0.5843 0.9784 1.2497 1.6377 2.3533 2.6054 3.1824
3 7 9 7 8 4 6 3 2.95051 5 3.48191 3.89605 4.5407 5.84091 3
0.2707 0.5686 0.9409 1.1895 1.5332 2.1318 2.3328 2.7764
4 2 5 6 7 1 5 7 2.60076 5 2.99853 3.29763 3.74695 4.60409 4
0.2671 0.5594 0.9195 1.1557 1.4758 2.0150 2.1909 2.5705
5 8 3 4 7 8 5 6 2.42158 8 2.75651 3.00287 3.36493 4.03214 5
0.2648 0.5533 1.1341 1.4397 1.9431 2.1043 2.4469
6 3 8 0.9057 6 6 8 1 2.31326 1 2.61224 2.82893 3.14267 3.70743 6
0.2631 0.5491 0.8960 1.1191 1.4149 1.8945 2.0460 2.3646
7 7 1 3 6 2 8 1 2.24088 2 2.51675 2.71457 2.99795 3.49948 7
0.2619 0.5459 0.8888 1.1081 1.3968 1.8595 2.0041
8 2 3 9 5 2 5 5 2.18915 2.306 2.44898 2.63381 2.89646 3.35539 8
0.2609 0.5434 1.0997 1.3830 1.8331 1.9726 2.2621
9 6 8 0.8834 2 3 1 5 2.15038 6 2.39844 2.5738 2.82144 3.24984 9
1 0.2601 0.5415 0.8790 1.0930 1.3721 1.8124 2.2281 1
0 8 3 6 6 8 6 1.9481 2.12023 4 2.35931 2.52748 2.76377 3.16927 0
   
1 0.2595 0.5399 0.8755 1.0876 1.3634 1.7958 1.9284 2.2009 1
1 6 4 3 7 3 8 3 2.09614 9 2.32814 2.49066 2.71808 3.10581 1
1 0.2590 0.5386 0.8726 1.0832 1.3562 1.7822 1.9123 2.1788 1
2 3 2 1 1 2 9 1 2.07644 1 2.30272 2.4607 2.681 3.05454 2
1 0.2585 0.8701 1.0794 1.3501 1.7709 1.8988 2.1603 1
3 9 0.5375 5 7 7 3 7 2.06004 7 2.2816 2.43585 2.65031 3.01228 3
1 0.2582 0.5365 0.8680 1.0762 1.3450 1.7613 2.1447 1
4 1 5 5 8 3 1 1.8875 2.04617 9 2.26378 2.4149 2.62449 2.97684 4
1 0.2578 0.5357 0.8662 1.0735 1.3406 1.7530 1.8777 2.1314 1
5 9 3 4 3 1 5 4 2.03429 5 2.24854 2.39701 2.60248 2.94671 5
1 0.5350 0.8646 1.0711 1.3367 1.7458 1.8692 2.1199 1
6 0.2576 1 7 4 6 8 8 2.02400 1 2.23536 2.38155 2.58349 2.92078 6
1 0.2573 0.5343 0.8632 1.0690 1.3333 1.7396 1.8618 2.1098 1
7 5 8 8 3 8 1 7 2.01500 2 2.22385 2.36805 2.56693 2.89823 7
1 0.2571 0.5338 0.8620 1.0671 1.3303 1.7340 1.8553 2.1009 1
8 2 2 5 7 9 6 4 2.00707 2 2.2137 2.35618 2.55238 2.87844 8
1 0.2569 0.5333 0.8609 1.0655 1.3277 1.7291 1.8495 2.0930 1
9 2 1 5 1 3 3 3 2.00002 2 2.2047 2.34565 2.53948 2.86093 9
2 0.2567 0.5328 0.8599 1.0640 1.3253 1.7247 1.8443 2.0859 2
0 4 6 6 2 4 2 3 1.99371 6 2.19666 2.33624 2.52798 2.84534 0
   
2 0.2565 0.5324 0.8590 1.0626 1.3231 1.7207 1.8396 2.0796 2
1 8 6 7 7 9 4 5 1.98804 1 2.18943 2.32779 2.51765 2.83136 1
2 0.2564 0.5320 0.8582 1.0614 1.3212 1.7171 1.8354 2.0738 2
2 3 8 7 5 4 4 2 1.98291 7 2.18289 2.32016 2.50832 2.81876 2
2 0.5317 0.8575 1.0603 1.3194 1.7138 1.8315 2.0686 2
3 0.2563 5 3 4 6 7 7 1.97825 6 2.17696 2.31323 2.49987 2.80734 3
Estadística para comunicadores 226
2 0.2561 0.5314 0.8568 1.0593 1.3178 1.7108 1.8280 2
4 7 4 6 2 4 8 5 1.97399 2.0639 2.17154 2.30691 2.49216 2.79694 4
2 0.2560 0.5311 0.8562 1.0583 1.3163 1.7081 1.8248 2.0595 2
5 6 5 4 8 5 4 3 1.97010 4 2.16659 2.30113 2.48511 2.78744 5
2 0.2559 0.5308 0.8556 1.0575 1.3149 1.7056 1.8218 2.0555 2
6 5 9 7 2 7 2 6 1.96651 3 2.16203 2.29581 2.47863 2.77871 6
2 0.2558 0.5306 0.8551 1.0567 1.3137 1.7032 1.8191 2.0518 2
7 6 5 4 3 0 9 3 1.96320 3 2.15782 2.29091 2.47266 2.77068 7
2 0.2557 0.5304 0.8546 1.0559 1.3125 1.7011 1.8165 2.0484 2
8 7 2 5 9 3 3 9 1.96014 1 2.15393 2.28638 2.46714 2.76326 8
2 0.2556 0.5302 0.8541 1.3114 1.6991 1.8142 2.0452 2
9 8 1 9 1.0553 3 3 4 1.95729 3 2.15033 2.28217 2.46202 2.75639 9
3 0.2556 0.5300 0.8537 1.0546 1.3104 1.6972 1.8120 2.0422 3
0 1 2 7 6 2 6 5 1.95465 7 2.14697 2.27826 2.45726 2.75000 0
   
3 0.2555 0.5298 0.8533 1.0540 1.3094 1.6955 1.8100 2.0395 3
1 3 4 7 6 6 2 0 1.95218 1 2.14383 2.27461 2.45282 2.74404 1
3 0.2554 0.5296 0.8530 1.3085 1.6938 1.8080 2.0369 3
2 6 7 0 1.0535 7 9 9 1.94987 3 2.1409 2.2712 2.44868 2.73848 2
3 0.5295 0.8526 1.0529 1.3077 1.6923 1.8062 2.0345 3
3 0.2554 0 5 8 4 6 9 1.9477 2 2.13816 2.26801 2.44479 2.73328 3
3 0.2553 0.5293 0.8523 1.0524 1.3069 1.6909 1.8046 2.0322 3
4 4 5 2 8 5 2 1 1.94567 4 2.13558 2.26501 2.44115 2.72839 4
3 0.2552 0.5292 0.8520 1.0520 1.3062 1.6895 1.8030 2.0301 3
5 8 1 1 2 1 7 2 1.94375 1 2.13316 2.26219 2.43772 2.72381 5
3 0.2552 0.5290 0.8517 1.0515 1.3055 1.8015 2.0280 3
6 3 8 2 8 1 1.6883 3 1.94195 9 2.13087 2.25953 2.43449 2.71948 6
3 0.2551 0.5289 0.8514 1.0511 1.3048 1.6870 1.8001 2.0261 3
7 8 5 4 7 5 9 2 1.94024 9 2.12871 2.25702 2.43145 2.71541 7
3 0.2551 0.5288 0.8511 1.0507 1.3042 1.6859 1.7987 2.0243 3
8 3 3 8 7 3 5 8 1.93863 9 2.12667 2.25465 2.42857 2.71156 8
3 0.2550 0.5287 0.8509 1.3036 1.6848 1.7975 2.0226 3
9 8 1 4 1.0504 4 8 1 1.93711 9 2.12474 2.2524 2.42584 2.70791 9
4 0.2550 0.5286 0.8507 1.0500 1.3030 1.6838 1.7963 2.0210 4
0 4 1 0 5 8 5 1 1.93566 8 2.12291 2.25027 2.42326 2.70446 0
Estadística para comunicadores 227

Tabla de la distribución t - Student

Área bajo la curva P(T > c) = 


 0.4 0.3 0.2 0.15 0.1 0.05 0.04 0.03 0.025 0.02 0.015 0.01 0.005 
0.255 0.528 0.850 1.049 1.302 1.682 1.795 1.934 2.019 2.121 2.248 2.420 2.701
41 00 50 48 71 54 88 17 28 54 17 25 8 18 41
0.254 0.528 0.850 1.049 1.302 1.681 1.794 1.932 2.018 2.119 2.246 2.418 2.698
42 96 40 26 39 04 95 09 98 08 52 33 47 07 42
0.254 0.528 0.850 1.049 1.301 1.681 1.793 1.931 2.016 2.117 2.244 2.416 2.695
43 92 31 06 08 55 07 05 73 69 94 49 25 10 43
0.254 0.528 0.849 1.048 1.301 1.680 1.792 1.930 2.015 2.116 2.242 2.414 2.692
44 88 22 87 79 09 23 07 54 37 44 75 13 28 44
0.254 0.528 0.849 1.048 1.300 1.679 1.791 1.929 2.014 2.115 2.241 2.412 2.689
45 85 14 68 52 65 43 13 41 10 00 08 12 59 45
0.254 0.528 0.849 1.048 1.300 1.678 1.790 1.928 2.012 2.113 2.239 2.410 2.687
46 82 05 51 25 23 66 23 33 90 64 49 19 01 46
0.254 0.527 0.849 1.048 1.299 1.677 1.789 1.927 2.011 2.112 2.237 2.408 2.684
47 79 98 34 00 82 93 37 29 74 33 97 35 56 47
0.254 0.527 0.849 1.047 1.299 1.677 1.788 1.926 2.010 2.111 2.236 2.406 2.682
48 76 90 17 75 44 22 55 30 63 07 52 58 20 48
0.254 0.527 0.849 1.047 1.299 1.676 1.787 1.925 2.009 2.109 2.235 2.404 2.679
49 73 83 02 52 07 55 76 35 58 87 12 89 95 49
0.254 0.527 0.848 1.047 1.298 1.675 1.787 1.924 2.008 2.108 2.233 2.403 2.677
50 70 76 87 29 71 91 00 44 56 72 79 27 79 50
     
0.254 0.527 0.848 1.047 1.298 1.675 1.786 1.923 2.007 2.107 2.232 2.401 2.675
51 67 69 73 08 37 28 27 56 58 62 5 72 72 51
0.254 0.527 0.848 1.046 1.298 1.674 1.785 1.922 2.006 2.106 2.231 2.400 2.673
52 65 63 59 87 05 69 58 72 65 55 27 22 73 52
0.254 0.527 0.848 1.046 1.297 1.674 1.784 1.921 2.005 2.105 2.230 2.398 2.671
53 62 57 46 67 73 12 91 91 75 53 09 79 82 53
0.254 0.527 0.848 1.046 1.297 1.673 1.784 1.921 2.004 2.104 2.228 2.397 2.669
54 60 51 33 48 43 56 26 14 88 55 95 41 98 54
0.254 0.527 0.848 1.046 1.297 1.673 1.783 1.920 2.004 2.103 2.227 2.396 2.668
55 58 45 21 30 13 03 64 39 04 61 85 08 22 55
0.254 0.527 0.848 1.046 1.296 1.672 1.783 1.919 2.003 2.102 2.226 2.394 2.666
56 55 40 09 12 85 52 04 67 24 70 79 80 51 56
0.254 0.527 0.847 1.045 1.296 1.672 1.782 1.918 2.002 2.101 2.225 2.393 2.664
57 53 35 97 95 58 03 46 97 47 82 77 57 87 57
0.254 0.527 0.847 1.045 1.296 1.671 1.781 1.918 2.001 2.100 2.224 2.392 2.663
58 51 30 86 78 32 55 90 30 72 97 79 38 29 58
0.254 0.527 0.847 1.045 1.296 1.671 1.781 1.917 2.001 2.100 2.223 2.391 2.661
59 49 25 76 62 07 09 37 65 00 15 84 23 76 59
0.254 0.527 0.847 1.045 1.295 1.670 1.780 1.917 2.000 2.099 2.222 2.390 2.660
60 47 20 65 47 82 65 85 03 3 36 92 12 28 60
     
0.254 0.527 0.847 1.045 1.295 1.670 1.780 1.916 1.999 2.098 2.222 2.389 2.658
61 45 15 55 32 58 22 34 42 62 6 04 05 86 61
0.254 0.527 0.847 1.045 1.295 1.669 1.779 1.915 1.998 2.097 2.221 2.388 2.657
62 44 11 46 18 36 80 86 84 97 86 18 01 48 62
0.254 0.527 0.847 1.045 1.295 1.669 1.779 1.915 1.998 2.097 2.220 2.387 2.656
63 42 06 36 04 13 40 39 27 34 15 35 01 15 63
0.254 0.527 0.847 1.044 1.294 1.669 1.778 1.914 1.997 2.096 2.219 2.386 2.654
64 40 02 27 90 92 01 93 72 73 45 55 04 85 64
0.254 0.526 0.847 1.044 1.294 1.668 1.778 1.914 1.997 2.095 2.218 2.385 2.653
65 39 98 19 77 71 64 49 19 14 78 77 10 60 65
66 0.254 0.526 0.847 1.044 1.294 1.668 1.778 1.913 1.996 2.095 2.218 2.384 2.652 66
Estadística para comunicadores 228
37 94 10 64 51 27 06 68 56 14 02 19 39
0.254 0.526 0.847 1.044 1.294 1.667 1.777 1.913 1.996 2.094 2.217 2.383 2.651
67 36 90 02 52 32 92 65 18 01 51 29 30 22 67
0.254 0.526 0.846 1.044 1.294 1.667 1.777 1.912 1.995 2.093 2.216 2.382 2.650
68 34 87 94 40 13 57 24 69 47 90 58 45 08 68
0.254 0.526 0.846 1.044 1.293 1.667 1.776 1.912 1.994 2.093 2.215 2.381 2.648
69 33 83 86 28 94 24 85 22 95 30 89 61 98 69
0.254 0.526 0.846 1.044 1.293 1.666 1.776 1.911 1.994 2.092 2.215 2.380 2.647
70 31 80 79 17 76 91 47 77 44 73 23 81 90 70
     
0.254 0.526 0.846 1.043 1.292 1.665 1.774 1.909 1.992 2.090 2.212 2.377 2.642
75 25 64 44 65 94 43 73 67 10 08 16 1 98 75
0.254 0.526 0.846 1.043 1.292 1.664 1.773 1.907 1.990 2.087 2.209 2.373 2.638
80 19 50 14 20 22 12 21 84 06 78 49 87 69 80
0.254 0.526 0.845 1.042 1.291 1.662 1.771 1.906 1.988 2.085 2.207 2.371 2.634
85 14 37 87 80 59 98 87 23 27 74 13 02 91 85
0.254 0.526 0.845 1.042 1.291 1.661 1.770 1.904 1.986 2.083 2.205 2.368 2.631
90 10 26 63 44 03 96 68 80 67 94 04 50 57 90
0.254 0.526 0.845 1.042 1.290 1.661 1.769 1.903 1.985 2.082 2.203 2.366 2.628
95 06 16 42 12 53 05 61 52 25 33 17 24 58 95
10 0.254 0.526 0.845 1.041 1.290 1.660 1.768 1.902 1.983 2.080 2.201 2.364 2.625 10
0 02 08 23 84 07 23 66 37 97 88 50 22 89 0
10 0.253 0.526 0.845 1.041 1.289 1.659 1.767 1.901 1.982 2.079 2.199 2.362 2.623 10
5 99 00 06 58 67 50 79 33 82 58 98 39 47 5
11 0.253 0.525 0.844 1.041 1.289 1.658 1.767 1.900 1.981 2.078 2.198 2.360 2.621 11
0 96 92 90 34 30 82 01 39 77 39 61 73 26 0
12 0.253 0.525 0.844 1.040 1.288 1.657 1.765 1.898 1.979 2.076 2.196 2.357 2.617 12
0 91 80 63 93 65 65 64 74 93 31 20 82 42 0
0.253 0.524 0.841 1.036 1.281 1.644 1.750 1.880 1.959 2.053 2.170 2.326 2.575
∞ 35 40 62 43 56 84 69 79 97 75 09 35 83 ∞

Índice

A G
Axiomas de la probabilidad, 89 Gráfico
circular, 34
de barras, 35
C de barras apiladas al 100%, 81
Censo, 14, 125 de bastones, 36
Coeficiente de variación, 67 histograma, 37
Correlación, 201
M
D Media, 41
Distribución de frecuencias Mediana, 44
variable cualitativa, 32 Medidas de asimetría, 51
Distribución normal, 104 Medidas de posición: Cuantiles, 55
Distribución t-Student, 176 Medidas de resumen, 40
Medidas de tendencia central, 41
Medidas de variabilidad o dispersión, 63
E Moda, 48
Escalas de medición, 20 Muestra, 9
Estadístico, 25 Muestreo, 14, 125
Eventos aleatorio simple, 147
mutuamente excluyentes, 89 estratificado, 154
probabilístico, 143
sistemático, 165
F
Ficha técnica, 144
Estadística para comunicadores 229

N de una variable aleatoria, 104


Registro administrativo, 15
Nivel de significancia, 178 Regresión, 201
Coeficiente de correlación, 207
Coeficiente de determinación, 207
O coeficientes de regresión, 203
Observación, 9 diagrama de dispersión, 202
ecuación de la recta estimada, 203
Supuestos, 206
P Validación, 205
Parámetro, 25
Población, 9 T
Probabilidad
Definición clásica de, 89 Tabulaciones cruzadas, 73
Teoremas básicos de, 89 Tamaño de muestra
Prueba de hipótesis, 177 media de una población, 127, 128, 129
media poblacional, 179 proporción poblacional, 128
proporción poblacional, 188
Tipos de errores, 177 V
Variable, 16
R Variable aleatoria
Rango, 64 definición, 104

También podría gustarte