Distribución de Frecuencias

Descargar como docx, pdf o txt
Descargar como docx, pdf o txt
Está en la página 1de 11

INVESTIGACIÓN

INVESTIGACIÓN CUANTITATIVA DE MERCADOS

17 DE FEBRERO DE 2019
SOLÍS FLORES ANA LAURA

0
Contenido
Distribución de Frecuencias............................................................................................................ 2
Representación tabular ................................................................................................................... 2
Representación gráfica y los diferentes tipos que existen ......................................................... 3
Medidas de tendencia central......................................................................................................... 3
Medidas de dispersión ..................................................................................................................... 4
Medidas de Posición ........................................................................................................................ 5
Pruebas de hipótesis ....................................................................................................................... 6
Formular las hipótesis ...................................................................................................................... 6
Elegir una prueba adecuada........................................................................................................... 6
Seleccionar a nivel de significancia ............................................................................................... 7
Reunir los datos y calcular el estadístico de prueba................................................................... 7
Determinar la probabilidad (valor crítico) ...................................................................................... 7
Coeficiente de regresión ................................................................................................................. 8
Estadística inferencial ...................................................................................................................... 9
Prueba T sobre el coeficiente de regresión.................................................................................. 9
Bibliografía ....................................................................................................................................... 10

1
Distribución de Frecuencias
En la distribución de frecuencias se considera una variable a la vez. El objetivo es
obtener un conteo del número de respuestas asociadas con distintos valores de la
variable. La ocurrencia relativa o frecuencia de los diferentes valores de la variable
se expresa en porcentajes. Una distribución de frecuencias de una variable produce
una tabla de conteo de frecuencias, porcentajes y porcentajes acumulativos de
todos los valores asociados con esa variable.
A menudo los investigadores de mercado necesitan responder preguntas sobre una
sola variable. Por ejemplo:
 ¿Cuántos usuarios de la marca pueden considerarse leales a ésta?
 ¿Qué porcentaje del mercado consiste en usuarios frecuentes, usuarios
medios, usuarios esporádicos y no usuarios?
 ¿Cuántos clientes están muy familiarizados con la oferta de un nuevo
producto? ¿Cuántos están familiarizados, un poco familiarizados y no
familiarizados con la marca? ¿Cuál es la puntuación promedio de
familiaridad? ¿Hay mucha varianza en el grado de familiarización de los
clientes con el nuevo producto?
 ¿Cuál es la distribución del ingreso en los usuarios de la marca? ¿La
distribución está sesgada hacia el grupo de bajo ingreso?
Para darle respuestas a esas preguntas es necesario utilizar la distribución de
frecuencias.
Una distribución de frecuencias ayuda a determinar la magnitud de la falta de
respuesta a los reactivos. Además, indica la magnitud de respuestas ilegítimas.

Representación tabular
Aunque las respuestas a preguntas relacionadas con una sola variable son
interesantes, a menudo suscitan otras preguntas sobre la relación entre esa variable
y otras. Al introducir la distribución de frecuencias planteamos varias preguntas de
investigación de mercados. Por cada una de ellas, el investigador podría plantear
preguntas adicionales que relacionen estas variables con otras. Por ejemplo:
 ¿Cuántos usuarios leales a la marca son hombres?
 ¿El uso del producto (medido en términos de usuarios frecuentes, usuarios
intermedios, usuarios esporádicos y no usuarios) se relaciona con el interés
en actividades al aire libre (alto, medio y bajo)?
 ¿La familiaridad con un producto nuevo está relacionada con la edad y el
nivel académico?
 ¿La propiedad de un producto está relacionada con el ingreso (alto, medio y
bajo)?

2
Las respuestas a estas preguntas se obtienen estudiando las tabulaciones
cruzadas. Mientras que una distribución de frecuencias describe una variable a la
vez, una tabulación cruzada describe dos o más variables de forma simultánea.
Una tabulación cruzada es la combinación de la distribución de frecuencias de dos
o más variables en una sola tabla, y nos ayuda a entender la manera en que una
variable, como la lealtad hacia la marca, se relaciona con otra variable, como el
sexo. La tabulación cruzada produce tablas que reflejan la distribución conjunta de
dos o más variables con un número limitado de categorías o valores distintos. Las
categorías de una variable se cruzan con las categorías de otra u otras variables.
Así, la distribución de frecuencias de una variable se subdivide de acuerdo con los
valores o las categorías de las otras variables.

Representación gráfica y los diferentes tipos que existen


Los datos de frecuencia se emplean para construir un histograma, que es una
gráfica de barras vertical donde los valores de la variable se muestran a lo largo del
eje X, y las frecuencias absolutas o relativa de los valores se colocan a lo largo del
eje Y. En el histograma podemos examinar si la distribución observada es
consistente con una distribución esperada o supuesta, como la distribución normal.

Ejemplo de histograma.

Medidas de tendencia central


Se llaman medidas de tendencia central porque tienden a describir el centro de la
distribución. Si se modifica toda la muestra al añadir una constante fija a cada
observación, entonces, la media, la moda y la mediana cambian en la misma
cantidad fija
1. Media: La media, o valor promedio, es la medida de tendencia central más
utilizada. Sirve para estimar el promedio cuando los datos se recolectaron
utilizando una escala de intervalo o de razón. Los datos deberían mostrar

3
cierta tendencia central, ya que la mayoría de las respuestas se distribuyen
alrededor de la media. La media, X, está dada por

Si no hay valores extremos, la media es una medida robusta y no cambia


significativamente al agregar o al eliminar datos.
2. La moda: es el valor que ocurre con mayor frecuencia y representa el pico
más alto de la distribución. La moda es una buena medida de localización
cuando la variable es categórica o se ha agrupado en categorías.

3. La mediana: de una muestra es el valor intermedio cuando los datos están


acomodados en orden ascendente o descendente. Cuando el número de
datos es par, la mediana se calcula como el punto medio entre los dos valores
intermedios.

Medidas de dispersión
Las medidas de dispersión, que se calculan con datos de intervalo o de razón,
incluyen el rango, el rango intercuartílico, la varianza o la desviación estándar y el
coeficiente de variación.
1. Rango: El rango mide la dispersión de los datos, y se define simplemente
como la diferencia entre el valor más grande y el valor más pequeño en la
muestra. Debido a esto, el rango se ve directamente afectado por los valores
extremos.

2. Rango intercuartílico: El rango intercuartílico es la diferencia entre el percentil


75 y el percentil 25. Para un conjunto de datos presentados en orden de
magnitud, el percentil pésimo es el valor que deja por debajo al porcentaje p
de los datos y al porcentaje (100 - p) por arriba de él. Si todos los datos se
multiplican por una constante, el rango intercuartílico se multiplica por la
misma constante.

4
3. Varianza y desviación estándar: La diferencia entre la media y un valor
observado se conoce como la desviación a partir de la media. La varianza es
la desviación promedio al cuadrado a partir de la media. La varianza nunca
puede ser negativa. Cuando los datos se agrupan alrededor de la media, la
varianza es pequeña. Cuando los datos están dispersos, la varianza es
grande. Si todos los datos se multiplican por una constante, la varianza se
multiplica por el cuadrado de la constante. La desviación estándar es la raíz
cuadrada de la varianza. Así, la desviación estándar se expresa en las
mismas unidades que los datos, y no en unidades al cuadrado. La desviación
estándar de una muestra, s, se calcula por medio de:

4. Coeficiente de variación. El coeficiente de variación es el cociente de la


desviación estándar con respecto a la media, expresado en porcentaje, y es
una medida de variación relativa sin unidades. El coeficiente de variación,
CV, se expresa como:

El coeficiente de variación sólo tiene un significado si la variable se mide en una


escala de razón, y permanece sin cambios cuando todos los datos se multiplican
por una constante.

Medidas de Posición
las medidas de posición nos dice que dividen un conjunto de valores, de números,
en grupos con el mismo número de individuos.

1. Cuartiles: son los tres valores de la variable que dividen a un conjunto de


datos ordenados en cuatro partes iguales.
2. Deciles: son los nueve valores que dividen la serie de datos en diez partes
iguales.

5
3. Percentiles: son los 99 valores que dividen la serie de datos en 100 partes
iguales.

Pruebas de hipótesis
Un análisis básico siempre implica alguna prueba de hipótesis. Existen muchos
ejemplos de hipótesis generadas en la investigación de mercados. La prueba de
hipótesis incluye los siguientes pasos:
1. Formular la hipótesis nula H0 y la hipótesis alternativa H1.
2. Elegir una técnica estadística adecuada y su estadístico de prueba
correspondiente.
3. Seleccionar el nivel de significancia.
4. Determinar el tamaño de la muestra y reunir los datos. Calcular el valor del
estadístico de prueba.
5. Determinar la probabilidad asociada con el estadístico de prueba con
respecto a la hipótesis nula, utilizando la distribución de la muestra del
estadístico de prueba. Como alternativa, determinar los valores críticos
asociados con el estadístico de prueba, que dividen las regiones de rechazo
y no rechazo.
6. Comparar la probabilidad asociada con el estadístico de prueba, al nivel de
significancia especificado. Como alternativa, determinar si el estadístico de
prueba cae en la región de rechazo o de no rechazo.
7. Tomar la decisión estadística de rechazar o no rechazar la hipótesis nula.
8. Expresar la decisión estadística en términos del problema de investigación
de mercados.

Formular las hipótesis


El primer paso consiste en formular la hipótesis nula y la hipótesis alternativa. Una
hipótesis nula es un enunciado sobre el status quo sin diferencia o con ningún
efecto. Si la hipótesis nula no se rechaza, entonces no se realizan cambios. En una
hipótesis alternativa se plantea la expectativa de cierta diferencia o efecto. La
aceptación de la hipótesis alternativa llevará a cambios en las opiniones o acciones.
De esta manera, la hipótesis alternativa es opuesta a la hipótesis nula.

Elegir una prueba adecuada


ara probar la hipótesis nula es necesario seleccionar una técnica estadística
apropiada. El investigador debe tomar en cuenta la forma en que se calcula el
estadístico de prueba y la distribución de la muestra de donde se deduce éste (por
ejemplo, la media). El estadístico de prueba mide cuánto se aproxima la muestra a

6
la hipótesis nula y suele deducirse de una distribución bien conocida, como la
distribución normal, t o chi cuadrada. Más adelante en este capítulo se presentan
los lineamientos para seleccionar una prueba o técnica estadística apropiada. En
nuestro ejemplo, el estadístico z, que se utiliza con una distribución normal estándar,
sería el apropiado, y se calcula de la siguiente manera:

Seleccionar a nivel de significancia


Siempre que se hagan inferencias sobre una población, existe el riesgo de llegar a
una conclusión incorrecta. Pueden ocurrir dos tipos de errores.
Error tipo I. El error tipo I ocurre cuando los resultados de la muestra conducen al
rechazo de una hipótesis nula que en realidad es verdadera. En nuestro ejemplo,
cometeríamos un error tipo I si, con base en los datos de la muestra, concluyéramos
que la proporción de clientes que prefieren el nuevo plan de servicio fue mayor que
0.40, cuando de hecho fue menor o igual que 0.40. La probabilidad del error tipo I.
también se denomina nivel de significancia. Este error se controla al establecer el
nivel tolerable de riesgo de rechazar una hipótesis nula que es verdadera. La
selección de un nivel de riesgo específico depende del costo de cometer un error
tipo I.
Error tipo II. El error tipo II ocurre cuando, con base en los resultados de la muestra,
no se rechaza una hipótesis nula que en realidad es falsa. En nuestro ejemplo,
cometeríamos un error tipo II si, con base en los datos de la muestra, concluyéramos
que la proporción de clientes que prefiere el nuevo plan de servicio es menor o igual
que 0.40, cuando en realidad es mayor que 0.40. La probabilidad de un error tipo II
se denota con A diferencia B , que el investigador especifica, la magnitud depende
del valor real del parámetro (proporción) de la población.

Reunir los datos y calcular el estadístico de prueba


El tamaño de la muestra se determina después de tomar en cuenta los errores y
deseados, y otros aspectos cualitativos, como las limitaciones del presupuesto.

Determinar la probabilidad (valor crítico)


Con el uso de las tablas normales estándar se apoya uno para determinarla.

7
Comparar la probabilidad (valor crítico) y tomar la decisión

Conclusión de la investigación de mercados prueba de hipótesis


La conclusión a la que se llega con la prueba de hipótesis debe expresarse en
términos del problema de investigación de mercados. Las pruebas de diferencias
se pueden relacionar con distribuciones, medias, proporciones, medianas o rangos.
Primero analizaremos las hipótesis relacionadas con asociaciones en el contexto de
las tabulaciones cruzadas.

Coeficiente de regresión
El análisis de regresión es un procedimiento poderoso y fl exible para conocer las
relaciones asociativas entre una variable dependiente métrica y una o más variables
independientes. Se puede utilizar de las siguientes maneras:
1. Para determinar si las variables independientes explican una variación
significativa en la variable dependiente: para saber si existe una relación.
2. Para determinar qué cantidad de la variación de la variable dependiente puede
explicarse mediante las variables independientes: la fuerza de la relación.
3. Para determinar la estructura o forma de la relación: la ecuación matemática
que relaciona las variables independiente y dependiente.
4. Para predecir los valores de la variable dependiente. 5. Para controlar otras
variables independientes al evaluar las contribuciones de una variable
específica o de un conjunto de variables.

8
Estadística inferencial
la Estadística inferencial o Inferencia estadística estudia cómo sacar conclusiones
generales para toda la población a partir del estudio de una muestra, y el grado de
fiabilidad o significación de los resultados obtenidos.

Prueba T sobre el coeficiente de regresión


La prueba paramétrica más popular es la prueba t, que se utiliza para examinar
hipótesis sobre medias. La prueba t se puede aplicar a la media de una muestra o
de dos muestras de observaciones. En el caso de dos muestras, éstas pueden ser
independientes o pareadas. La prueba z también puede utilizarse para una o dos
muestras independientes. Las pruebas no paramétricas basadas en observaciones
obtenidas de una muestra abarcan la prueba Kolmogorov-Smirnov, la prueba chi
cuadrada, la prueba de rachas y la prueba binomial. En el caso de dos muestras
independientes, la prueba U de Mann-Whitney, la prueba de la mediana y la prueba
Kolmogorov-Smirnov de dos muestras se utilizan para probar hipótesis sobre
localización. Estas pruebas son las contrapartes no paramétricas de la prueba t de
dos grupos. La prueba chi cuadrada se puede utilizar para examinar diferencias en
proporciones. Las pruebas no paramétricas para muestras pareadas incluyen la
prueba de rangos con signo de Wilcoxon para muestras pareadas y la prueba del
signo. Estas pruebas son la contraparte de la prueba t para muestras pareadas. De
manera alternativa, la prueba chi cuadrada se puede utilizar con variables binarias.

9
Bibliografía

https://www.ditutor.com/inferencia_estadistica/estadistica_inferencial.html
http://www.cars59.com/wp-content/uploads/2015/09/Investigacion-de-Mercados-
Naresh-Malhotra.pdf
https://www.unid.edu.mx/alumnos/online/
https://www.vitutor.com/estadistica/bi/correlacion.html
https://www.monografias.com/trabajos15/hipotesis/hipotesis.shtml
https://support.minitab.com/es-mx/minitab/18/help-and-how-to/statistics/basic-
statistics/supporting-topics/basics/null-and-alternative-hypotheses/
https://explorable.com/es/la-correlacion-estadistica

10

También podría gustarte