Investigacion Estadistica

UNIVERSIDAD DA VINCI DE GUATEMALA
Facultad de Ciencias Criminológicas y Criminalísticas

Técnico Universitario en Criminología y Criminalística
TEMAS DE INVESTIGACION
Baltazar Yovany Domingo Hurtado
Huehuetenango, noviembre 2021

INTRODUCCION
INDICE
MUESTREO
El muestreo es el proceso mediante el cual se selecciona un grupo de observaciones que
pertenecen a una población. Esto, con el fin de realizar un estudio estadístico.
El muestreo, en otras palabras, es el procedimiento mediante el cual se toman a ciertos

individuos que pertenecen a una población que está siendo sujeto de un análisis. El
muestreo es necesario por el hecho de que las poblaciones pueden ser demasiado grandes y
no es factible (económica y materialmente hablando) tomar datos de todos los individuos.
El muestreo es un proceso o conjunto de métodos para obtener una muestra finita de una
población finita o infinita, con el fin de estimar valores de parámetros o corroborar
hipótesis sobre la forma de una distribución de probabilidades o sobre el valor de un
parámetro de una o más poblaciones.
El muestreo además de ser una ciencia Estadística, es un arte, donde no solo los elementos
se seleccionan al azar con una medida de probabilidad, si no que, además, requiere pericia
por parte de investigador/a en el diseño de la muestra a la hora de determinar:
o La técnica de selección de elementos de investigación.

o La selección de los estimadores apropiados.
o La elección de un tamaño adecuado de la muestra con precisión (margen de error) y
un nivel de confianza aceptable.
o Y el uso de marcos muestrales actualizados.
El muestreo es una herramienta de la investigación científica. Su función básica es

determinar que parte de una realidad en estudio (población o universo) debe examinarse
con la finalidad de hacer inferencias sobre dicha población.
Objetivos:
El objetivo es que la muestra sea representativa. Es decir, que sus indicadores como la
media de edad, el ingreso promedio, el porcentaje de hombres y de mujeres, entre otros, sea
el mismo, o muy similar al de la población.
Ayuda a obtener información fiable de la población a partir de una muestra de la que

extraer inferencias estadísticas con un margen de error medido en términos de
probabilidades.
Estudia el comportamiento y las opiniones de toda una población analizando únicamente

una parte de esta, teniendo en cuenta que siempre existirá un margen de error a la hora de
realizar dichos cálculos.
Arroja resultados que se pueden utilizar para concluir un determinado estudio X de

población, al igual las técnicas selectivas que se requieren para dicho estudio de acuerdo a
lo que se va a evaluar.
Ventajas:
 Ahorro de dinero debido a que se consideran menos unidades para trabajar.

 Ahorro de tiempo, dado que el número de mediciones solo es de una parte
representativa de la población.
 Mayor precisión, la muestra puede ser más precisa porque reduce la magnitud de los
errores no muestrales debido a que:
Existe menos personal necesario para hacer las mediciones (u observaciones).

Hay personal con mayor preparación.
Puede variar las condiciones del estudio si se demora su ejecución.
 Conveniencia, es conveniente el uso de una muestra si el estudio ocasiona la
destrucción de la unidad estudiada.
 Rapidez y facilidad de realizar el estudio
 Menor número de sujetos a estudiar
 Menor costo económico
 Mayor validez del estudio
 Mayor número de variables a estudiar
 Controlar y ajustar posibles variables de confusión.
CONCEPTO
a) Muestra
Es un subconjunto de datos perteneciente a una población de datos. Estadísticamente

hablando, debe estar constituido por un cierto número de observaciones que representen
adecuadamente el total de los datos. Muestra es una porción de la totalidad de un
fenómeno, producto o actividad que se considera representativa del total también llamada
una muestra representativa.
En estadísticas, la muestra es una porción extraída mediante métodos específicos que

representan los resultados de una totalidad llamada población usando la probabilidad como,
por ejemplo, “la muestra estadística de 100 personas que se someten a una encuesta para
conocer la satisfacción de un producto”.
Como un subgrupo o subconjunto representativo de la población, extraída seleccionada por

algún método de muestreo, la muestra siempre es una parte de la población. Si se tienen
varias poblaciones, entonces se tendrán varias muestras. La muestra debe poseer toda la
información deseada para tener la posibilidad de extraerla, y esto solo se puede lograr con
una buena selección de la muestra y un trabajo muy cuidadoso y de alta calidad en la
recolección de datos.
Las muestras se obtienen con la intención de inferir propiedades de la totalidad de la

población, para lo cual deben ser representativas de la misma (una muestra representativa
se denomina técnicamente muestra aleatoria). Para cumplir esta característica, la inclusión
de sujetos en la muestra debe seguir una técnica de muestreo. En tales casos, puede
obtenerse una información similar a la de un estudio exhaustivo con mayor rapidez y menor
coste.
La muestra, desde el punto de vista más genérico de la palabra, se trata de una

representación a pequeña escala de algo que tiene la misma calidad, pero en mayor
cantidad. Las muestras sirven para demostrar que lo que se quiere obtener está bien sin
necesidad de comprobar la calidad del producto completo.
b) Muestreo Probabilístico.
El muestreo probabilístico es una técnica de muestreo en la que un investigador establece

una selección de unos pocos criterios y elige al azar a los miembros de una población.
Todos los miembros tienen la misma oportunidad de formar parte de la muestra con este
parámetro de selección.
Por ejemplo, si tienes una población de 100 personas, cada persona tendría una
probabilidad de 1 de 100 de ser seleccionado. El método de muestreo probabilístico te
ofrece la mejor oportunidad de crear una muestra representativa de la población.
Las observaciones son seleccionadas en base a la aleatoriedad, es decir, al azar. En esta

categoría se puede encontrar:
Sistemático:
Se elige una observación al azar y, para seleccionar el resto de la muestra, se utilizan
intervalos numéricos regulares. Es decir, que se tiene una población de 10.000 y,
aleatoriamente, selecciono la observación 600, después de lo cual se puede considerar
intervalos de 30 observaciones. En este caso, se tomaría las observaciones 600, 630, 660,
690, 720, 750, 780, y así sucesivamente.
Aleatorio estratificado:
Se divide a la población en estratos, que son grupos que comparten características en
común y son más homogéneos, inclusive, que la población en su conjunto. Entonces, se
selecciona una muestra, ya sea de manera aleatoria o sistemática, dentro de cada estrato. El
objetivo es lograr una representatividad de cada estrato.
Por conglomerados o clústeres:

Consiste en crear grupos más pequeños que la población, los cuales reflejen o compartan
todas las características de esta. Luego, se elige alguno de los conglomerados como muestra
y lo se analiza de forma detallada.
Existen múltiples usos del muestreo probabilístico:
Por ejemplo, tenemos a 1000 participantes de toda la población de México, supongamos

que es probable que no sea posible obtener una lista completa de todos estos. Pero en
cambio, lo que hace el investigador es seleccionar áreas de manera aleatoria (es decir,
ciudades, comunidades, etc), y selecciona al azar dentro de esos límites.
 Reducir el sesgo de la muestra: Mediante los métodos de muestreo probabilístico,

el sesgo de la muestra derivada de una población es insignificante o inexistente. El
muestreo probabilístico permite reunir datos de mayor calidad, ya que la muestra
representa adecuadamente a la población.
 Población diversa: Cuando la población es vasta y diversa, es esencial tener una

representación adecuada para que los datos no se desvíen hacia un solo grupo
demográfico.
 Crear una muestra precisa: El muestreo probabilístico ayuda a los investigadores

a planificar y crear una muestra precisa. Esto ayuda a obtener datos bien definidos.
a. Muestreo no probabilístico
El muestreo no probabilístico es una técnica de muestreo en la cual el investigador

selecciona muestras basadas en un juicio subjetivo en lugar de hacer la selección al azar.
A diferencia en el muestreo probabilístico, donde cada miembro de la población tiene una
posibilidad conocida de ser seleccionado, en el muestreo no probabilístico, no todos los
miembros de la población tienen la oportunidad de participar en el estudio
El muestreo no probabilístico es más útil para estudios exploratorios como la encuesta
piloto (una encuesta que se implementa en una muestra más pequeña, en comparación con
el tamaño de muestra predeterminado).
El muestreo no probabilístico se utiliza donde no es posible extraer un muestreo de
probabilidad aleatorio debido a consideraciones de tiempo o costo.
El muestreo no probabilístico es un método menos estricto, este método de muestreo
depende en gran medida de la experiencia de los investigadores. El muestreo no
probabilístico comúnmente se lleva a cabo mediante métodos de observación, y se utiliza
ampliamente en la investigación cualitativa.
TIPOS DE MUESTREO NO PROBABILÍSTICO
Muestreo por conveniencia: El muestreo por conveniencia es una técnica de muestreo no

probabilística donde las muestras de la población se seleccionan solo porque están
convenientemente disponibles para el investigador. Estas muestras se seleccionan solo
porque son fáciles de reclutar y porque el investigador no consideró seleccionar una
muestra que represente a toda la población.
Idealmente, en la investigación, es bueno analizar muestras que representen a la población.

Pero, en algunas investigaciones, la población es demasiado grande para evaluar y
considerar a toda la población.
Esta es una de las razones por las que los investigadores confían en el muestreo por
conveniencia, que es la técnica de muestreo no probabilística más común, debido a su
velocidad, costo-efectividad y facilidad de disponibilidad de la muestra.
Un ejemplo de muestreo por conveniencia sería utilizar a estudiantes voluntarios que sean
conocidos del investigador. El investigador puede enviar la encuesta a los estudiantes y
ellos en este caso actuarían como muestra.
Muestreo consecutivo: Esta técnica de muestreo no probabilística es muy similar al

muestreo por conveniencia (con una ligera variación). En el muestreo consecutivo el
investigador elige una sola persona o un grupo de muestra, realiza una investigación
durante un periodo de tiempo, analiza los resultados y luego pasa a otra asignatura o grupo
de sujetos si es necesario.
Esta técnica de muestreo le da al investigador la oportunidad de trabajar con muchos temas
y afinar su investigación mediante la recopilación de resultados que tienen conocimientos
vitales.
Muestreo por cuotas: Hipotéticamente, supongamos que un investigador desea estudiar

los objetivos profesionales de los empleados de una organización. En esta organización
trabajan 500 empleados y estos son conocidos en conjunto como “población”.
Para comprender mejor una población, el investigador solo necesitará una muestra, no a
toda la población. Además, el investigador está interesado en estratos particulares dentro de
la población. Es aquí donde el muestreo por cuotas ayuda a dividir la población en estratos
o grupos.
Para estudiar los objetivos de más de 500 empleados, técnicamente la muestra seleccionada
debe tener un número proporcional de hombres y mujeres. Lo que significa que debe haber
250 hombres y 250 mujeres. Como esto es improbable, los grupos o estratos se seleccionan
mediante el muestreo por cuotas
Muestreo intencional o por juicio: En esta técnica de muestreo no probabilístico, las

muestras se seleccionan basándose únicamente en el conocimiento y la credibilidad del
investigador. En otras palabras, los investigadores eligen solo a aquellos que estos creen
que son los adecuados (con respecto a los atributos y la representación de una población)
para participar en un estudio de investigación.
La desventaja del muestreo intencional es que los resultados pueden estar influenciados por
nociones percibidas del investigador. Por lo tanto, hay una gran cantidad de ambigüedad
involucrada en esta técnica de investigación. Por ejemplo, este tipo de método de muestreo
se puede utilizar en estudios piloto.
Muestreo de bola de nieve: Este tipo de técnica de muestreo ayuda a los investigadores a
encontrar muestras cuando son difíciles de localizar. Los investigadores utilizan esta
técnica cuando el tamaño de la muestra es pequeño y no está disponible fácilmente.
Este sistema de muestreo bola de nieve funciona como el programa de referencia. Una vez
que los investigadores encuentran sujetos adecuados, se le pide a este ayuda para buscar a
sujetos similares y así poder formar una muestra de buen tamaño.
Por ejemplo, este tipo de muestreo se puede utilizar para realizar investigaciones que
involucran una enfermedad particular en pacientes o tal vez una enfermedad rara también.
Los investigadores pueden buscar ayuda de las personas enfermas para que estos refieran a
otros que sufran de la misma dolencia y con esto formar una muestra subjetiva para llevar a
cabo el estudio.
¿Cuándo usar el muestreo no probabilístico?

Este tipo de muestreo se usa para indicar si existe un rasgo o característica particular en una
población.
Esta técnica de muestreo es ampliamente utilizada cuando los investigadores realizan

investigaciones cualitativas, estudios piloto o investigación exploratoria.
El muestreo no probabilístico se usa cuando los investigadores tienen un tiempo limitado
para llevar a cabo la investigación o tienen limitaciones presupuestarias.
El muestreo no probabilístico se realiza para observar si un tema en particular necesita un
análisis en profundidad. Mejora tu muestreo siguiendo estos consejos
Ventajas del muestreo no probabilístico

El muestreo no probabilístico es un método práctico para los investigadores que
implementan encuestas en el mundo real. Aunque claro, cabe mencionar que los estadistas
prefieren el muestreo probabilístico porque arroja datos en forma de números. Pero la
realidad es que si se hace correctamente, el muestreo no probabilístico puede arrojar
resultados similares, si no es que de la misma calidad.
Obtener respuestas utilizando el muestreo no probabilístico es más rápido y más rentable en
comparación al muestreo probabilístico ya que el investigador conoce la muestra.
Comúnmente los participantes están motivados para responder rápidamente en

comparación con las personas que se seleccionan al azar.
Desventajas del muestreo no probabilístico

En el muestreo no probabilístico, el investigador necesita pensar las posibles razones de los
sesgos. Es importante tener una muestra que represente de cerca a la población. Conoce qué
es una Muestra Representativa de la Población Nacional.
Al elegir una muestra en un muestreo no probabilístico, los investigadores deben tener

cuidado con los reclutas que puedan distorsionar los datos. Al final del día, la investigación
se lleva a cabo para obtener información valiosa y datos útiles.
c) Población
Una población estadística es el total de individuos o conjunto de ellos que presentan o

podrían presentar el rasgo característico que se desea estudiar.
Tipos de población estadística

Dentro de las poblaciones estadísticas, fundamentalmente dos tipos de poblaciones:
 Población estadística finita: Es aquella en la que el número de valores que la

componen tiene un fin. Por ejemplo, la población estadística que nos indica la
cantidad de árboles de una ciudad es finita. Es cierto que puede variar con el
tiempo, pero en un instante determinado es finita, tiene fin.
 Población estadística infinita: Se trata de aquella población que no tiene fin. Por
ejemplo, el número de planetas que existen en el universo. Aunque puede que sea
finito, el número es tan grande y desconocido que estadísticamente se asume como
infinito.
d) Parámetro
Un parámetro es un elemento de un sistema que permite clasificarlo y poder evaluar

algunas de sus características como el rendimiento, la amplitud o la condición, es decir, que
sirve para conocer atributos de una distribución de datos.
Un parámetro estadístico es un número que se obtiene a partir de los datos de una muestra
estadística. Los parámetros estadísticos también se conocen como estadísticos descriptivos.
Los parámetros estadísticos sirven para sintetizar o resumir la información dada por una
tabla o por una gráfica. En otras palabras, dados unos pocos parámetros estadísticos se
puede tener una idea general de la distribución de la información.
Los parámetros estadísticos dan un buen resumen cuando se conoce la distribución de la

población. En particular, si la muestra proviene de una distribución normal, entonces el
promedio típico y la desviación estándar dan un buen resumen de la distribución.
Ejemplos de parámetros estadísticos son el promedio, la mediana, la desviación estándar o

los cuartiles.
Los parámetros estadísticos se clasifican según la información que resumen. Los dos tipos
más comunes de parámetros estadísticos son:
 De tendencia central
 De dispersión
Medidas de tendencia central

Estos parámetros indican alrededor de qué valor (centro) se distribuyen los datos.
Algunas medidas de tendencia central son:
 Media aritmética: La media es el valor promedio de la muestra. También se puede

interpretar como el centro de gravedad de los datos.
 Mediana: La mediana es el valor que separa la mitad superior de la muestra y la

inferior. En otras palabras, divide los datos en dos partes iguales.
 Moda: La moda es el valor que más se repite en una muestra. Es decir, es el valor
más frecuente.
Medidas de dispersión
Las medidas de dispersión informan sobre cuánto se alejan del centro los valores de la
distribución. Es decir, son un resumen sobre qué tan dispersos están los datos.
Algunas medidas de dispersión son:
 Rango o recorrido: El rango es la diferencia entre el mayor y el menor de los valores

de una muestra. Este valor nos indica en qué rango se encuentran los datos.
 Desviación media: La desviación media es la media de los valores absolutos de las

desviaciones respecto a la media. En otras palabras, es el promedio de cuánto se desvían
los datos de la media (en valor absoluto).
 Varianza: La varianza es el promedio del cuadrado de las desviaciones respecto a la

media. O sea, mide el promedio de cuánto se desvían los datos al cuadrado —primero
elevamos al cuadrado y luego calculamos el promedio.
 Desviación estándar: La desviación estándar es la raíz cuadrada de la varianza. Este

suele ser un mejor estimador que la desviación media cuando tratamos con la
distribución normal.
 Cuantiles: Los cuantiles dividen una muestra en n partes iguales. Estos nos ayudan a
tener una idea de los rangos en los que se concentran más valores.
Dependiendo el valor de n, los cuartiles pueden tener nombres particulares:
o Cuartiles: Estos dividen los datos en cuatro partes iguales.

o Deciles: Los deciles dividen la muestra en diez conjuntos del mismo tamaño.
o Percentiles: Los percentiles dividen los datos en cien partes iguales.
e) Estadígrafo
La estadística llama estadígrafos o estadísticos a números resúmenes, que permiten

establecer conclusiones acerca de la estructura de una muestra o de una colección de datos.
Estos números son construidos considerando toda la información que contiene dicha
muestra, es decir, se consideran todos los datos que han sido recolectados. Pueden
construirse estadígrafos para distintos fines, sin embargo, estudiaremos tres tipos de ellos
dado su amplio uso en la estadística descriptiva: estadígrafos de orden, de tendencia central
y de variabilidad. Es decir, que es el término utilizado para designar a la persona dedicada a
las tareas propias de la estadística, aunque en ocasiones también es frecuente que se utilice
para designar a la variable que define una distribución estadística, de esta forma es común
escuchar el término estadígrafo de prueba.
Simbología Principal
Los símbolos usados para representar los estadísticos y los parámetros, en éste y los
siguientes capítulos, son resumidos en la tabla siguiente:
Distribución Muestral de la media
Cuando hacemos investigación nos interesa inferir si los hallazgos de un grupo de pacientes
son similares a los de la población general, o a los de otro grupo, o bien si se trata de
valores distintivos. Para inferir si hay o no diferencias es que resulta fundamental trabajar
con la distribución muestral de medias.
Cuando en una población se toma una muestra y se mide una variable continua, se obtiene
un conjunto de mediciones que puede resumirse en un valor de media. Si se toma otra
muestra de la misma medición se obtendrá otra media. Puede intuirse entonces que
podemos tomar infinitas muestras y obtener por lo tanto infinitas medias. Esas medias por
lo tanto constituyen a su vez una variable continua, que como toda variable continua tiene
determinada distribución de probabilidades.
Si tenemos una muestra aleatoria de una población N(m,s ), se sabe (Teorema del límite
central) que la fdp de la media muestral es también normal con media m y varianza s2/n.
Esto es exacto para poblaciones normales y aproximado (buena aproximación con n>30)
para poblaciones cualesquiera. Es decir es el error típico, o error estándar de la

media.
¿Cómo usamos esto en nuestro problema de estimación?
1º problema: No hay tablas para cualquier normal, sólo para la normal m=0 y s=1 (la
llamada z); pero haciendo la transformación (llamada tipificación)
una normal de media m y desviación s se transforma en una z.

Llamando za al valor de
una variable normal
tipificada que deja a su
derecha un área bajo la
curva de a, es decir, que la
probabilidad que la
variable sea mayor que ese
valor es a (estos son los
valores que ofrece la tabla
de la normal)
podremos construir intervalos de la

forma
para los que la probabilidad es 1 - a.
Teniendo en cuenta la simetría de la normal y manipulando algebraicamente
que también se puede escribir
o, haciendo énfasis en que es el error estándar de la media,
Recuérdese que la probabilidad de que m esté en este intervalo es 1 - a. A un intervalo de

este tipo se le denomina intervalo de confianza con un nivel de confianza del 100(1 - a)%,
o nivel de significación de 100a%. El nivel de confianza habitual es el 95%, en cuyo
caso a=0,05 y za /2=1,96. Al valor se le denomina estimación puntual y se dice que es
un estimador de m.
Ejemplo: Si de una población normal con varianza 4 se extrae una muestra aleatoria de
tamaño 20 en la que se calcula se puede decir que m tiene una probabilidad de 0,95

de estar comprendida en el intervalo
que sería el intervalo de confianza al 95% para m
En general esto es poco útil, en los casos en que no se conoce m tampoco suele

conocerse s2; en el caso más realista de s2 desconocida los intervalos de confianza se
construyen con la t de Student (otra fdp continua para la que hay tablas) en lugar de la z.
o, haciendo énfasis en que es el error estándar estimado de la media,
Esta manera de construir los intervalos de confianza sólo es válida si la variable es normal.
Cuando n es grande (>30) se puede sustituir t por z sin mucho error.
Tamaño Optimo De Las Muestras

El tamaño de la muestra normalmente es representado por "n" y siempre es un número
entero positivo. No se puede hablar de ningún tamaño exacto de la muestra, ya que puede
variar dependiendo de los diferentes marcos de investigación. Sin embargo, si todo lo
demás es igual, una muestra de tamaño grande brinda mayor precisión en las estimaciones
de las diversas propiedades de la población.
Para determinar el tamaño óptimo de una muestra se deben tomar en cuenta varios aspectos
relacionados con:
 El parámetro
 El estimador
 El sesgo
 El error muestral
 El nivel de confianza y
 La varianza poblacional.
La fórmula para calcular el tamaño de la muestra cuando se conoce el tamaño de la

población es la siguiente:
Ejemplo: cálculo del tamaño de la muestra conociendo el tamaño de la población:
¿A cuántas familias tendríamos que estudiar para conocer la preferencia del mercado en
cuanto a las marcas de champo para bebé, si se conoce que el número de familias con bebés
en el sector de interés es de 15000?
Seguridad: 95%
Precisión: 3%
Proporción esperada: se sume que puede ser próxima al 5%; si no se tuviese ninguna idea
de dicha proporción se usaría el valor p = 0,5 que maximiza el tamaño muestral.
Estimación de los Parámetros
La estimación de parámetros es un método que consiste en asignar un valor al parámetro o
al conjunto de parámetros que caracterizan el campo sujeto a estudio. La fórmula
matemática que lo determina se denomina estimador.
Los estadísticos de muestra tienen como objetivo el análisis descriptivo, para lograr las
estimaciones de los parámetros de la población junto con la media de errores relacionada
con esas estimaciones.
En los tipos de estimaciones de parámetros distintos se hallan:
 Los intervalos de confianza: es el rango de valor donde está la posibilidad que

contenga el parámetro de población.
 Las estimaciones de punto: son el valor individual más probable de un parámetro.
Se puede decir entonces que: la estimación de punto de la media de la población es
el parámetro y la media de la muestra es la estimación del parámetro.
Pueden considerarse funcionales del modelo matemático para determinar un parámetro que
entreguen estimaciones del mismo o podrían ser hipotéticas al mejor estimador del
parámetro de la media.
El modelo lineal generalizado es desigual al modelo lineal general ya que tiene dos
aspectos fundamentales que son:
 La variable de respuesta no tiene que seguir una distribución normal porque es

suficiente que pertenezca a la familia de funciones exponenciales.
 La media de las variables logra ser una función lineal de la variable predictora,
puede tener algunas implicaciones para estimar los parámetros porque debe recurrir
a otros distintos al tradicional y utilizar el modelo lineal general.
En el modelo de rango incompleto, el centro del sistema de ecuaciones normales no tiene

inversa ordinaria, por lo tanto, es un problema conseguir los estimadores de parámetros
porque admite soluciones infinitas.
Razón por la cual hay que tener en cuenta solo los parámetros que tengan estimadores
idénticos.
Ejemplo estimación de parámetros

 La estimación de parámetros consiste en el procedimiento que permite establecer la
media de una población y sus características.
 Con una muestra aleatoria de tamaño n se puede desarrollar la estimación de un
parámetro de la población.
 El intervalo de confianza es donde se determina en qué lugar está un parámetro.
Queremos información sobre el resultado de las elecciones generales e intentar predecir qué
porcentaje de votos tendrá cada partido político. Tras utilizar las técnicas pertinentes se
extraen los siguientes resultados:
o Partido A: 32%
o Partido B: 51%
o Partido C: 17%
Sin embargo, al estar conscientes, de que es una estimación y utilizando las fórmulas
adecuadas, se establece los intervalos de confianza al 95%.
o Partido A: [30 – 34]%
o Partido B: [47 – 53]%
o Partido C: [15-19]%
Tras los resultados obtenidos se puede interpretar que existe un 95% de probabilidades de
que el resultado de los partidos políticos esté en ese rango. Aun así, existe un 5% de
probabilidades de que los resultados estén fuere de ese rango.
Muestreo aleatorio simple: Todos los individuos de la población tienen la misma

probabilidad de ser elegidos como parte de la muestra. Tiene ventajas, como el hecho de
que es fácil de llevar a cabo a través de sistemas informáticos. Sin embargo, se requiere el
listado completo de toda la población y, si la muestra es muy pequeña, la selección podría
no ser representativa.
El muestreo aleatorio simple es un procedimiento de muestreo probabilístico que da a cada
elemento de la población objetivo y a cada posible muestra de un tamaño determinado, la
misma probabilidad de ser seleccionado.
Pasos para seleccionar una muestra aleatoria simple
1. Definir la población objetivo.

2. Identificar un marco de muestreo actual de la población objetivo o desarrolla uno nuevo.
3. Evaluar el marco de muestreo para la falta de cobertura, cobertura excesiva, cobertura
múltiple y la agrupación, y hacer los ajustes que se considere necesario.
4. Asignar un número único a cada elemento de la trama.
5. Determinar el tamaño de la muestra.
6. Seleccionar al azar el número específico de elementos de la población.
Para seleccionar el número de elementos de la población se puede recurrir al método de
lotería, una tabla de números aleatorios y los números generados de forma aleatoria
mediante un programa de computadora, es decir, al azar.
El método de lotería sólo funciona bien con pequeñas poblaciones de la muestra, es poco
práctico para su uso con poblaciones más grandes.
Un ejemplo del uso del método de lotería sería la selección de una muestra aleatoria de
entre un grupo de 100 miembros. Se ponen todos los nombres en un recipiente y se van
sacando uno por uno hasta tener el tamaño suficiente de nuestra muestra.
Al utilizar el sistema de sorteo, los números que representa cada elemento de la población
objetivo son colocadas en chips (es decir, tarjetas, papel u otros objetos).
Los chips se colocan entonces en un recipiente y se mezclan. A continuación, a ciegas se

seleccionan las fichas desde el recipiente hasta que se haya obtenido el tamaño de muestra
deseado. Las desventajas de este método de selección es que consume mucho tiempo, y se
limita a poblaciones pequeñas.
Tabla de Números Aleatorios
El uso de números aleatorios, un método alternativo implica también la numeración de

miembros de la población de 1 a N. Luego, el tamaño de muestra de n tiene que ser
determinada por selección de los números al azar.
El uso de la tabla de números aleatorios similar a la que aparece a continuación puede

ayudar en gran medida con la aplicación de esta técnica de muestreo.
En una tabla de números aleatorios no se sigue un patrón particular. Pueden ser leídos de
cualquier manera, es decir, horizontal, vertical, diagonal, hacia delante o hacia atrás. El
número de dígitos que se utiliza debe corresponder al tamaño total de la población objetivo.
Los números que el investigador encuentra que no concuerdan con los números asignados a
elementos de la población objetivo son ignorados. Este proceso de la tabla de números
aleatorios es un proceso tedioso, consume tiempo, y no se recomienda para grandes
poblaciones.
En su lugar, se pueden utilizar softwares estadísticos u hojas de cálculo para generar
números aleatorios. Los elementos de las poblaciones cuyos números asignados coinciden
con los números generados por el software son incluido en la muestra. Se puede seleccionar
un número de una tabla de números aleatorios para usarlo como el número de partida para
el procedimiento.
Selección Sistemático de la Muestra

Un método probabilístico de muestreo en el cual el auditor calcula un intervalo (el tamaño de
la población dividida entre el número de elementos de muestra deseados), y escoge los
elementos para la muestra con base en el tamaño del intervalo y un número seleccionado al
azar entre cero y la longitud del intervalo.
El muestreo sistemático es un tipo de muestreo probabilístico donde se hace una selección
aleatoria del primer elemento para la muestra, y luego se seleccionan los elementos
posteriores utilizando intervalos fijos o sistemáticos hasta alcanzar el tamaño de la
muestra deseado.
Pasos para la selección de un muestreo sistemático
1. Definir la población objetivo.

2. Determinar el tamaño deseado de la muestra (n).
3. Identificar el marco muestreo existente o desarrollar un marco de muestreo de la
población objetivo.
4. Evaluar el marco muestral por falta de cobertura, cobertura excesiva, múltiple cobertura,
agrupación, periodicidad, y hacer los ajustes cuando sea necesario. Idealmente, la lista
estará en un orden aleatorio con respecto al estudio variable o, mejor aún, ordenados en
función de la variable de interés o su correlación, creando así estratificación implícita.
5. Determinar el número de elementos en el marco de la muestra (N).
6. Calcular el intervalo de muestreo (i) dividiendo el número de elementos en el marco de
muestreo (N) por el tamaño de la muestra específica (n). Uno debería ignorar el resto y
redondear o terminar en el número entero más próximo. El redondeo hacia abajo y
truncando puede hacer que el tamaño de la muestra sea más grande de lo deseado. Si es
así, se puede eliminar de forma aleatoria las selecciones adicionales. Si no se conoce el
tamaño exacto, o es poco práctico determinar, se puede fijar una fracción de muestreo.
7. Seleccionar al azar un número, r, de “1” mediante i.
8. Selecciona para la muestra, r, r + i, r + 2i, r, +3i, y así sucesivamente, hasta agotar el
marco.
A nivel técnico, el muestreo sistemático no crea una muestra verdaderamente aleatoria.

Sólo la selección del primer elemento de muestreo sistemático es una selección de
probabilidad. Una vez que el primer elemento es seleccionado, algunos de los elementos
tendrán una probabilidad cero de selección.
Además, cierta combinación de elementos, como los elementos que son adyacentes entre sí
en el marco de muestreo, pueden no ser seleccionados. Muestreos sistemáticos repetidos
pueden utilizarse para abordar este problema.
Aplicación del muestreo simple o Muestreo aleatorio simple

El muestreo aleatorio simple es un procedimiento de muestreo probabilístico que da a cada
elemento de la población objetivo y a cada posible muestra de un tamaño determinado, la
misma probabilidad de ser seleccionado.
El muestreo aleatorio simple no es tan utilizado en investigaciones del consumidor, sobre

todo porque es complicado obtener un marco de muestreo donde extraer al azar y no
querrás darles a todas las unidades de la muestra una probabilidad igual de ser elegidas, ya
que usualmente para hacer una investigación de este tipo se requiere a usuarios de tiendas o
consumidores de ciertos productos o ciertas áreas específicas para ser las unidades de
muestreo.
No olvidemos que una parte muy importante del muestreo consiste en tener el tamaño de la
muestra correcta, para no tener un error de muestreo, el cual debe ser el mínimo posible.
Ejemplo de muestreo aleatorio simple

Una empresa tiene 120 empleados. Se quiere extraer una muestra de 30 de ellos.
 Enumera a los empleados del 1 al 120
 Sortea 30 números entre los 120 trabajadores
 La muestra estará formada por los 30 empleados que salieron seleccionados de los
números obtenidos.
En resumen, el muestreo aleatorio simple es como hacer un sorteo, afortunadamente existen
herramientas que facilitan la automatización y le da seriedad a este proceso.
Muestreo Estadístico
Al realizar cualquier investigación social o de mercados, la mayor parte de las veces se
rebasa la capacidad de los investigadores/as para llegar a toda la población o universo de
estudio, por lo que se suele optar por métodos de muestreo que sirvan para acotar ese
universo y así poder realizar la investigación dentro de nuestras posibilidades.
El uso de estos métodos de muestreo, como su propio nombre indica, nos ayuda a obtener
información fiable de la población a partir de una muestra de la que extraer inferencias
estadísticas con un margen de error medido en términos de probabilidades. En otras palabras,
en una investigación por muestreo podremos estudiar el comportamiento y las opiniones de
toda una población analizando únicamente una parte de esta, teniendo en cuenta que siempre
existirá un margen de error a la hora de realizar dichos cálculos.
Técnicas de selección del muestreo a través del muestreo estadístico
Muestreo probabilístico: Forman parte de este tipo de muestreo todos

aquellos métodos para los que puede calcularse la probabilidad de extracción de cualquiera
de las muestras posibles. Este conjunto de técnicas de muestreo es el más aconsejable,
aunque en ocasiones no es posible optar por él.
Muestreo estratificado: Consiste en la división previa de la población de estudio

en grupos o clases que se suponen homogéneos respecto a característica a estudiar. A cada
uno de estos estratos se le asignaría una cuota que determinaría el número de miembros del
mismo que compondrán la muestra.
Muestreo sistemático: Es la elección de una muestra a partir de los elementos de una lista
según un orden determinado, o recorriendo la lista a partir de un número aleatorio
determinado.
Muestreo por conglomerados: Cuando la población se encuentra dividida, de manera

natural, en grupos que se suponen que contienen toda la variabilidad de la población, es
decir, la representan fielmente respecto a la característica a elegir, pueden seleccionarse
sólo algunos de estos grupos o conglomerados para la realización del estudio.
Muestreo errático: También se llama sin norma. La muestra se realiza de cualquier forma,

valorando únicamente la comodidad o la oportunidad en términos de costes, tiempo u otro
factor no estadístico.
Al realizar un muestreo en una población podemos hablar de muestreos probabilísticas y no

probabilísticas, entre estas técnicas o procedimientos están:
Muestreo simple: Este tipo de muestreo toma solamente una muestra de una población
dada para el propósito de inferencia estadística. Puesto que solamente una muestra es
tomada, el tamaño de muestra debe ser los suficientemente grandes para extraer una
conclusión. Una muestra grande muchas veces cuesta demasiado dinero y tiempo.
Muestreo aleatorio simple: Es aquel en que cada elemento de la población tiene la misma
probabilidad de ser seleccionado para integrar la muestra. Una muestra simple aleatoria es
aquella en que sus elementos son seleccionados mediante el muestreo aleatorio simple.
Estimación puntual
Una estimación puntual de un parámetro poblacional es cuando se utiliza un único valor
para estimar ese parámetro, es decir, se usa un punto en concreto de la muestra para estimar
el valor deseado.
Cuando se estima un parámetro de forma puntual, se puede saber con certeza, cual es ese
valor. Imaginemos una población de 30 personas de las que seleccionamos una muestra de
20 para las que conocemos sus edades. Estimar de forma puntual la media de edad, sería tan
sencillo como sumar esos 20 datos y dividirlos entre el total de la muestra estadística.
Ejemplos de estimaciones puntuales
Estimación de la media por intervalo de confianza

El intervalo de confianza representa una técnica de estimación que se utiliza en el campo de
la inferencia estadística. En él se permite acotar uno o diversos pares de valores, entre los
cuales está la estimación puntual indagada. Esto dentro de una determinada probabilidad.
Un intervalo de confianza estadística en estadística permite calcular los valores que existen
alrededor de una media muestral. Dentro de la muestra, se encuentra un rango superior y
otro inferior. Dentro de dicho rango, se estima la probabilidad determinada y se localiza el
parámetro poblacional. De modo que esto permite expresar con precisión si la estimación
de la muestra coincide con el valor de toda la población.
La estimación por intervalos consiste en establecer el intervalo de valores donde es más

probable se encuentre el parámetro. La obtención del intervalo se basa en las siguientes
consideraciones:
a) Si conocemos la distribución muestral del estimador podemos obtener las probabilidades

de ocurrencia de los estadísticos muestrales.
b) Si conociéramos el valor del parámetro poblacional, podríamos establecer la
probabilidad de que el estimador se halle dentro de los intervalos de la distribución
muestral.
c) El problema es que el parámetro poblacional es desconocido, y por ello el intervalo se
establece alrededor del estimador. Si repetimos el muestreo un gran número de veces y
definimos un intervalo alrededor de cada valor del estadístico muestral, el parámetro se
sitúa dentro de cada intervalo en un porcentaje conocido de ocasiones. Este intervalo es
denominado "intervalo de confianza".
Ejemplo
Se generan 100000 muestras aleatorias (n=25) de una población que sigue la distribución
Normal, y resulta:
La distribución de las Medias muestrales aproxima al modelo Normal:
En consecuencia, el intervalo dentro del cual se halla el 95% de las Medias muestrales es
(Nota: Los valores +-1.96 que multiplican la Desviación Típica de la distribución muestral
son los valores cuya función de distribución es igual a 0.975 y 0.025 respectivamente y se
pueden obtener en las tablas de la distribución Normal estandarizada o de funciones en
aplicaciones informáticas como Excel). Seguidamente generamos una muestra de la
población y obtenemos su Media, que es igual a 4.5. Si establecemos el intervalo alrededor
de la Media muestral, el parámetro poblacional (5.1) está incluido dentro de sus límites:
Ahora bien, la distancia de un punto A a un punto B es la misma que de B a A. Por esa
razón, la distancia desde m a la Media muestral es la misma que va de la Media muestral a
m. En consecuencia, si hacemos un muestreo con un número grande de muestras
observamos que el 95% de las veces (aproximadamente) el valor de la Media de la
población (m) se encuentra dentro del intervalo definido alrededor de cada uno de los
valores de la Media muestral. El porcentaje de veces que el valor de m se halla dentro de
alguno de los intervalos de confianza es del 95%, y es denominado nivel de confianza.
Si queremos establecer un intervalo de confianza en que el % de veces que m se halle

dentro del intervalo sea igual al 99%, la expresión anterior es:
La estimación por intervalos consiste en establecer el intervalo de valores donde es más

probable se encuentre el parámetro. La obtención del intervalo se basa en las siguientes
consideraciones:
a) Si conocemos la distribución muestral del estimador podemos obtener las probabilidades

de ocurrencia de los estadísticos muestrales.
b) Si conociéramos el valor del parámetro poblacional, podríamos establecer la

probabilidad de que el estimador se halle dentro de los intervalos de la distribución
muestral.
c) El problema es que el parámetro poblacional es desconocido, y por ello el intervalo se

establece alrededor del estimador. Si repetimos el muestreo un gran número de veces y
definimos un intervalo alrededor de cada valor del estadístico muestral, el parámetro se
sitúa dentro de cada intervalo en un porcentaje conocido de ocasiones. Este intervalo es
denominado "intervalo de confianza".
Ejemplo
Se generan 100000 muestras aleatorias (n=25) de una población que sigue la distribución
Normal, y resulta:
La distribución de las Medias muestrales aproxima al modelo Normal:
En consecuencia, el intervalo dentro del cual se halla el 95% de las Medias muestrales es
(Nota: Los valores +-1.96 que multiplican la Desviación Típica de la distribución muestral
son los valores cuya función de distribución es igual a 0.975 y 0.025 respectivamente y se
pueden obtener en las tablas de la distribución Normal estandarizada o de funciones en
aplicaciones informáticas como Excel). Seguidamente generamos una muestra de la
población y obtenemos su Media, que es igual a 4.5. Si establecemos el intervalo alrededor
de la Media muestral, el parámetro poblacional (5.1) está incluido dentro de sus límites:
Ahora bien, la distancia de un punto A a un punto B es la misma que de B a A. Por esa
razón, la distancia desde m a la Media muestral es la misma que va de la Media muestral a
m. En consecuencia, si hacemos un muestreo con un número grande de muestras
observamos que el 95% de las veces (aproximadamente) el valor de la Media de la
población (m) se encuentra dentro del intervalo definido alrededor de cada uno de los
valores de la Media muestral. El porcentaje de veces que el valor de m se halla dentro de
alguno de los intervalos de confianza es del 95%, y es denominado nivel de confianza.
Si queremos establecer un intervalo de confianza en que el % de veces que m se halle

dentro del intervalo sea igual al 99%, la expresión anterior es:
(Obtenemos el valor +-2.58 que multiplica la Desviación Típica de la distribución muestral

en las tablas de la distribución Normal estandarizada o de funciones en aplicaciones
informáticas como Excel), y son los valores cuya función de probabilidad es igual a 0.995 y
0.005 respectivamente).
Estimación de un Total
Estimación (o estimar) es el proceso de encontrar una aproximación sobre una medida, lo
que se ha de valorar con algún propósito es utilizable incluso si los datos de entrada pueden
estar incompletos, incierto, o inestables. En el ámbito de la estadística estimación implica »
usar el valor de una estadística derivada de una muestra para estimar el valor de
un parámetro correspondiente a población»; la muestra establece que la información puede
ser proyectada a través de diversos factores, formal o informalmente, son procesos para
determinar una gama muy probablemente y descubrir la información que falta. Cuando una
estimación resulta ser incorrecta, se denomina “overestimate” si la estimación superó el
resultado real y una subestimación si la estimación se quedó corto del resultado real.
Las estimaciones de manera similar se pueden generar mediante la proyección de los

resultados de encuestas o encuestas sobre la población total; al hacer una estimación, lo
más a menudo es que el objetivo es útil para generar un rango de posibles resultados, y esa
cualidad es suficiente para ser útil, pero no es necesario que por lo que es probable que sea
incorrecto.
Por ejemplo, al tratar de adivinar el número de caramelos contenidos en un frasco si el
cincuenta por ciento eran visibles y el volumen general de la jarra sobre parecía ser veinte
veces tan grande como el recipiente de volumen que contiene los caramelos visibles, a
continuación, un proyecto simple mide que había un millar de caramelos en el frasco; tal
proyección, previsto para recoger el único valor que se cree que es más cercano al valor
real se llama una estimación puntual.
Sin embargo, el punto de estimación es probable que sea incorrecto, debido a que el tamaño
de la muestra (en este caso, el número de caramelos son visibles), es un número demasiado
pequeño para estar seguro de que no que contienen anomalías que difieren de la población
en su conjunto; este concepto es correspondiente a una estimación de intervalo que captura
una gama mucho más amplia de posibilidades, pero es demasiado amplio para ser útil.
REFERENCIA BIBLIOGRAFICA
http://humanidades.cchs.csic.es/cchs/web_UAE/muestreo/muestreo.html
https://www.chospab.es/calidad/archivos/Metodos/Muestreo.pdf
https://enciclopediaeconomica.com/muestreo-probabilistico/
https://definicion.de/estadigrafo/
https://support.minitab.com/es-mx/minitab/18/help-and-how-to/statistics/basic-statistics/
supporting-topics/data-concepts/what-are-parameters-parameter-estimates-and-sampling-
distributions/
https://www.questionpro.com/blog/es/muestreo-no-probabilistico/
https://www.questionpro.com/blog/es/como-realizar-un-muestreo-probabilistico/
https://explorable.com/es/muestreo-de-poblacion
http://asignatura.us.es/dadpsico/apuntes/Muestreo.pdf
http://www.hrc.es/bioest/esti_medias.html
https://explorable.com/es/tamano-de-la-muestra
https://economipedia.com/definiciones/estimacion-de-parametros.html
https://www.questionpro.com/blog/es/muestreo-aleatorio-simple/
http://asignatura.us.es/dadpsico/apuntes/EstimacionEstadistica.pdf

Investigacion Estadistica

Cargado por

Copyright:

Formatos disponibles

Investigacion Estadistica

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Investigacion Estadistica

Cargado por

Copyright:

Formatos disponibles

UNIVERSIDAD DA VINCI DE GUATEMALA

Facultad de Ciencias Criminológicas y Criminalísticas

Baltazar Yovany Domingo Hurtado

Huehuetenango, noviembre 2021

El muestreo, en otras palabras, es el procedimiento mediante el cual se toman a ciertos

o La técnica de selección de elementos de investigación.

El muestreo es una herramienta de la investigación científica. Su función básica es

Ayuda a obtener información fiable de la población a partir de una muestra de la que

Estudia el comportamiento y las opiniones de toda una población analizando únicamente

Arroja resultados que se pueden utilizar para concluir un determinado estudio X de

 Ahorro de dinero debido a que se consideran menos unidades para trabajar.

Existe menos personal necesario para hacer las mediciones (u observaciones).

Es un subconjunto de datos perteneciente a una población de datos. Estadísticamente

En estadísticas, la muestra es una porción extraída mediante métodos específicos que

Como un subgrupo o subconjunto representativo de la población, extraída seleccionada por

Las muestras se obtienen con la intención de inferir propiedades de la totalidad de la

La muestra, desde el punto de vista más genérico de la palabra, se trata de una

El muestreo probabilístico es una técnica de muestreo en la que un investigador establece

Las observaciones son seleccionadas en base a la aleatoriedad, es decir, al azar. En esta

Por conglomerados o clústeres:

Por ejemplo, tenemos a 1000 participantes de toda la población de México, supongamos

 Reducir el sesgo de la muestra: Mediante los métodos de muestreo probabilístico,

 Población diversa: Cuando la población es vasta y diversa, es esencial tener una

 Crear una muestra precisa: El muestreo probabilístico ayuda a los investigadores

El muestreo no probabilístico es una técnica de muestreo en la cual el investigador

TIPOS DE MUESTREO NO PROBABILÍSTICO

Muestreo por conveniencia: El muestreo por conveniencia es una técnica de muestreo no

Idealmente, en la investigación, es bueno analizar muestras que representen a la población.

Muestreo consecutivo: Esta técnica de muestreo no probabilística es muy similar al

Muestreo por cuotas: Hipotéticamente, supongamos que un investigador desea estudiar

Muestreo intencional o por juicio: En esta técnica de muestreo no probabilístico, las

¿Cuándo usar el muestreo no probabilístico?

Esta técnica de muestreo es ampliamente utilizada cuando los investigadores realizan

Ventajas del muestreo no probabilístico

Comúnmente los participantes están motivados para responder rápidamente en

Desventajas del muestreo no probabilístico

Al elegir una muestra en un muestreo no probabilístico, los investigadores deben tener

Una población estadística es el total de individuos o conjunto de ellos que presentan o

Tipos de población estadística

 Población estadística finita: Es aquella en la que el número de valores que la

Un parámetro es un elemento de un sistema que permite clasificarlo y poder evaluar

Los parámetros estadísticos dan un buen resumen cuando se conoce la distribución de la

Ejemplos de parámetros estadísticos son el promedio, la mediana, la desviación estándar o

Medidas de tendencia central

 Media aritmética: La media es el valor promedio de la muestra. También se puede

 Mediana: La mediana es el valor que separa la mitad superior de la muestra y la

 Rango o recorrido: El rango es la diferencia entre el mayor y el menor de los valores

 Desviación media: La desviación media es la media de los valores absolutos de las

 Varianza: La varianza es el promedio del cuadrado de las desviaciones respecto a la

 Desviación estándar: La desviación estándar es la raíz cuadrada de la varianza. Este

Dependiendo el valor de n, los cuartiles pueden tener nombres particulares:

o Cuartiles: Estos dividen los datos en cuatro partes iguales.

La estadística llama estadígrafos o estadísticos a números resúmenes, que permiten

para poblaciones cualesquiera. Es decir es el error típico, o error estándar de la

¿Cómo usamos esto en nuestro problema de estimación?

una normal de media m y desviación s se transforma en una z.

podremos construir intervalos de la

para los que la probabilidad es 1 - a.

Teniendo en cuenta la simetría de la normal y manipulando algebraicamente