Unidad 1 Mod1 PDF
Unidad 1 Mod1 PDF
Unidad 1 Mod1 PDF
La Estadística es una ciencia que estudia las características de un conjunto de casos para
hallar en ellos regularidades en el comportamiento, que sirven para describir el conjunto y
para efectuar predicciones.
La Estadística tiene por objeto recolectar, organizar, resumir, presentar y analizar datos
relativos a un conjunto de objetos, personas, procesos, etc. A través de la cuantificación y el
ordenamiento de los datos intenta explicar los fenómenos observados, por lo que resulta
una herramienta de suma utilidad para la toma de decisiones.
IMPORTANCIA DE LA ESTADISTICA.
En las últimas décadas la estadística ha alcanzado un alto grado de desarrollo, hasta el
punto de incursionar en la totalidad de las ciencias; inclusive, en la lingüística se aplican
técnicas estadísticas para esclarecer la paternidad de un escrito o los caracteres más
relevantes de un idioma.
La estadística es una ciencia auxiliar para todas las ramas del saber; su utilidad se entiende
mejor si tenemos en cuenta que los quehaceres y decisiones diarias embargan cierto grado
de incertidumbre... y la Estadística ayuda en la incertidumbre, trabaja con ella y nos orienta
para tomar las decisiones con un determinado grado de confianza.
Los críticos de la estadística afirman que a través de ella es posible probar cualquier cosa,
lo cual es un concepto profano que se deriva de la ignorancia en este campo y de lo
polifacético de los métodos estadísticos. Sin embargo muchos "investigadores"
tendenciosos han cometido abusos con la estadística, elaborando "investigaciones" de
intención, teniendo previamente los resultados que les interesan mostrar a personas
ingenuas y desconocedoras de los hechos. Otros, por ignorancia o negligencia, abusan de la
estadística utilizando modelos inapropiados o razonamientos ilógicos y erróneos que
conducen al rotundo fracaso de sus investigaciones
Aplicaciones de la Estadística.
Mucha gente piensa que la Estadística no tiene nada que ver con otras disciplinas que no
sean las ingenierías y economía. Otros nunca le encuentran aplicaciones útiles, y por eso
tampoco les gusta. Pero, en realidad tiene infinitas aplicaciones en todo el conocimiento
adquirido por la humanidad, partiendo ante todo, lo relacionado con las ingenierías,
economía, las ciencias biológicas, ciencias sociales e incluso en algunas ramas del área
Jurídica. Y, en definitiva, casi todos los campos de las ciencias emplean instrumentos
estadísticos de importancia fundamental para el desarrollo de sus modelos de trabajo.
1. La Estadística en el Periodismo
Conocidas son las famosas encuestas de tipo político, que entregan una orientación de la
intención de voto, de la aceptación de un candidato, del impacto de un programa o proyecto
de estado, etc. de una muestra estadística representativa, sobre la opinión de las personas en
un tiempo determinado, teniendo esta herramienta una gran confiabilidad. Así es que el uso
de la estadística es imprescindible para determinar caminos a seguir para los candidatos de
elección popular.
3. La Estadística en la Publicidad
Cuando las grandes marcas trasnacionales y/o nacionales como Coca-cola, Pepsi, Nice,
Adidas, Laboratorios López, etc. nos llenan de slogans, música y colores en sus
comerciales, lo único que buscan es que la gente adquiera los productos y/o servicios que
ofrecen.
En la administración es una herramienta del control, como parte del proceso administrativo
(o lo que es lo mismo: planeación, organización, dirección y control) ya que la estadística
ayuda a recolectar, estudiar y al final interpretar los datos que obtienen al terminar el
proceso administrativo, retroalimenta con esta información y al final se observa en que
pueden mejorar y que se está haciendo bien.
El profesional del seguro de vida ha de ser capaz de asignar primas suficientes para cubrir
las cantidades que habrá de pagar la compañía en el caso de muerte del asegurado. En
consecuencia, la predicción adecuada de las probabilidades de muerte constituye uno de los
ejes centrales de la reducción del riesgo que se asume. Por ello, el objetivo de la Estadística
de Seguros es una presentación exhaustiva de los métodos disponibles para ajustar tablas de
mortalidad y tablas de seguros no vida, ejemplo, aseguramiento de vehículos, viviendas,
etc.
Por otra parte, algunas de las aplicaciones concretas de la Estadística en el sistema bancario
son las siguientes:
Sistemas de concesión de tarjetas de crédito y fijación de su límite.
Sistemas de estimación del potencial económico de los clientes.
Definición de tipologías comerciales de clientes.
Determinación del público objetivo en campañas comerciales.
Modelización del riesgo según las características de los clientes.
Aplicación de la teoría de colas para brindar un servicio de calidad.
Finalmente, es de mucha utilidad la técnica de minería de datos para el análisis de bases
de datos del sistema bancario.
Las ciencias sociales se han visto apabulladas en los últimos años por avances vertiginosos
en informática y aplicaciones estadísticas, por ejemplo, en El Salvador, se ha elaborado el
Mapa de Pobreza, donde se ha interrelacionado una gran variedad de variables de diferentes
áreas: Educativas, Económicas, Salud, entre otras. También, se ha hecho investigación
sobre los factores que están asociados al rendimiento académico de los estudiantes,
finalmente, se han utilizado diferentes técnicas para el análisis de los resultados
académicos de los estudiantes.
Por otra parte la producción química tiene su costo económico y financiero que también
requiere mucho uso de estadística, por ejemplo, si no se elabora un buen diseño
experimental, se necesitarán muchas réplicas para validar una formulación química.
Algunas aplicaciones concretas en esta área son: Determinación del tamaño de poblaciones
naturales en una región; efectividad de la utilización de barreras naturales (filas de árboles
plantados en los límites del terreno) como medio de prevenir las plagas de insectos o aves
sobre las plantaciones y así disminuir la utilización de pesticidas: y, determinación de los
niveles óptimos de utilización de los fertilizantes. Obviamente, en esta área es donde más se
hace usos de la teoría de Diseños de Experimentos.
Permite establecer pautas sobre la evolución de las enfermedades y los enfermos, los
índices de mortalidad asociados a procesos morbosos, el grado de eficacia de un
medicamento, etcétera.
Bajo este conjunto de ideas, se ha presentado un panorama de la utilidad de la estadística,
haciendo un recorrido por diversas áreas del conocimiento humano, con el fin, de conocer
cómo se relacionan con las diversas ciencias, formando una sola verdad. Evidentemente,
existen, muchas disciplinas donde se aplica la estadística, que no han sido consideradas en
este apartado, por ejemplo, las ingenierías, la pintura, la música, etc. Finalmente, es de
resaltar que en todos los temas donde se analice información está presente la estadística.
VARIABLES
Las variables son las características observables de un objeto, problema o evento que se
puede describir según un esquema de medición bien definido. Cada rasgo o aspecto de una
población constituye una variable. La edad de unas personas, su sexo, color de su piel,
nacionalidad, su nivel de motivación, niveles de ansiedad, el número de nacimientos,
número de matrimonios, frecuencia de suicidios, estatura, peso, niveles de inteligencia,
actitudes, entre muchas otras.
1. Escala Nominal
Consiste en clasificar en categorías a los sujetos u objetos, de modo que todos los sujetos u objetos
clasificados dentro de una misma categoría sean equivalentes respecto a la variable o propiedad
que se está midiendo Tras esto, se asignan símbolos o números a las categorías establecidas. Las
categorías utilizadas (que serán tantas como niveles o categorías tenga la variable que se desea
medir) deben reunir tres propiedades: exhaustividad (cada sujeto u objetos pueden ser clasificado en
alguna de las categorías establecidas), complementarias (todos los sujetos u objetos pueden ser
clasificados y cada uno de ellos será el complemento del conjunto universo) y exclusividad (cada
sujeto u objeto pueden ser clasificados en sólo una de las categorías establecidas; las categorías no
se repiten).
Un caso particular, sería la variable color de ojos con las siguientes categorías establecidas café,
azul, verde, negro. A cada uno se le puede asignar símbolos que servirá como etiquetas para
sustituir los nombres que permiten facilitar la estructura de una base de datos y los análisis
respetivos.
Y podemos usar las siguientes etiquetas: A = café, B = azul, C = verde, D = negro; también podría
ser 1 = café, 2 = azul, 3 = verde, 4 = negro.
2. Escala Ordinal
Sea X una característica observable en una población. Diremos que X está medida en la escala
ordinal si, además de la relación de igualdad, la única relación que podemos establecer entre las
modalidades es la relación de orden
Consiste en asignar a los sujetos u objetos medidos un número que permite ordenarlos según la
cantidad en la variable que poseen. En la escala ordinal, además de estar presente la relación de
igualdad- desigualdad propia de la escala nominal, los números asignados permiten afirmar si la
cantidad de variable que posee un sujeto u objeto es mayor que o menor que la cantidad de variable
que posee otro sujeto u objeto cualquiera.
En las ciencias sociales y de la salud es frecuente encontrarse con variables en las que resulta
apropiado utilizar una escala de medida ordinal por ejemplo: Cuando se realizó el Mapa de Pobreza
en El Salvador 1 en el año 2004 se clasificó la pobreza del país de la siguiente manera
No Pobres
Pobreza Relativa
Pobreza Extrema
Se puede ordenar en forma ascendente o descendente, pero no se puede saber si la
diferencia entre dos valores es la misma o diferente entre otros dos valores.
Aquí no hay sentido operaciones algebraicas tales como x i x j ó x i x j . Sólo tienen sentido
las relaciones de igualdad y orden.
3. Escala de intervalos
Este tipo de escala posee las características de ser nominal y ordinal; además la principal
característica que la define es que se puede determinar la magnitud de la diferencia existente entre
dos objetos medidos, los objetos de la variable se pueden distribuir en intervalos igualmente
espaciados, es decir, la unidad de medida está claramente determinada y se asigna a cada objeto
medido un número indicativo que lo ubica en uno y solo un intervalo.
En la escala de intervalo no existe el cero absoluto, es decir, no existe un valor numérico que indique
ausencia total de cantidad de variable
La temperatura, por ejemplo, es una variable que se mide utilizando una escala de intervalo. Cuando
se dice, en escala Celsius, que ayer hubo 20 grados de temperatura máxima y hoy 25, se está
diciendo no sólo que hoy hubo más temperatura que ayer (afirmación propia de la escala ordinal),
sino que hoy hubo 5 grados más de temperatura que ayer. Del mismo modo, 20 grados son 5 más
que 15. La diferencia entre 15 y 20 grados es la misma que entre 20 y 25, y esto va más allá de lo
que puede afirmarse con una escala ordinal. Sin embargo, no es posible afirmar que 20 representen
el doble de temperatura que 10. Esto es debido a que, en la escala Celsius, el punto cero es un
punto arbitrario de la escala y, por tanto, no indica ausencia de cantidad de variable.
4. Escala de Razón
Diremos que una variable esta medida en una escala de razón si a través de un proceso de
medición es posible asignar valores numéricos (valores reales) a la variable, en los que el cero
representa la ausencia de dicha variable. Este tipo de escala posee todas las características de las
escalas anteriores, es decir, es la escala más completa de medición.
Ejemplos de escala de razón son las siguientes: el tiempo, la extensión, el peso, la longitud, la masa,
la intensidad de la corriente eléctrica y otras variables del mundo físico
Tipos de variables:
Las variables pueden adquirir diferentes valores o clasificarse en diferentes categorías
según la naturaleza o tipo de estudio que se lleve a cabo. Entre éstas tenemos las siguientes
clasificaciones:
VARIABLE DISCRETA – cuando el conjunto de valores que toma pueden ser finito o
infinito numerable.
VARIABLE CONTINUA - Son las que pueden asumir cualquier valor en un intervalo
real. Por ejemplo, la edad, altura, peso, etc.
En el campo de la investigación, que se suele examinar las relaciones entre dos o más
variables al investigar un asunto o problema, se clasifican las variables como:
Homogeneidad - que todos los miembros de la población tengan las mismas características
según las variables que se vayan a considerar en el estudio o investigación. Por ejemplo, si
se fuera a investigar la incidencia de la drogadicción entre jóvenes mujeres adolescentes,
entonces hay que definir claramente las edades que comprenden la adolescencia y cuando
se seleccione la población asegurarse de que todas las personas entrevistadas sean de la
edad determinada y del sexo femenino. (La adolescencia se define operacionalmente como
el periodo comprendido de edad que fluctúa entre 12 y 21 años.)
Tiempo - se refiere al período de tiempo donde se ubicaría la población de interés.
Determinar si el estudio es del momento presente o si se va a estudiar a una población de
cinco años atrás o si se van a entrevistar personas de diferentes generaciones.
Espacio - se refiere al lugar donde se ubica la población de interés. Un estudio no puede
ser muy abarcador y por falta de tiempo y recursos hay que limitarlo a un área o comunidad
en específico.
Muestreo con reemplazo: Es aquel en que un elemento puede ser seleccionado más de una
vez en la muestra para ello se extrae un elemento de la población se observa y se devuelve a
la población, por lo que de esta forma se pueden hacer infinitas extracciones de la
población aun siendo esta finita.
Muestreo sin reemplazo: No se devuelve los elementos extraídos a la población hasta que
no se hallan extraídos todos los elementos de la población que conforman la muestra.
Un procedimiento de extraer una muestra aleatoria simple de una población finita es:
enumerar todos los elementos que conforman la población, escribir esos números en
papelitos y echarlos en una urna o bolsa mezclarlos bien removiéndolos y sacar uno a uno
tantos como lo indique el tamaño de la muestra. En este caso los elementos de la muestra lo
constituirán los elementos de la población cuyos números coincidan con los extraídos de la
bolsa o urna.
MARCO MUESTRAL
Una vez definido el universo, se debe recabar información, lo más exacta posible, de sus
dimensiones y distribución espacial y temporal, para con ello poder construir el marco
muestral, que es la base para hacer el diseño de muestreo. El marco muestral es la
información que ubica y dimensiona al universo y puede consistir de censos de vivienda y
mapas agrupados por localidades, barrios, repartos, etc.; mapas de cobertura forestal con
agrupamientos por tipos de vegetación o usos del suelo; listados de viviendas en
localidades pequeñas, etc.
UNIDAD DE MUESTREO
Un concepto básico en la teoría del muestreo, que debe definirse claramente para construir
el marco muestral, es la unidad de muestreo, que es la unidad mínima de observación de
la que se obtendrá información de las variables útiles. Por convención estadística, se usará
"N" para referirnos al número de unidades de muestreo que integran el Universo y "n"
para el número de unidades de muestreo en la muestra. En la siguiente tabla, para cada
sector la unidad de muestreo más conveniente se indica:
- urbana
- rural
Demanda
Industrial
Comercial Establecimiento
Institucional
Directa Parcela
Oferta
Indirecta Establecimiento
Productores
Abastecimiento Transportistas Productores individuales, empresas
Comercializadores
UNIDAD DE ANÁLISIS
Cada una de las entidades a la cual se refiere un dato determinado en un instante dado
respecto de una característica en estudio se denomina Unidad de Análisis. Expresado más
coloquialmente, la unidad de análisis es cada una de las entidades que presenta un valor de
alguno de los atributos observados en el estudio
Tamaño muestral n para estimar una media en una población de tamaño N y asumiendo
normalidad para x (Teorema central de limite)
2
z1 / 2 S x
n
d
2
, S x se obtiene de una muestra piloto de tamaño n , si n n , se
z1 / 2 S x 1
1
d N
complementa la muestra piloto, si no, la muestra piloto es suficiente, el valor d es el error
máximo de estimación ( d x ), los valores de z con confianza del 95%, 90%, 99%
son z = 1.96,1.645, 2.576 respectivamente.
2
z S
Si N es grade ( N ) : n 1 / 2 x
d
Si no se admite normalidad, entonces se utiliza Tchebycheff:
2
Sx
d
n 2
Sx 1
1
d N
Donde 1%,5%,10% son errores permitidos de probabilidad.
Tamaño muestral n para estimar una proporción P en una población de tamaño N con un
error máximo de d porcentual( p P d ) y asumiendo normalidad en p .
(d 2 pqz12 / 2 ) N
n
d 2 N pqz12 / 2
EJEMPLO
Por un estudio realizado tiempo atrás se conocen las varianzas de las notas de
administración diurna y nocturna, las que respectivamente son: 0,31 y 0,28.
Solución
Considerando que las varianzas son similares, se trabaja con muestreo estratificado con
asignación proporcional. El error (B) es 0,15 y para una confiabilidad del 95 por ciento el
valor correspondiente en la distribución normal es 1,96, entonces, k = 1,96:
Una vez determinado el tamaño de la muestra, se reparte entre los estratos utilizando la
expresión 6.27
EJEMPLO
Tomado de1 . En vista de la recesión económica existente, una empresa textil pretende
reducir el número de dial laborables por semana a cuatro. Otra alternativa consiste en
clausurar una de sus tres plantas y despedir a los trabajadores. Para tener una idea de la
opinión de los trabajadores, el gerente de personal de la empresa desea seleccionar una
muestra de empleados de las tres plantas para estimar la proporción de trabajadores que
prefieren la reducción de la semana de trabajo, con un error de estimación máximo de 0,1.
Solución
Al abordar una investigación se debe tener bien definido qué se va a investigar y por qué se
pretende estudiar algo. Es decir, se debe establecer una delimitación clara, concreta e
inteligible sobre el o los fenómenos que se pretenden estudiar, para lo cual se deben tener
en cuenta, entre otras cosas, la revisión bibliográfica del tema, para ver su accesibilidad y
consultar los resultados obtenidos por investigaciones similares, someter nuestras
proposiciones básicas a un análisis lógico; es decir, se debe hacer una ubicación histórica y
teórica del problema.
6. LA RECOLECCIÓN
Una de las etapas más importantes de la investigación es la recolección de la información,
la cual ha de partir, a menos que se tenga experiencia con muestras análogas, de una o
varias muestras piloto en las cuales se pondrán a prueba los cuestionarios y se obtendrá una
aproximación de la variabilidad de la población, con el fin de calcular el tamaño exacto de
la muestra que conduzca a una estimación de los parámetros con la precisión establecida.
El establecimiento de las fuentes y cauces de información, así como la cantidad y
complejidad de las preguntas, de acuerdo con los objetivos de la investigación son
decisiones que se han de tomar teniendo en cuenta la disponibilidad de los recursos
financieros, humanos y de tiempo y las limitaciones que se tengan en la zona geográfica, el
grado de desarrollo, la ausencia de técnica, etc.
Es, entonces, descubrir dónde está la información y cómo y a qué "costo" se puede
conseguir; es determinar si la encuesta se debe aplicar por teléfono, por correo, o si se
necesitan agentes directos que recojan la información; establecer su número óptimo y
preparar su entrenamiento adecuado.
8. LA TABULACIÓN.
Una tabla es un resumen de información respecto a una o más variables, que ofrece claridad
al lector sobre lo que se pretende describir; para su fácil interpretación una tabla debe tener
por lo menos: Un título adecuado el cual debe ser claro y conciso. La Tabla propiamente
dicha con los correspondientes subtítulos internos y la cuantificación de los diferentes ítems
de las variables, y las notas de pie de cuadro que hagan claridad sobre situaciones
especiales de la tabla, u otorguen los créditos a la fuente de la información.
9. LA PRESENTACIÓN
Una información estadística adquiere más claridad cuando se presenta en la forma
adecuada. Los cuadros, tablas y gráficos facilitan el análisis, pero se debe tener cuidado con
las variables que se van a presentar y la forma de hacerlo. No es aconsejable saturar un
informe con tablas y gráficos redundantes que, antes que claridad, crean confusión.
Además la elección de determinada tabla o gráfico para mostrar los resultados, debe
hacerse no sólo en función de las variables que relaciona, sino del lector a quien va dirigido
el informe.
10. EL ANÁLISIS.
La técnica estadística ofrece métodos y procedimientos objetivos que convierten las
especulaciones de primera mano en aseveraciones cuya confiabilidad puede ser evaluada y
ofrecer una premisa medible en la toma de una decisión.
Es el análisis donde se cristaliza la investigación. Esta es la fase de la determinación de los
parámetros y estadísticos muestrales para las estimaciones e inferencias respecto a la
población, el ajuste de modelos y las pruebas de las hipótesis planteadas, con el fin de
establecer y redactar las conclusiones definitivas.
11. PUBLICACIÓN
Toda conclusión es digna de ser comunicada a un auditorio. Es más, hay otros estudiosos
del mismo problema a quienes se les puede aportar información, conocimientos y otros
puntos de vista acerca de él.