EST-110 Unidad 1
EST-110 Unidad 1
EST-110 Unidad 1
FUNDAMENTOS DE ESTADÍSTICA
(EST-110)
CONCEPTOS, EJEMPLOS Y EJERCICIOS DE ESTADÍSTICA
SEMESTRE 2020-2
PROF. JOEL PATIÑO DE LOS SANTOS
TEMA 1. INTRODUCCIÓN
1. ¿QUÉ ES LA ESTADÍSTICA?
La estadística es generalmente considerada como una colección de hechos numéricos expresados en
términos de una relación resumida y que han sido recopilados a través de varias observaciones o a
partir de otros datos numéricos. Es decir, que la estadística es considerada como un conjunto de
métodos para tratar datos numéricos, lo cual implica que la estadística es un instrumento para la
recolección, organización, y análisis de datos numéricos.
Es difícil proponer una definición precisa del concepto de estadística, debido a lo extenso y variado
del campo cubierto por ésta. Sin embargo, podríamos simplificar diciendo que La Estadística es la
ciencia que utiliza un conjunto de métodos, para el estudio numérico de las colectividades, siempre
y cuando, estas puedan ser contadas, clasificadas, ordenadas y analizadas de acuerdo a ciertas
características comunes.
Otra definición aceptada es la siguiente, La estadística se ocupa de los métodos científicos que se
utilizan para recolectar, organizar, resumir, presentar y analizar datos, así como para obtener
conclusiones válidas y tomar decisiones razonables con base en este análisis.
Definir la estadística es una tarea difícil porque tendríamos que definir cada una de las técnicas que
se emplean en los diferentes campos en los que interviene. Sin embargo, diremos, en forma general,
que la estadística es un conjunto de técnicas que, partiendo de la observación de fenómenos,
permiten al investigador obtener conclusiones útiles sobre ellos.
2. RESEÑA HISTÓRICA DE LA ESTADÍSTICA. (Escrito por el Prof. Alberto Estrella Contreras, UASD)
Los comienzos de la estadística pueden ser hallados en el antiguo Egipto, cuyos faraones lograron
recopilar, hacia el año 3050 antes de Cristo, prolijos datos relativos a la población y la riqueza del
país. De acuerdo al historiador griego Heródoto, dicho registro de riqueza y población se hizo con el
objetivo de preparar la construcción de las pirámides. En el mismo Egipto, Ramsés II hizo un censo
de las tierras con el objeto de verificar un nuevo reparto.
En el antiguo Israel la Biblia da referencias, en el libro de los Números, de los datos estadísticos
obtenidos en dos recuentos de la población hebrea. El rey David por otra parte, ordenó a Joab,
general del ejército hacer un censo de Israel con la finalidad de conocer el número de la población 1.
También los chinos efectuaron censos hace más de cuarenta siglos. Los griegos efectuaron censos
periódicamente con fines tributarios, sociales (división de tierras) y militares (cálculo de recursos y
hombres disponibles). La investigación histórica revela que se realizaron 69 censos para calcular los
impuestos, determinar los derechos de voto y ponderar la potencia guerrera.
Pero fueron los romanos, maestros de la organización política, quienes mejor supieron emplear los
recursos de la estadística. Cada cinco años realizaban un censo de la población y sus funcionarios
públicos tenían la obligación de anotar nacimientos, defunciones y matrimonios, sin olvidar los
recuentos periódicos del ganado y de las riquezas contenidas en las tierras conquistadas. Para el
nacimiento de Cristo sucedía uno de estos empadronamientos de la población bajo la autoridad del
imperio2.
1
La Biblia, Libro 2do. de Samuel, Capítulo 24
2
Ídem, Libro Evangelio de San Lucas, Capítulo 2
1
Durante los mil años siguientes a la caída del imperio Romano se realizaron muy pocas operaciones
Estadísticas, con la notable excepción de las relaciones de tierras pertenecientes a la Iglesia,
compiladas por Pipino el Breve en el 758 y por Carlomagno en el 762 DC. Durante el siglo IX se
realizaron en Francia algunos censos parciales de siervos. En Inglaterra, Guillermo el Conquistador
recopiló el Domesday Book o libro del Gran Catastro para el año 1086, un documento de la propiedad,
extensión y valor de las tierras de Inglaterra. Esa obra fue el primer compendio estadístico de
Inglaterra3.
Durante los siglos XV, XVI, y XVII, hombres como Leonardo de Vinci, Nicolás Copérnico, Galileo,
Neper, William Harvey, Sir Francis Bacon y René Descartes, hicieron grandes operaciones al método
científico, de tal forma que cuando se crearon los Estados Nacionales y surgió como fuerza el
comercio internacional existía ya un método capaz de aplicarse a los datos económicos.
Para el año 1532 empezaron a registrarse en Inglaterra las defunciones debido al temor que Enrique
VII tenía por la peste. Más o menos por la misma época, en Francia la ley exigió a los clérigos registrar
los bautismos, fallecimientos y matrimonios. Durante un brote de peste que apareció a fines de la
década de 1500, el gobierno inglés comenzó a publicar estadística semanales de los decesos. Esa
costumbre continuó muchos años, y en 1632 estos Bills of Mortality (Cuentas de Mortalidad)
contenían los nacimientos y fallecimientos por sexo. En 1662, el capitán John Graunt usó
documentos que abarcaban treinta años y efectuó predicciones sobre el número de personas que
morirían de varias enfermedades y sobre las proporciones de nacimientos de varones y mujeres que
cabía esperar. El trabajo de Graunt, condensado en su obra Natural and Political
Observations...Made upon the Bills of Mortality (Observaciones Políticas y Naturales... Hechas a partir
de las Cuentas de Mortalidad), fue un esfuerzo innovador en el análisis estadístico.
Por el año 1540 el alemán Sebastián Muster realizó una compilación estadística de los recursos
nacionales, comprensiva de datos sobre organización política, instrucciones sociales, comercio y
poderío militar. Durante el siglo XVII aportó indicaciones más concretas de métodos de observación
y análisis cuantitativo y amplió los campos de la inferencia y la teoría Estadística.
Los eruditos del siglo XVII demostraron especial interés por la Estadística Demográfica como
resultado de la especulación sobre si la población aumentaba, decrecía o permanecía estática.
En los tiempos modernos tales métodos fueron resucitados por algunos reyes que necesitaban
conocer las riquezas monetarias y el potencial humano de sus respectivos países. El primer empleo
de los datos estadísticos para fines ajenos a la política tuvo lugar en 1691 y estuvo a cargo de Gaspar
Neumann, un profesor alemán que vivía en Breslau. Este investigador se propuso destruir la antigua
creencia popular de que en los años terminados en siete moría más gente que en los restantes, y
para lograrlo hurgó pacientemente en los archivos parroquiales de la ciudad. Después de revisar
miles de partidas de defunción pudo demostrar que en tales años no fallecían más personas que en
los demás. Los procedimientos de Neumann fueron conocidos por el astrónomo inglés Halley,
descubridor del cometa que lleva su nombre, quien los aplicó al estudio de la vida humana. Sus
cálculos sirvieron de base para las tablas de mortalidad que hoy utilizan todas las compañías de
seguros.
Durante el siglo XVII y principios del XVIII, matemáticos como Bernoulli, Francis Maseres, Lagrange y
3
Richard I. Levin, Estadística para Administradores, 2da. Edición 1988. Pág. 6
2
Laplace desarrollaron la teoría de probabilidades. No obstante, durante cierto tiempo, la teoría de
las probabilidades limitó su aplicación a los juegos de azar y hasta el siglo XVIII no comenzó a aplicarse
a los grandes problemas científicos.
Jacques Quételect es quien aplica las Estadísticas a las ciencias sociales. Este interpretó la teoría de
la probabilidad para su uso en las ciencias sociales y resolver la aplicación del principio de promedios
y de la variabilidad a los fenómenos sociales. Quételect fue el primero en realizar la aplicación
práctica de todo el método Estadístico, entonces conocido, a las diversas ramas de la ciencia.
Los progresos más recientes en el campo de la Estadística se refieren al ulterior desarrollo del cálculo
de probabilidades, particularmente en la rama denominada indeterminismo o relatividad, se ha
demostrado que el determinismo fue reconocido en la Física como resultado de las investigaciones
atómicas y que este principio se juzga aplicable tanto a las ciencias sociales como a las físicas.
La escuela inglesa proporciona un nuevo progreso al superar la fase puramente descriptiva. Sus
tres principales representantes son Graunt, Petty y Halley. El penúltimo es autor de la famosa
Aritmética Política.
3
Chaptal, ministro del interior francés, publica en 1801 el primer censo general de población,
desarrolla los estudios industriales, de las producciones y los cambios, haciéndose sistemáticos
durantes las dos terceras partes del siglo XIX.
De acuerdo a Alberto Estrella Contreras, la historia de la Estadística en nuestro país se divide en cinco
períodos a saber. Estos comprenden desde el descubrimiento de América hasta la antesala de la
independencia (1492-1843), desde la independencia hasta 1904, desde el año siguiente hasta el
segundo período de Trujillo (1905-1934), desde 1935 hasta 1960 y finalmente del 1961 hasta el
presente.
Entretanto, la Iglesia sigue valiéndose de los censos parroquiales para estimar la población y se
realizan los Censos Parroquiales de 1863 y 1887. Un indicador del avance en cuanto a la
importancia y necesidad de la Estadística, lo constituye el “Censo de Población y otros datos
Estadísticos de la ciudad de Santo Domingo” levantado el 6 de diciembre de 1892 patrocinado
por un grupo de dominicanos altruistas.
La oficina de Estadística se crea por la resolución 4607 del 9 de Septiembre de 1905 siendo
presidente de la República Carlos Morales Languasco. La limitante mayor de esta resolución
radica en que no obliga a los ciudadanos a proveer la información necesaria a la oficina de
estadística, sino que obliga a la oficina a “requerir de los particulares todos los datos que éstos
puedan suministrarles”. Esta ley por tanto fue derogada por la 4879 de fecha 3 de junio de 1909,
llamada “Ley sobre Estadística Nacional” la cual mejora sustancialmente la de 1905. Esta ley
establece además de las obligaciones de proveer información la creación de las secciones que
forman parte de la oficina de Estadística:
4
1.- Sección de Estadística Demográfica.
2.- Sección de Censo.
3.- Sección Sociográfica.
4.- Sección Comercial y Administrativa.
El 24 de diciembre del 1920 se levantó el primer Censo Nacional de la población, tarea efectuada
por las fuerzas invasoras norteamericanas.
Don Vicente Tolentino Rojas, considerado uno de los padres de la Estadística en la República
Dominicana, ocupó la dirección de la oficina de Estadística desde el 1ro. de enero de 1936 hasta
el año 1948.
En 1940 se autorizó efectuar el Censo Agropecuario Nacional mediante decreto 389 del Poder
Ejecutivo. En 1943, mediante la ley 318 del 8 de julio, se estableció el levantamiento cada 15
años de un Censo Nacional que incluye los de población, edificios y viviendas, agropecuarios, de
industria y comercio y aquellos que el Poder Ejecutivo disponga en su oportunidad.
A partir de 1944 se realizó el Curso de Formación de Estadística del Caribe representado por la
Universidad Autónoma de Santo Domingo y el Instituto Interamericano de Estadística,
constituyendo así el primer curso de Estadística dictado en el país. En 1946 se creó la primera
cátedra de Estadística a nivel universitario, siendo el profesor de la misma, hasta 1948, Don
Vicente Tolentino Rojas.
En 1948, para atender los problemas propios de la planificación y ejecución de los Censos
Nacionales, se creó mediante decreto 5137 del 26 de mayo, la Oficina Nacional de Censo,
dependiente de la Dirección General de Estadística. A partir de 1950, el país viene efectuando
cada diez años censos de población y agropecuarios.
La estadística (la forma femenina del alemán Statistik, y este derivado del italiano statista 'hombre
de Estado')4 es una ciencia formal y una herramienta que estudia usos y análisis provenientes de una
muestra representativa de datos, busca explicar las correlaciones y dependencias de un fenómeno
físico o natural, de ocurrencia en forma aleatoria o condicional.
4
Real Academia Española (2014). «estadística». Diccionario de la lengua española (23.ª edición). Madrid: Espasa.
5
aumenta el valor intrínseco de la palabra, por cuanto la estadística revela el sentido cuantitativo de
las más variadas situaciones.
• Estadística, hace referencia la ciencia en sí, es decir, a las definiciones que se ofrecen en el punto
1 de este documento, (¿Qué Es La Estadística?).
• Estadística Inferencial: se deriva de muestras, de observaciones hechas sólo acerca de una parte
de un conjunto numeroso de elementos y esto implica que su análisis requiere de
generalizaciones que van más allá de los datos. Como consecuencia, la característica más
importante del reciente crecimiento de la estadística ha sido un cambio en el énfasis de los
métodos que describen a métodos que sirven para hacer generalizaciones. La Estadística
Inferencial investiga o analiza una población partiendo de una muestra tomada.
Una población, es el conjunto de todos los elementos o unidades de interés para un estudio
determinado. Esta se representa con la letra (N).
Algunos ejemplos:
• El conjunto de las amas de casa que habitan en determinada ciudad sería una población si se
tratara de determinar su nivel de aceptación para cierto producto de limpieza.
• El conjunto de las piezas fabricadas por cierta máquina sería una población si se buscara
determinar el porcentaje de artículos defectuosos que produce.
• El total de estudiantes de un curso si se desea conocer la cantidad promedio de días de
ausencias de los estudiantes del curso.
• El total de los habitantes de un país es la población que se considera cuando se lleva a cabo
un censo de ese país.
Como puede verse, el concepto de población es relativo pues su definición depende de lo que se
pretende estudiar. Debe definirse con cuidado cuál es la población (o universo) que se desea estudiar.
Una muestra, es un subconjunto de los elementos de una población. La principal característica que
debe tener una muestra estadística útil es: ser representativa de la población de donde se extrae,
porque el principal propósito de la obtención de muestras consiste en hacer inferencias sobre la
población correspondiente. Esta se representa con la letra (n).
6
7. PARÁMETRO. ESTIMADOR O ESTADÍSTICO.
Parámetro. Es una medida de una población, por ejemplo, el promedio del ingreso por hogar en la
población.
Estimador o estadístico. Es una medida de una muestra, por ejemplo, el promedio del ingreso por
hogar en la muestra.
Esta diferenciación es muy importante porque no es lo mismo la media de la muestra que la media
de la población porque, por lo general, en estadística inferencial se utiliza el estadístico (la media
muestral) para inferir (estimar) el valor del parámetro (la media de la población) que en muchos casos
se desconoce.
Llamamos Variable a una característica de las unidades de análisis que puede asumir diferentes
valores en cada una de ellas. Las variables son los aspectos de los individuos que se someten a
comparación; su cualidad central es la que le da nombre: la de variar.
Una variable estadística es cada una de las características o cualidades que poseen los individuos de
una población.
En cada individuo (en cada unidad de análisis) la variable asume un valor que puede ser el mismo o
diferente del de otro individuo. Así, la edad puede asumir el valor “21” para una persona y “20” para
otra, el régimen político puede ser “democracia presidencialista” en un país y “monarquía
parlamentaria” en otro. Una persona puede tardar 2 segundos en reconocer una imagen y otra tardar
2,5 segundos; allí diremos que la variable “tiempo para reconocer la imagen, expresado en segundos”
asume el valor 2 para la primera persona y 2,5 para la segunda.
7
Una variable discreta es aquella que toma valores aislados, es decir no admite valores
intermedios entre dos valores específicos. Por ejemplo: El número de hermanos de 5 amigos:
2, 1, 0, 1, 3.
Una variable continua es aquella que puede tomar valores comprendidos entre dos números.
Por ejemplo: La altura, en metros, de los 5 amigos: 1.73, 1.82, 1.77, 1.69, 1.75. En la práctica
medimos la altura con dos decimales, pero también se podría dar con tres decimales.
9. NIVELES DE MEDICIÓN. ESCALA NOMINAL. ESCALA ORDINAL. ESCALA POR INTERVALO. ESCALA DE
RAZÓN.
Según la mayor o menor arbitrariedad que exista en la relación que liga los números a las categorías,
hablaremos de niveles de medición. Una forma diferente de decirlo es que, según cuánta restricción
haya en la asignación de los números a las categorías, será el nivel de medición de las variables.
Escala Nominal: Una variable está medida a nivel nominal cuando presenta modalidades no
numéricas que no admiten un criterio de orden. Por ejemplo: El estado civil, con las siguientes
modalidades: soltero, casado, separado, divorciado y viudo. Sexo de una persona, Masculino o
Femenino.
Escala Ordinal: Una variable está medida a nivel ordinal si los valores de la variable son asignados de
manera que respeten el orden según aumenta la característica que la variable mide, es decir,
presenta modalidades no numéricas, en las que existe un orden. Estos números designan las
categorías y son expresión de la jerarquía que hay entre ellas. Por ejemplo:
La nota en un examen: reprobado, aprobado, notable, sobresaliente.
Curso al que pertenece un estudiante: 1ro, 2do, 3ro, 4to, 5to, 6to, 7mo, 8vo.
Medallas de una prueba deportiva: oro, plata, bronce.
Escala por Intervalo: Incluye todas las características del nivel ordinal, pero, además, la diferencia
entre valores constituye una magnitud constante. Un ejemplo de nivel de intervalo de medición es la
temperatura. Las clasificaciones de datos se ordenan de acuerdo con el grado que posea de la
característica en cuestión. Además, diferencias iguales en la característica representan diferencias
iguales en las mediciones. En ésta pueden realizarse todas las operaciones aritméticas (adición,
sustracción, división y multiplicación).
8
Escala de Razón: más potente de las 4, tiene todas las capacidades de la escala de intervalo más una
característica adicional: posee un cero absoluto que señala la carencia total de la característica que
se mide.
Ejemplos de la escala de razón de medición incluyen salarios, unidades de producción, peso, cambios
en los precios de las acciones, la distancia entre sucursales y la altura. El dinero ilustra bien el caso.
Si tiene cero pesos, entonces no tiene dinero. El peso de una persona constituye otro ejemplo, ya
que, si una persona tiene peso 0, entonces, podríamos decir que esta persona no existe.
Fuente de datos, es de donde provienen o emanan los datos recolectados para el estudio de la
población o muestra. Se clasifican en Primaria o Secundarias.
Fuentes Primarias (o directas): son los datos obtenidos "de primera mano", por el propio
investigador, recogiéndolos (produciéndolos) con sus propios instrumentos o, en el caso de búsqueda
bibliográfica, por artículos científicos, monografías, tesis, libros o artículos de revistas especializadas
originales, no interpretados por otros.
Una fuente primaria es aquella que provee un testimonio o evidencia directa sobre el tema de
investigación. Las fuentes primarias son escritas durante el tiempo que se está estudiando o por la
persona directamente envuelta en el evento. La naturaleza y valor de la fuente no puede ser
determinado sin referencia al tema o pregunta que se está tratando de contestar. Las fuentes
primarias ofrecen un punto de vista desde adentro del evento en particular o periodo de tiempo que
se está estudiando.
Una fuente secundaria interpreta y analiza fuentes primarias. Las fuentes secundarias están a un paso
distanciadas de las fuentes primarias. Algunos tipos de fuentes secundarias son: libros de texto,
artículos de revistas, crítica literaria y comentarios, enciclopedias, biografías, entre otras.
Como ya se dijo en el punto 1, la estadística es la ciencia que usa un conjunto de métodos para el
estudio numérico de las colectividades, siempre y cuando éstas puedan ser contadas, ordenadas,
clasificadas y analizadas de acuerdo a ciertas características comunes. Coherentes con ésta
definición, se puede decir que los pasos que sigue una investigación estadística son los siguientes:
- Planeación de la investigación.
- Recolección o recopilación de los datos.
- Organización de los datos.
- Presentación de los datos.
- Análisis de los datos presentados
- Conclusiones e interpretaciones.
a) Planeación de la investigación.
Este es el primer paso de toda investigación estadística. Toda recolección de datos estadísticos
requiere de un plan que detalle los aspectos que la investigación quiere abarcar, que fije el
procedimiento que se va a seguir y que resuelva las posibles dificultades que puedan presentarse
a lo largo de la investigación.
9
La planeación de una investigación estadística para que sea exitosa se debe basar
fundamentalmente en los siguientes aspectos:
- Definir la naturaleza del problema
- Justificar la investigación
- Determinar los objetivos generales y específicos
- Definir los términos que se deben utilizar
- Estudio bibliográfico
- Metodología a utilizar en la investigación
- Diseño de los planes de recolección
- Evaluación de la investigación
f) Conclusiones e interpretaciones.
Es este el último paso que sigue una investigación estadística. La interpretación de la información,
es un campo que compete a personas especializadas en el tema que es materia de investigación,
como es el caso de estadísticas como las: demográficas, culturales, educativas, delictivas, etc.
10
12. NOTACIÓN SUMATORIA SIMPLE. PROPIEDADES OPERATORIAS GENERALES DE LA SUMATORIA
SIMPLE.
La sumatoria es un operador matemático, representado por la letra griega sigma mayúscula (∑) que
permite representar de manera abreviada sumas con muchos sumandos, con un número
indeterminado (representado por alguna letra) de ellos, o incluso con infinitos sumandos. Los
sumandos de un sumatorio se expresan generalmente como una variable (habitualmente x, y, z, . . .)
cuyos valores dependen de un índice (habitualmente i, j, k . . .) que toma valores enteros. El índice
empieza tomando el valor que aparece en la parte inferior del sumatorio y se va incrementando en
una unidad hasta llegar al valor que aparece en la parte superior del sumatorio.
representa la suma de los valores de la variable x desde el primero hasta el tercero. En general,
representa la suma de los primeros n valores de la variable x. La expresión anterior se lee: “sumatoria
de x sub-i desde i igual a 1 hasta n”.
El sumatorio es simplemente una manera abreviada de representar una suma, y, por lo tanto, cumple
todas las propiedades de ésta:
11
EJEMPLOS DE NOTACION SUMATORIA
12
Tema 1. EJERCICIOS PROPUESTOS
Nombre: _________________________________________________ Matrícula: _____________________
2. En los siguientes casos determine si el grupo representa una muestra o una población.
a) Los participantes en el estudio de un nuevo medicamento para el colesterol.
b) Los conductores que recibieron una multa por exceso de velocidad en la ciudad el último mes.
d) Las 15 personas detenidas de todas las personas detenidas por una patrulla policial.
5. Explique la diferencia entre variable discreta y continua. Proporcione un ejemplo de cada una que no
aparezca en el texto.
13
6. Ubique las variables en las siguientes tablas de clasificación. Resuma en cada tabla sus observaciones y
evalúe si los resultados son verdaderos. Por ejemplo, el salario se presenta como una variable cuantitativa
continua.
a) Salario g) Lugar que ocupa un estudiante en clase
b) Sexo h) Calificaciones de un profesor de matemáticas
c) Volumen de ventas de libros de texto i) Cantidad de computadoras en un hogar
d) Preferencia por una marca de refrescos j) Cantidad de personas juzgadas en un mes
e) Temperatura k) Cantidad de delitos cometidos por una persona
f) Resultados de un examen de test psicológico l) Cantidad de personas liberadas por un juez
Cualitativa
Cuantitativa
Dado los siguientes valores a la variable (X), calcule las siguientes sumatorias.
X 7 1 5 3 8 2 12 4 2 Y 3 2 5 4 6 1 1 2 4
A) ∑ 𝑋
B) ∑ 𝑋 ∗ 𝑌
14