Descargue como DOCX, PDF, TXT o lea en línea desde Scribd
Descargar como docx, pdf o txt
Está en la página 1de 7
INSTITUTO TECNOLÓGICO
DE PACHUCA
CARRERA: INGENIERÍA QUÍMICA
MATERIA: ANÁLISIS DE DATOS EXPERIMENTALES
TEMA 1: ESTADÍSTICA DESCRIPTIVA Y FUNDAMENTOS
DE PROBABILIDAD
REPORTE
DOCENTE: GUERRERO ORTIZ ELODIA CLAUDIA
ALUMNA: ORTIZ CAMPUZANO JIMENA
CONCEPTOS EXPUESTOS EN CLASE Estadística: Ciencia inductiva que permite inferir características cualitativas y cuantitativas de un conjunto mediante datos contenidos en un subconjunto del mismo. El objetivo fundamental de la estadística es analizar datos y transformarlos en información útil Estadística descriptiva: Técnica para recopilar, organizar, procesar y presentar datos obtenidos en muestras. Estadística inferencial: Técnicas para obtención de resultados basados en la información contenida en muestras. Media: Medida de tendencia central en estadística puede ser excesivamente influenciada por valores externos. Moda: No es una medida de tendencia central y puede haber más de una moda o ninguna es el valor con la frecuencia más allá. Mediana: Valor central de una serie de datos y es aquel que divide a una serie de tal manera que el 50% de los valores son iguales o menores al 50% de los valores son mayores o iguales a él, es un valor posicional se ve menos afectada por valores extremos dentro del grupo en comparación con la media. Muestra: Subconjunto de la población y contiene elementos en los cuales debe estudiarse la característica de interés para la población. Variable: Representación simbólica de alguna característica observable de los elementos de una población y que pueden tomar diferentes valores. Muestreo aleatorio o probalístico: Son los más fiables y representativas de la población al realizarse la selección de los elementos de la muestra de manera aleatoria. Muestreo no aleatorio o no probalístico: Se eligen determinados criterios que no están basados en la equiprobabilidad para la selección de los elementos de la muestra. Son menos fiables que los aleatorios, porque su nivel de representatividad de la población es menor. Medidas de tendencia central para datos agrupados y no agrupados: Son números que definen cual es el valor alrededor del que se concentran los datos. Los más utilizados: Media, Moda, Mediana. Dato: Hechos, eventos, transacciones, etc. Que han sido registrados y comunicados de tal manera que pueden ser obtenidos e interpretados. Frecuencia: Es el número de veces que ocurre un valor en el conjunto de datos. Es la medida en las que se muestra cuantas veces ocurre un dato o un valor. Variables cualitativas: Miden atributos, por ejemplo el género, cuyas modalidades de respuesta son hombre y mujer y el grupo sanguíneo (A, B, AB y O). Variables cuantitativas: Se caracteriza porque las modalidades de respuesta representan números reales. 1. Discreta: Cuando entre dos valores o modalidades de respuesta existe un número finito de valores posibles. 2. Continua: Cuando entre dos valores posibles existe un número infinito de valores posibles. Población: Conjunto de todos los individuos o elementos individuales de un tipo específico, muestra un sistema científico. Conjunto de elementos en una totalidad de una situación estudiada de forma matemática Técnicas que se muestran en la estadística inferencial: Utiliza técnicas como pruebas de hipótesis, intervalos de confianza y análisis de regresión. Hace inferencias precisas sobre la población a partir de la muestra. Permite que las conclusiones obtenidas de la muestra se apliquen a la población en su conjunto. Medidas de dispersión: Dan información sobre el grado de variabilidad de una variable estadística. 1. Rango: Valor numérico que indica la diferencia entre el valor máximo y el mínimo de una población o muestra estadística. 2. Varianza: Representa la variabilidad de una serie de datos respecto a su medida. Se calcula como la suma de los residuos al cuadrado entre el total de observaciones. 3. Desviación: Ofrece información de la dispersión respecto a la media. Su cálculo es exactamente el mismo que la varianza pero es la raíz cuadrada de la varianza. Medidas de posición: Se utilizan para obtener un valor representativo de un conjunto de datos, como el promedio, o para dividir los datos en segmentos iguales, facilitando su análisis y comprensión. 1. Cuartil: Divide la distribución en cuatro partes iguales así, existen 3 cuartiles los valores inferiores de la distribución se sitúan por debajo del primero (Q1), La mitad o mediana son los valores menores iguales al cuartil (Q2) y los superiores son representados por el cuartil (Q3). 2. Decil: Divide los datos en diez partes iguales. Existen 9 deciles, de D1 a D9. El D5 corresponde con la mediana. Por su lado, los valores superiores o inferiores (equivalentes a los diferentes cuartiles) se sitúan en puntos intermedios entre estos. 3. Percentil: Divide la distribución en cien partes. Hay 99 percentiles tiene a su vez una equivalencia con los deciles y cuartiles. Gráfico en donde se pueden representar datos estadísticos: 1. Gráfico de barras 2. De tarta o diagrama de sectores 3. De dispersión 4. Pictogramas 5. De líneas o diagrama de frecuencias 6. Histogramas 7. De Pareto 8. De mosaico 9. De caja 10. De tallo y hojas Datos agrupados: El tamaño de muestra es demasiado grande con datos diversos, en los cuales pueden ser agrupados en patrones y tendencias. Datos no agrupados: El tamaño de muestra es finito con el número de datos pequeños ordenados en cualitativos y cuantitativos. Probabilidad: Medida numérica que describe la posibilidad de que ocurra un evento específico dentro de un conjunto de eventos posibles. Cálculo matemático para cuantificar oportunidades, posibilidades, fenómenos, sucesos o eventos con un lenguaje preciso. Representación gráfica de datos no agrupados: Son las empleadas para representar una distribución de probabilidad de una variable aleatoria discreta, la gráfica de líneas, histograma, polígono de frecuencias y la gráfica escalonada o la gráfica de frecuencias acumuladas. Factorial: Se designa como un número natural positivo seguido con un signo de exclamación por ejemplo 3! El valor de un factorial es el producto de todos los números desde 1 hasta el número factorial. Permutación: Arreglo ordenado de un conjunto de objetos. Cualquier ordenamiento de los elementos de un conjunto. Arreglo de todo o parte de un conjunto de objetos, subconjunto ordenado. Pk, n. Variación del orden o posición de un conjunto ordenado donde no hay repetición en su arreglo. Combinación: Selección no ordenada de un subconjunto de elementos de un conjunto más grande, es decir las combinaciones representan la elección de elementos sin tener en cuenta el orden en que se seleccionan. CONCEPTOS DE LIBROS Estadística: La ciencia de recolectar, describir e interpretar una cantidad de datos, que se organizan y procesan para brindar información y tomar decisiones o inferir. La estadística procesa gran cantidad de datos, utiliza las bases de la matemática pura y las enlaza con el mundo real. Estadística descriptiva: Se compone de aquellos métodos que incluyen técnicas para recolectar, presentar, analizar e interpretar datos. Tiene como función principal el manejo de datos recopilados en cuanto se refiere a su ordenación y presentación, para poder en evidencia ciertas características en la forma más objetiva y útil. Estadística inferencial: Abarca aquellos métodos y conjuntos de técnicas que se utilizan para obtener conclusiones sobre las leyes de comportamiento de una población basándose en los datos de muestra tomadas de esa población. Media: La medida más popular de la tendencia central es lo que el lego llama un “promedio” y lo que los estadistas llaman media aritmética o solamente media. Esta se define como sigue: La media de n números es la suma de los mismos divididos entre n. Moda: Una de las medidas de posición es la moda, que identifica el valor o intervalo que más se repite. Es decir, la moda o valor modal con mayor frecuencia relativa. Mediana: Es el valor de la variable tal que, una vez ordenados estos valores en orden creciente, ocupa el valor central; es decir, qué el número de datos que precedan a la mediana es igual al que le siguen. La mediana de una variable estadística se representa por M. Muestra: Es una parte de la población y se utiliza cuando ésta tiene un alto costo no se puede acceder a ella. Población: Se entiende como un conjunto de elementos u objetos de interés sobre el cual se realizan las observaciones. Dado que los objetos o cosas cuentan con una finita o infinita de proyecciones, se entiende una población como una característica asociada a los objetos que pertenecen a P. Variables cualitativas: Es una característica que no es susceptible de medida y describe un atributo o cualidad de los objetos de la población. 1. Nominales: No hay un orden establecido en las categorías 2. Ordinales: Existe un orden establecido en las categorías Variables cuantitativas: Es una característica que es susceptible de medida, esto es, son características de los objetos de la población que se pueden medir con un número. 1. Discretas: Si el conjunto de todos los posibles valores que toma es un conjunto finito o contablemente infinito 2. Continua: Si el conjunto de todos los valores posibles que toma es un intervalo continuo de los reales R Medidas de dispersión: Permiten calcular la representatividad de un promedio (media o mediana), para lo cual será preciso cuantificar la distancia de los diferentes valores de la distribución respecto a dicho promedio. A tal distancia es a lo que se denomina variabilidad o dispersión. 1. Rango: Llamamos recorrido o rango, que designamos por R, a la diferencia entre el mayor y el menor de los valores de la variable. 2. Varianza: Llamamos varianza, que detonamos por S 2, a la media de las desviaciones cuadráticas de los valores respecto a la media aritmética. 3. Desviación: se define como la diferencia entre el dato y la media del conjunto de datos de donde proviene dicho dato. Es decir, sean dados los datos x1,..., xn. Medidas de posición: es aquel valor para el cual una porción específica de la distribución queda en o debajo de él. 1. Deciles: Son las medidas de posición relativa correspondiente a un conjunto de datos (ordenado ascendentemente) que está dividido en diez partes, de tal forma que cada parte contiene aproximadamente 10% de las medidas. 2. Cuartiles: Son las medidas de posición relativa correspondiente a un conjunto ordenado de datos divididos en cuatro partes (iguales). 3. Percentiles: Es un valor tal que a lo más un p% de los datos tienen dicho o menos de ese valor y, al menos, un (100 - p) % de los datos tienen este valor o más. Factorial: Dado, un número entero positivo n, diremos que n! es el factorial de n, si n! = n(n-1) (n-2) (n-3)... 3x2x1 Permutaciones: Se llaman permutaciones de n elementos a las distintas agrupaciones que se pueden formar con los n elementos, de tal forma que una agrupación difiera de otra solamente por el orden de colocación de los elementos. Las permutaciones de n elementos pueden ser consideradas como caso particular de variaciones de n elementos tomadas de n en n. Combinaciones: Se llama combinaciones de m elementos tomadas de n en n a las distintas agrupaciones que se pueden formar tomando n elementos de los m de tal forma que una agrupación difiera de otra por la naturaleza de algún elemento. Frecuencia: Es el número de veces que ocurre un valor en el conjunto de datos. Es la medida en las que se muestra cuantas veces ocurre un dato o un valor.