Formas de Razonamiento Con Fathom
Formas de Razonamiento Con Fathom
Formas de Razonamiento Con Fathom
Greivin Ramírez A.
[email protected]
Escuela de Matemática
Instituto Tecnológico de de Costa Rica
Resumen
Según Garfield, et al ([3, pág. 300,]), uno de los prerrequisitos que deben tener los estu-
diantes antes de estudiar las distribuciones muestrales, siendo estas la piedra angular de la
inferencia estadística ([16, pág. 277,], [3, pág. 295,]), es la idea de distribución: describir
distribuciones de datos (como la uniforme y la binomial), caracterizar su forma, centro,
dispersión y variabilidad (es el corazón de la estadística según [11], [12], [4], [5], [15]).
Así, esta investigación responde a la pregunta ¿Cuáles son las formas de razonamiento que
muestran estudiantes de maestría de Matemática Educativa al estudiar las distribuciones
uniforme discreta y binomial mediante problemas de simulación en Fathom?
1.1 Introducción
2 Revista digital Matemática, Educación e Internet (www.cidse.itcr.ac.cr/revistamate/). Vol 9, No 2. , 2009.
Sin embargo, son pocas las investigaciones que se han hecho para evaluar la efectividad de
la simulación en los procesos de enseñanza aprendizaje de las distribuciones, por lo que
queda aún mucho camino por andar para evaluar el impacto de la simulación computacional
en este tema ([3], Sánchez, 2002; [10]). La presente investigación busca colaborar en dicha
evaluación.
Según [8], aunque se ha ido incorporando el uso de paquetes estadísticos en los cursos,
se ha manejado una idea tradicional del uso del software que es hacer estadística más que
aprender estadística. Para él:
Fathom: es uno de los paquetes recientes que tiene mayor énfasis en proveer una
atmósfera en el cuál los estudiantes pueden investigar conceptos estadísticos y facilitar
el aprendizaje. Una premisa clave es que todos los aspectos del análisis están vinculados,
entonces los estudiantes pueden ver cómo los cambios que hacen en un área afectan a
otra. Los diseñadores de Fathom han hecho un esfuerzo por producir una interfase que
permita a los estudiantes “arrastrar y soltar” para construir los análisis de los ladrillos
base. (ibid.,pág., 1)
1 Se basa en el estudio de la probabilidad desde el punto de vista frecuencial. Se entiende por probabilidad como
el límite de la frecuencia relativa con que ocurre un evento cuando n tiende a infinito.
2 Es el estudio de las distribuciones a través del acercamiento que surge de un proceso de muestreo repetitivo, con
Con esta pregunta se pretende identificar cómo los niveles de razonamiento que los es-
tudiantes tienen al estudiar las distribuciones uniforme discreta y binomial evolucionan
a través del tiempo de instrucción con el software. El desarrollo de las actividades está
intencionado con el fin de que los estudiantes vayan adquiriendo en forma intuitiva los
conceptos involucrados en las distribuciones. Dichas actividades están mediadas con el uso
del software, de tal manera que su utilización les permita desarrollar funciones cognitivas
de nivel superior.
Para analizar las respuestas de los estudiantes se adaptó el marco conceptual propuesto por
[3] sobre distribuciones muestrales en el que estos autores definen los niveles de desarrollo
del razonamiento de las distribuciones. Así, se adapta para las distribuciones uniforme
discreta y binomial de la siguiente manera:
Algunas literaturas de investigación estadística sugieren que los términos variación y vari-
abilidad sean usados indistinguiblemente. Una revisión en varios diccionarios demostró
que variación es un sustantivo usado para describir el acto de variar o condición de cambio,
y variabilidad es una forma sustantiva del adjetivo variable, lo que significa que algo es
capaz o está obligado a variar o cambiar.
En esta investigación tomamos los términos dados por [14] sobre variabilidad y variación.
Variabilidad se tomará como la característica o cualidad de una entidad que es observable,
entre tanto, variación es la medida de esa característica.
1.4 Metodología
Las sesiones fueron semanalmente con una duración de 2 horas cada una para un total de
28 horas de trabajo. Se procura tener un espacio de veinte a treinta minutos al final de cada
sesión de manera que se expusieran y discutieran los resultados obtenidos.
Revista digital Matemática, Educación e Internet (www.cidse.itcr.ac.cr/revistamate/). Vol 9, No 2. , 2009. 7
Las actividades fueron creadas con un propósito secuencial en el desarrollo de los conocimien-
tos sobre el tema, pues las nociones adquiridas en una sesión eran fundamentales para la
siguiente actividad. Excepto por los cuestionarios, las actividades se debían realizar con el
Fathom. Se implementaron dos actividades de instrumentalización (adaptación al software)
relacionadas con el cálculo de medidas de tendencia central, construcción de gráficas, ex-
tracción de muestras, simulación, entre otros. Se consideró que 1000 muestras daban una
buena aproximación de la distribución empírica a la distribución teórica, por lo que fue el
número propuesto por el investigador en el desarrollo de las actividades, sin embargo, no
estaba estrictamente limitado a ese valor, pues se les sugería a los estudiantes calcular más
muestras si lo consideraban necesario.
El análisis cualitativo de los datos de esta investigación se llevó a cabo mediante tres ac-
tividades coexistentes (sugeridas por Miles & Huberman en la figura 4.5.1, 1994):
Revista digital Matemática, Educación e Internet (www.cidse.itcr.ac.cr/revistamate/). Vol 9, No 2. , 2009. 9
La colección de
datos La presentación de
datos
La reducción de
datos
Obtención y
verificación de
conclusiones
Figura 1.1 Modelo de análisis de datos (Miles & Huberman, 1994, pág. 12)
Algunas técnicas o métodos que se utilizaron para organizar los datos y que más tarde
sirvieron para realizar un análisis profundo fueron: hojas de contacto, codificación, mem-
orandos, hojas de cálculo y viñetas.
1.5 Análisis
0: si la respuesta es incorrecta.
1: si la respuesta es más o menos correcta, esto será si se ubica en niveles intermedios de
razonamiento.
2: si la respuesta es correcta.
Espacio en blanco: el estudiante no contestó.
En el caso de las preguntas cerradas (1, 7, 9, 11, 13 y la 15) se les asignaba cero o dos.
Est. P.16(a) Pr.14 Pr.16(b) Pr.1 Pr.9 Pr.5 Pr.4 Pr.15 Pr.3 Pr.13 Pr.11 Pr.7 Cal.
L 0 0 0 2 2 2 1 2 2 2 54
S 0 2 2 0 1 1 0 2 0 2 42
R 0 1 0 0 0 1 1 1 2 0 2 2 38
M 0 1 2 1 0 2 2 33
E 0 0 0 0 0 0 2 1 2 2 29
A 0 0 1 0 0 2 2 2 29
H 0 0 2 0 0 1 0 0 1 1 0 2 21
Total 0 1 2 2 3 4 5 6 7 8 10 14
Abreviaturas. Est.: Estudiante, Pr.: Pregunta,Cal.: Calificación
La tabla 1.1, está ordenada verticalmente del estudiante con mayor puntaje al de menor
puntaje y horizontalmente, de la pregunta con menor cantidad de respuestas correctas a
la preguntas con más respuestas correctas. El objetivo de la matriz anterior es observar
las preguntas que los estudiantes tuvieron mayor dificultad con el fin de analizarlas con
detalle, y trabajar situaciones similares en el desarrollo de las actividades para evaluar la
evolución de los estudiantes en estas preguntas. Además, determinar cuáles estudiantes
tenían mayores conocimientos sobre distribuciones muestrales y nociones de estocástica.
Los estudiantes debían reconocer que la distribución teórica que representaba el experi-
mento era binomial, sin embargo se pretendía que tomaran en cuenta la probabilidad y
la omnipresencia de variabilidad en la toma de muestras aleatorias, como lo sugiere [3],
percatándose que la distribución del grupo c era la única opción donde los datos pueden
12 Revista digital Matemática, Educación e Internet (www.cidse.itcr.ac.cr/revistamate/). Vol 9, No 2. , 2009.
Binomial
Probabilidad
(a) Inventados, por que los valores están simétricamente distribuidos con
Variabilidad
RPI respecto al valor promedio y eso parece muy poco probable
(b) Inventados, por que parece que la ruleta está cargada, la mayoría tuvo
pocos éxitos que en este caso representa el número 2
(c) Reales, por que parece más conveniente que hayan obtenido un número
regular aceptable de éxitos a excepción de casos aislados.
NE
(a) Inventados, por que los valores son 1 y 2
RI
(b) Inventados, por que los valores son 1 y 2
(c) Inventados, por que los valores son 1 y 2
Binomial
Probabilidad
(a) Reales, se ve que la gráfica es simétrica, lo cual indica 50% de
Homogeneidad
RT probabilidad
(b) Inventados, hay bastante disparidad
(c) Reales, es un consenso homogéneo.
S
Revista digital Matemática, Educación e Internet (www.cidse.itcr.ac.cr/revistamate/). Vol 9, No 2. , 2009. 13
Binomial
Probabilidad
(a) Reales, la probabilidad de que caiga 2 es 1/2 por lo que si experimen-
Variabilidad
RT taron 50 veces entonces las probabilidades son la mitad. 1/2
1
(b) Inventados, pues la probabilidad es
2
(c) Reales, las posibilidades de obtener menos de 25 veces es posible, pero
es más posible obtener 25 veces.
NE
(a) Inventados
RI
(b) Reales
(c) Reales
Binomial
Variación
(a) Inventados, por que los resultados son muy homogéneos
Variación
RT (b) Reales, por que existe una mayor variación en los resultados
(c) Reales, por que existe una mayor variación en los resultados
0: Si no contesta o bien contesta que en el grupo C los datos son inventados. (RI o RV)
1: Si elige al grupo C y algún otro grupo como datos reales justificadamente. (RT o RP)
2: Si elige al grupo C como reales y los otros dos inventados. (RPI)
14 Revista digital Matemática, Educación e Internet (www.cidse.itcr.ac.cr/revistamate/). Vol 9, No 2. , 2009.
Tabla 1.2
R y L logran determinar en forma correcta que el modelo binomial presentado en los datos
grupo A son inventados, pues la distribución de estos no tienen tanta variabilidad. Caso
contrario las estudiantes A y S quienes contemplan la distribución binomial pero al no
contemplar la variabilidad mencionan que los datos son reales. Los otros estudiantes no
justifican sus respuestas.
Los estudiantes algunas propiedades de las distribuciones binomial, pero tienen dificultades
para reconocer la variabilidad en sorteos aleatorios y en sus representaciones gráficas. Por
ejemplo en la pregunta 4, dos estudiantes aceptan la distribución teórica como real (inciso
a) y también dos aceptan la distribución dispersa como real. De hecho sólo un estudiante
responde la secuencia correcta: inventados, inventados y reales. Entonces el resto del grupo
se ubica en los dos primeros niveles de razonamiento.
En general, los resultados observados nos indican que los sujetos del estudio tenían pocos
antecedentes de conocimientos de estadística y, con excepción del estudiante R, tampoco
han desarrollado nociones de variabilidad (fenómenos aleatorios, rango de los datos, dis-
persión, entre otros) y distribuciones muestrales.
En esta actividad se estudiaron dos variables aleatorias. La primera variable aleatoria fue
el resultado que se obtiene al lanzar un dado, con el fin de estudiar la distribución uniforme
discreta. Según [7], es importante que el estudiante construya el modelo de la población,
por lo que debía construir un dado justo y lanzarlo 1000 ocasiones (simulación en la toma
de muestras), para empezar a caracterizar la distribución uniforme discreta a partir de las
representaciones y manipulaciones que permite el software. La segunda variable aleatoria
16 Revista digital Matemática, Educación e Internet (www.cidse.itcr.ac.cr/revistamate/). Vol 9, No 2. , 2009.
Se lanza un dado justo 1000 veces ¿Cuántas veces crees que cae cada número?
Tabla 1.3
Se lanza una moneda justa 10 veces y se cuenta el número de caras que se obtuvo. Se
repite este procedimiento 100 veces y se grafican el número de caras que se obtuvo en cada
experimento ¿Cuál crees que es la gráfica que mejor representa la situación?
Revista digital Matemática, Educación e Internet (www.cidse.itcr.ac.cr/revistamate/). Vol 9, No 2. , 2009. 17
Se esperaba que los estudiantes tomaran en cuenta la variabilidad de los datos para se-
leccionar la forma que se obtiene en el experimento, sin embargo, sólo R, E y S eligen
correctamente la colección 4, H elige la colección 3 y los otros tres prefieren la colección
2. H no comprende la variable aleatoria involucrada en el problema y los otros tres no
contemplan la variabilidad en el experimento.
Los estudiantes modelaron con el software en forma correcta el dado y realizaron los 1000
lanzamientos del mismo. Algunos histogramas construidos con las 1000 muestras son los
siguientes:
18 Revista digital Matemática, Educación e Internet (www.cidse.itcr.ac.cr/revistamate/). Vol 9, No 2. , 2009.
Figura 1.4 Histograma del estudiante A Figura 1.5 Histograma del estudiante H
Una vez que realizaron la práctica en la que construían una tabla con las frecuencias
obtenidas (pregunta 4 de la actividad), se les preguntó: ¿Los resultados de la tabla anterior
era lo que esperabas? ¿Por qué? (pregunta 5 de la actividad). Con el fin de que confrontaran
sus observaciones con lo que habían respondido en el previo. A continuación presentamos
las respuestas y argumentos de los estudiantes:
Variablilidad
RP
Revista digital Matemática, Educación e Internet (www.cidse.itcr.ac.cr/revistamate/). Vol 9, No 2. , 2009. 19
Determinista
RV
20 Revista digital Matemática, Educación e Internet (www.cidse.itcr.ac.cr/revistamate/). Vol 9, No 2. , 2009.
Muestra que tiene como referencia las frecuencias de una distribución uniforme y reconoce
que sólo es un modelo (“ideal”). Ve las diferencias como resultado del azar (“diferentes
factores”).
RT
Revista digital Matemática, Educación e Internet (www.cidse.itcr.ac.cr/revistamate/). Vol 9, No 2. , 2009. 21
Acepta la desviación de 15 unidades (con el valor 152) pero rechaza la de 23 (con el valor
190). Implícitamente toma en cuenta la estructura y una intuición de la variabilidad.
Determinista
RV
22 Revista digital Matemática, Educación e Internet (www.cidse.itcr.ac.cr/revistamate/). Vol 9, No 2. , 2009.
Afirma que si era lo que esperaba ya que el valor esperado es 166.6 . En su respuesta
parecería que da por hecho que las frecuencias empíricas caen alrededor de 166.6 . En
realidad no es sensible al problema pues no considera como diferente haber propuesto una
distribución uniforme y que hayan ocurrido frecuencias que se alejas hasta en 16 unidades
del valor esperado.
No responde.
Intervalo
RT
Revista digital Matemática, Educación e Internet (www.cidse.itcr.ac.cr/revistamate/). Vol 9, No 2. , 2009. 23
Reconoce también diferencias entre lo que esperaba y lo que ocurrió, pero “si una situación
parecida”. Afirma que ahora “esperaría un intervalo” pero que en la primera oportunidad
no lo hizo así.
Determinista
Intervalo
RT
24 Revista digital Matemática, Educación e Internet (www.cidse.itcr.ac.cr/revistamate/). Vol 9, No 2. , 2009.
Tabla 1.4
Durante la discusión, S dice que no era lo que esperaba, pues pensaba que debía ser
más variado y no alrededor de 166 .
M dice que esperaba que cayera 166 ocasiones el uno, pues es la probabilidad de un
sexto.
También lo manifiesta E.
R aporta que la mejor respuesta debe ser un intervalo, pues hay variación. Por lo que
el grupo está de acuerdo con él.
Análisis pregunta 6:
¿Por qué hay barras que sobrepasan la gráfica teórica y otras que no lo alcanzan?
Con esta pregunta se pretendía que los estudiantes justificaran la diferencia entre las dis-
tribuciones (empírica y teórica) debido a que la variabilidad de los datos entre un sorteo y
otro, se produce al ser fenómenos aleatorios.
Revista digital Matemática, Educación e Internet (www.cidse.itcr.ac.cr/revistamate/). Vol 9, No 2. , 2009. 27
Muestreo
RT
Figura 1.14 Respuesta del estudiante E
Esperanza
RV
Figura 1.15 Respuesta del estudiante H
M
28 Revista digital Matemática, Educación e Internet (www.cidse.itcr.ac.cr/revistamate/). Vol 9, No 2. , 2009.
Experimental
RT
Figura 1.16 Respuesta del estudiante M
Responde correctamente a la pregunta al mencionar que sólo es una muestra de los muchos
resultados que se pueden obtener.
No
Distribución
Muestral
Uniforme
RI Figura 1.17 Respuesta del estudiante S
Variabilidad
RP
Figura 1.18 Respuesta del estudiante R
Revista digital Matemática, Educación e Internet (www.cidse.itcr.ac.cr/revistamate/). Vol 9, No 2. , 2009. 29
Toma en cuenta la variabilidad, pero no hace referencia a que fue solo una muestra la que
se obtuvo.
Aleatoriedad
“Por que tengo un evento aleatorio”
RT
No
Variabilidad
RV
Figura 1.19 Respuesta del estudiante A
Cree erróneamente que una muestra debe ser igual al comportamiento de la población.
0: Quien no considera la distribución muestral obtenida del experimento como una dis-
tribución uniforme discreta o no justifica su respuesta. (RI)
1: Quien considera que la distribución muestral es uniforme discreta pero no contempla la
variabilidad de los datos para explicar las diferencias en las formas o pensar que ambas
distribuciones debían ser iguales. (RV)
2: Quien contempla la variabilidad o el muestreo aleatorio para explicar las diferencias
entre la gráfica de la distribución teórica y la distribución muestral. (RT o RP)
30 Revista digital Matemática, Educación e Internet (www.cidse.itcr.ac.cr/revistamate/). Vol 9, No 2. , 2009.
Tabla 1.5
Distribución Binomial
Se les pidió a los estudiantes que construyeran la representación de una moneda en Fathom
y contaran el número de caras que obtenían al realizar 10 lanzamientos.
Análisis pregunta 10
¿Los resultados de la tabla anterior (tablas resumen) era lo que esperabas?¿Por qué?
Binomial
RT
Figura 1.25 Respuesta del estudiante R
34 Revista digital Matemática, Educación e Internet (www.cidse.itcr.ac.cr/revistamate/). Vol 9, No 2. , 2009.
Binomial
RT
Figura 1.26 Respuesta del estudiante S
Utiliza la probabilidad para responder correctamente mencionando que tiene pocas posi-
bilidades de obtener los extremos, y que la concentración en el centro se debe a que tiene
mayor probabilidad.
Binomial
RT
Figura 1.27 Respuesta del estudiante H
Hace referencia a la parte central de la distribución, sin darle importancia a los valores
extremos. No menciona nada sobre la variabilidad de los datos.
M
Revista digital Matemática, Educación e Internet (www.cidse.itcr.ac.cr/revistamate/). Vol 9, No 2. , 2009. 35
Dist. Uniforme
RI
Figura 1.28 Respuesta del estudiante M
Ingenua
“No imaginaba que el cinco fuera el número de caras que obtuviera con
RI
mayor frecuencia”.
Según A se podría obtener cualquier valor, incluso no esperaba que cinco fuera el resultado
más probable, por lo que muestra ingenuidad en experimentos aleatorios.
Determinismo
“Obtener 5 caras es lo que tiene mayor probabilidad”.
RV
Determinismo
RV
Figura 1.29 Respuesta del estudiante L
36 Revista digital Matemática, Educación e Internet (www.cidse.itcr.ac.cr/revistamate/). Vol 9, No 2. , 2009.
Sólo R, S y H consideran que eran lo que esperaban, pues es natural que la mayor cantidad de
datos estén alrededor de la media. L y E mantienen una idea determinista, pues manifiestan
que esperar cinco caras es el resultado más probable y en el caso de A y M no entendieron
la variable aleatoria.
M durante la discusión dice no entender la tabla, pues ella esperaba que de los 1000
lanzamientos se obtuviera 500 y 500, por lo que no entiende el muestreo que se hizo,
y no comprende la variable aleatoria del ejercicio.
Dice no entender las frecuencias de cada unos de los valores del 1 al 10.
Pregunta cuál es la diferencia entre una distribución binomial y distribución normal.
La mediación del investigador fue fundamental para guiar al grupo a comprender la
caracterización de la distribución binomial.
Una vez más fue difícil erradicar las respuestas deterministas de los estudiantes, aunque
hay mejoría respecto a la pregunta dos del previo, pues ahora son cinco estudiantes los que
contestan correctamente a la distribución binomial. Sin embargo, M y A mostraron en la
actividad las mismas dificultades del previo.
Las conclusiones que se obtuvieron con el análisis de la primera actividad sobre la famil-
iarización de las distribuciones uniforme discreta y binomial fueron:
Este cuestionario consta de 12 preguntas (4 cerradas y 8 abiertas) que los estudiantes re-
spondieron en forma individual aproximadamente en una hora sin ayuda del algún software
computacional. El objetivo general de este cuestionario es documentar y comparar los
niveles de razonamiento que los estudiantes muestran después del proceso de instrucción
en el tema de distribuciones muestrales y algunas nociones de probabilidad y estadística.
En el caso de las preguntas cerradas (2, 4, 5, 10) se les asignaba cero o dos.
38 Revista digital Matemática, Educación e Internet (www.cidse.itcr.ac.cr/revistamate/). Vol 9, No 2. , 2009.
Est. Pr.8 Pr.5 Pr.6 Pr.1 Pr.9(b) Pr.9(c) Pr.11 Pr.10 Pr.9(a) Pr.3(b) Pr.3(c) Pr.4 Pr.2 Pr.3(a) Pr.7 Cal.
R 1 2 1 2 2 1 1 2 2 2 2 2 2 2 2 87
H 2 2 2 2 1 1 1 2 1 2 2 2 1 2 2 83
E 1 2 2 1 1 2 2 2 1 2 0 2 2 2 2 80
L 0 0 1 1 2 2 2 1 2 2 2 2 2 2 2 77
M 0 0 0 1 2 1 2 2 2 2 2 2 2 2 2 73
A 0 0 0 1 2 1 1 1 1 2 2 2 2 2 2 63
S 1 1 1 1 0 2 1 1 2 0 2 0 2 2 2 53
D Pr. 5 6 6 9 10 10 10 11 11 12 12 12 13 14 14
% 36% 43% 43% 64% 71% 71% 71% 79% 79% 86% 86% 86% 93% 100% 100%
Abreviaturas. Est.: Estudiante, Pr.: Pregunta,Cal.: Calificación, D Pr.: Dificultad de la pregunta.
La tabla 1.6, aunque no es cuadrada, está ordenada de manera que en las entradas bajo la
diagonal existan muchos unos y ceros, entendiéndose por esto que las respuestas de los
estudiantes fueron incorrectas o más o menos correctas a preguntas que resultaron difíciles
para gran parte del grupo. En caso contrario, las entradas sobre la "diagonal" de la tabla son
es su mayoría dos, que corresponden a respuestas correctas de los estudiantes a preguntas
que resultaron sencillas para el grupo.
El objetivo de la matriz anterior es observar las preguntas que los estudiantes tuvieron
mayor dificultad con el fin de analizarlas con detalle y compararlas con los resultados de
la actividad correspondiente según sus objetivos. Además, determinar cuáles estudiantes
mostraron mayores avances sobre distribuciones muestrales y nociones de probabilidad y
estadística en relación con el cuestionario diagnóstico y el desarrollo de las actividades.
Análisis pregunta 1
1. La compañía M & M’s dice que el 30% de sus chocolates en la presentación Milk son
color café. Antes de ser empacados en bolsas los chocolates se encuentran en un gran de-
pósito donde son mezclados de manera uniforme. Si se seleccionan de forma independiente
5 muestras de tamaño 10, una tras otra ¿Cuántos chocolates de color café esperarías en
Revista digital Matemática, Educación e Internet (www.cidse.itcr.ac.cr/revistamate/). Vol 9, No 2. , 2009. 39
cada muestra?
A pesar de que se diseñó una actividad (actividad 1) que simulaba el lanzamiento de una
moneda, en las que se tomaban muestras de 10 lanzamientos para obtener una determinaba
cantidad de éxitos; además, el software fathom permitió observar la diferencia que tenían
los resultados del experimento graficando la distribución teórica junto a la distribución
empírica, es muy difícil que los estudiantes hagan suya la posibilidad de contemplar la
variabilidad como un elemento omnipresente en sorteos aleatorios. Una de las causas por
las cuales no se contempla la variabilidad se debe a que la experiencia nos ha dictado la
exactitud, por lo que un intervalo no sería una respuesta precisa.
Los niveles de razonamiento mostrados por los estudiantes en el cuestionario posterior sobre
las distribuciones uniforme y binomial son verbal y de transición; superando por poco el
nivel idiosincrático mostrado en el cuestionario diagnóstico; esto debido a que es difícil
que los estudiantes hagan suya la posibilidad de contemplar la variabilidad de los datos
como un elemento omnipresente en sorteos donde interviene la aleatoriedad; por ejemplo,
el lanzamiento de una moneda, el lanzamiento de un dado, extracción de chocolates con
una probabilidad de acierto dada.
40 Revista digital Matemática, Educación e Internet (www.cidse.itcr.ac.cr/revistamate/). Vol 9, No 2. , 2009.
El objetivo general era investigar las formas de razonamiento de los estudiantes en el tema de
las distribuciones uniforme discreta y binomial basado en un enfoque frecuencial mediado
con el recurso computacional, que permitiera un desarrollo empírico de las distribuciones
con la simulación ofrecida por el software Fathom .
Se ratificaron los prerrequisitos que proponen [3] como fundamentales antes de iniciar una
instrucción al estudiar distribuciones muestrales: análisis de gráficos, medidas de tendencia
central y de dispersión, caracterización de las distribuciones uniforme discreta y binomial,
cálculo de probabilidades como áreas bajo la curva, la idea de muestreo aleatorio y a nuestro
parecer, el más importante, un estudio detallado de la variabilidad.
Los diagramas de muestras (ya sea con gráfico de puntos, diagramas de cajas o histogramas)
de las distribuciones fueron instrumentos psicológicos esenciales que permitieron el estudio
simultáneo de múltiples representaciones tales como: el promedio, la desviación estándar
y la forma de las distribuciones.
Los estudiantes usaron el software como un instrumento que permitió erradicar o modificar
las conceptualizaciones erróneas que tenían los estudiantes sobre las distribuciones uni-
forme discreta y binomial. El software llega a dar evidencias creíbles para el estudiante, esto
se manifiesta a través del orden, la consistencia y la retroalimentación inmediata que ofrece
el programa, permitiendo poner especial atención al proceso de solución más a la respuesta
final, con el objetivo de que se puedan crear intuiciones sobre las características de las
distribuciones. Además, permitió contemplar el elemento más importante y omnipresente
en la estadística al realizar los muestreos aleatorios, como lo es la variabilidad. Aunque los
Revista digital Matemática, Educación e Internet (www.cidse.itcr.ac.cr/revistamate/). Vol 9, No 2. , 2009. 41
Al igual que los prerrequisitos teóricos que fueron fundamentales para el desarrollo de
la investigación, la familiarización con el software (extracción de muestras, cálculos, rep-
resentaciones gráficas, manipulación de parámetros, diagramas de muestras, entre otros)
dentro del proceso de instrumentalización es importante para que los estudiantes desar-
rollen sin problemas funciones psicológicas de nivel superior. Este proceso se puede lograr
de forma sencilla si se trabaja en grupos, pues el software y las experiencias de aprendizaje
mediadas deben ser planeadas para trabajar en un ambiente de constante intercambio so-
cial. Otras potencialidades del software que mencionaron los estudiantes fueron: ahorra
el trabajo tedioso en la presentación y analizar datos, no es necesario normalizar para el
cálculo de probabilidades y se logra el trabajo de forma rápida, pero muchos van más allá
de presentarlo como un simple reductor de tiempo y trabajo.
Como estudios futuros que deben seguir a esta investigación, se recomienda analizar el
lenguaje utilizado por los estudiantes, además de poner especial atención a la simbología
matemática que usan, pues es un tema que requiere la combinación de muchos términos y
nomenclatura matemática.
Además, se considera fundamental el uso de datos reales para el estudio de las distribu-
ciones, ya sea que se obtengan de estudios realizados, en línea, incluso muy apropiado sería
contar con la posibilidad de que sea el mismo estudiante quien recolecte los datos bajo la
asignación de proyectos, de tal manera que le permita al estudiante manipular los datos en
un contexto que tenga significado para él.
Apéndice A
Cuestionario Diagnóstico
En las preguntas de selección única, marque con una X dentro del paréntesis que considere
corresponde con la respuesta correcta.
1. Al lanzar una moneda justa, ¿cuál de los siguientes eventos considera que es más
probable?
*
( )No se puede determinar
3. Carlos y Luis se disponen a jugar con dos dados. Carlos gana $10 si la suma de los
dados es 7, en caso contrario Luis gana $1 ¿Crees que el juego es justo para ambos?
En caso contrario diga quien tiene ventaja.
2 1
1 2
GRUPO A GRUPO B
0 5 10 15 20 25 30 35 40 45 50 0 5 10 15 20 25 30 35 40 45 50
GRUPO C
0 5 10 15 20 25 30 35 40 45 50
Se cree que algunos resultados fueron inventados y otros son reales. Responde las
siguientes preguntas:
(a) ¿Qué piensas de los resultados del Grupo A, son reales o inventados?
( ) Inventados ( ) Reales
Explica por que piensas así
(b) ¿Qué piensas de los resultados del Grupo B, son reales o inventados?
( ) Inventados ( ) Reales
Explica por que piensas así
(c) ¿Qué piensas de los resultados del Grupo C, son reales o inventados?
( ) Inventados ( ) Reales
Explica por que piensas así
5. Un grupo escocés cuenta con 5738 soldados, para los cuáles se requiere saber la
medida del ancho de su pecho en pulgadas. Sin embargo, en las oficinas de reg-
istro se han desaparecido varias medidas, por lo que no se cuenta con todos los
registros de la población. Aunque se sabe que el promedio de la medida de pecho
en este grupo de soldados escoceses es µ = 39.8 pulgadas con desviación estándar
σ = 2.05 pulgadas . Siendo así, se toman muestras aleatorias de tamaño 6 de los
CUESTIONARIO DIAGNÓSTICO 45
registros existentes.
Por ejemplo, las medidas de pecho en pulgadas de los primeros 6 soldados muestrea-
dos son:
Haciendo un análisis entre los gráficos, ¿qué puede decir de ambas distribuciones?
Altura Saltada en cm
Alumnos Ana Bea Carol Diana Elena Fanny Gia Hilda Ines Juana
Antes del entrenamiento 115 112 107 119 115 138 126 105 104 115
Después del entrenamiento 128 115 106 128 122 145 132 109 102 117
Count
6
Count
6
4 4
2 2
0 2 4 6 8 10 0 2 4 6 8 10
CALIFICACION CALIFICACION
e) Otro (explicar)
Bloque A Bloque B
10 20 30 10 10 10
40 50 60 60 60 60
x = 35 x = 35
σ = 18.71 σ = 27.39
13. De una población con media µ y desviación estándar σ , se toma una muestra de
tamaño n , escriba F (Falso) o V (Verdadero) dentro del paréntesis según considere
hace correcta la afirmación:
14. La probabilidad para una mujer de tener cáncer de mama sin haber presentado sín-
tomas previos es de 0.8% . Si tiene cáncer y se realiza la mamografía, la probabilidad
de salir positiva es del 9?mt15%, pero el 7% de mujeres sanas dan positivo en este
examen. Suponga que una mujer decide hacerse una mamografía y el resultado es
positivo, ¿cuál es la probabilidad de que la mujer tenga cáncer?
( ) Sólo la I
( ) Sólo la II
( ) Sólo la III
( ) Las tres son verdaderas
16. De una población con distribución normal se extraen 500 muestras aleatorias de cada
tamaño (5, 10, 15, 20 y 25). Se calculó la media de cada muestra y los resultados se
dibujaron en los histogramas que se muestran en la siguiente figura.
a) Coloque al lado de cada histograma, el tamaño de la muestra (5, 10, 15, 20 y 25)
que corresponda y explica la razón de tu asignación.
17. Los siguientes parámetros describen un conjunto de datos que han sido previamente
recolectados en una investigación:
Parámetro Valor
Media 17
Mediana 16
Moda 31
Rango 38
Percentil(75) 27
Coeficiente de variación 20%
Varianza 121
Desviación Estándar 11
19. Suponga que se tiene una caja que contiene 100 dulces (mezclados dentro de la caja),
de los cuales 60 son rojos y 40 son amarillos. Seis estudiantes hacen un experimento
donde cada uno sacará 10 dulces (Luego de que el primer estudiante saque sus 10
dulces, deberá regresarlos a la caja para que el siguiente estudiante realice su exper-
imento, y así sucesivamente para los siguientes)
¿Qué piensas que podría ocurrir con el número de dulces rojos que cada estudiante
sacará de la caja?
54 CUESTIONARIO DIAGNÓSTICO
, , , , , .
¿Porqué piensas que eso es lo que puede ocurrir?
Apéndice B
Actividad 1
Nombre:
Objetivos:
Distribución Uniforme
Construya en una colección llamada “dado” una tabla que contenga en una columna los
números del uno al seis de un dado. Defina la variable aleatoria X como el resultado que se
obtiene al lanzar el dado.
3. ¿El promedio y la desviación estándar de estos 1000 lanzamientos son los mismos
que los obtenidos en el experimento anterior? ¿Por qué?
6. ¿Por qué hay barras que sobrepasan la gráfica teórica y otras que no lo alcanzan?
Distribución Binomial
Ahora vamos a lanzar la moneda 10 veces, esto se puede hacer en forma similar
al primer problema resuelto tomando una muestra de tamaño 10 con reemplazo y
quitando la opción de animación.
Por lo tanto, cuente el número de veces que la moneda cayó cara. Esto en la opción
measures del inspector de la nueva colección Sample of Moneda.
Así:
60 ACTIVIDAD 1
Ahora vas a hacer lo anterior 1000 veces, es decir el mismo proceso lo llevamos
a cabo 1000 ocasiones. Esto se hace dejando seleccionada la colección Sample of
Moneda con el comando Collect Measures en la opción del menú Collection.
opción:
Y ajuste la escala a Density. Grafique también el valor del promedio sobre el mismo
gráfico y presione Ctrl Y varias veces y observe lo que pasa.
11. ¿Varía mucho el promedio entre un sorteo y otro? por qué? el promedio guarda alguna
relación con la forma de la distribución?
Apéndice C
Cuestionario Posterior
Nombre:
1. La compañía M & M’s dice que el 30% de sus chocolates en la presentación Milk
son color café. Antes de ser empacados en bolsas los chocolates se encuentran en un
gran depósito donde son mezclados de manera uniforme. Si se seleccionan de forma
independiente 5 muestras de tamaño 10, una tras otra ¿Cuántos chocolates de color
café esperarías en cada muestra?
*
2. En las siguiente grafica aparecen tres distribuciones poblacionales cuya media es
µ = 10 y sus desviaciones estándar son σ = 1, σ = 2 y σ = 3 . Coloca sobre cada
una de ellas la desviación estándar que le corresponde.
0.40
0.35
0.30
0.25
y
0.20
0.15
0.10
0.05
0.00
2 4 6 8 10 12 14 16 18
y = normalDensity ( x , 10 , 1 ) x
y = normalDensity ( x , 10 , 2 )
y = normalDensity ( x , 10 , 3 )
d) Otra respuesta:
6. Otra persona hizo lo mismo, tomó una muestra aleatoria de 100 estudiantes del
IPN y encontró que la media era 157 cm ¿Cómo podrías explicar la diferencia de
resultados?
Distribución de la población
CUESTIONARIO POSTERIOR 65
y
0.15
0.10
0.05
5 10 15 20 25 30
y = exponentialDensity ( x , 5, x
2)
Distribuciones muestrales
Histogram
Measures fromSample of Poblacion Exponencial
Measures fromSample of Poblacion ExponencialHistogram
0.30
0.30
0.25
0.25
0.20
Density
0.20
Density
0.15
0.15
0.10
0.10
0.05
0.05
5 10 15 20 25 30
5 10 15 20 25 30
Media
n=________ Media
n= _______
10. Los puntajes de un examen de admisión para ingresar a una Universidad, no se dis-
tribuyen normalmente. La distribución está muy sesgada hacia calificaciones muy
bajas con un promedio de 20 y una desviación estándar de 3,5 .
d. Imposible predecir.
11. Se tiene una población X con media u y desviación estándar σ , se obtienen muestras
de tamaño específico n de la población. Se calcula el promedio de cada una de las
y se forma la distribución de los promedios muestrales X que tiene media
muestras
E X y desviación sX ¿Cuál es la relación entre la población X y la distribución de
los promedios muestrales X ? Utilice como puntos de comparación los que considere
necesarios entre: la forma, el tamaño de la muestra, la variabilidad, el promedio y la
dispersión (desviación estándar)
12. ¿Cuáles fueron las ventajas, desventajas, virtudes o limitaciones que se te presentaron
al utilizar Fathom en el estudio de las distribuciones muestrales?
Apéndice D
Conceptos teóricos sobre
distribuciones uniforme
discreta y binomial
Notación:
*
Por ejemplo, si nosotros estamos interesados que nuestro experimento sea seleccionar una
muestra aleatoria de una persona de una población. Podemos estar interesados en:
X = su ingreso mensual
Y = su presión arterial.
Pero también podemos tener una variable Z = “estado marital” con tres categorías a las
que podemos llamar con letras minúsculas x = soltero, y = casado y z = comprometido.
Así podemos hablar entonces de la probabilidad de que el estado marital de una persona
sea comprometido. Simbólicamente P(Z) = z
EJEMPLO D.1 Considere el experimento de lanzar una moneda al aire dos veces. Y se
define la variable aleatoria X = número de caras obtenidas. El espacio muestral para este
experimento está dado por S = {RR, CR, RC, CC} , dónde C denota cara y R denota cruz.
La variable X puede tomar los valores de 0, 1 y 2 ; pues se puede observar que X = 0 si
el resultado es RR , X = 1 si el resultado es RC ó CR , y X = 2 si el resultado es CC .
1
P(X = 0) =
4
2 1
P(X = 1) = =
4 2
1
P(X = 2) =
4
Distribuciones Discretas:
f (x) = P(X = x)
1. f (xk ) ≥ 0 ∀ xk
2. ∑ f (xk ) = 1
k
La esperanza, valor esperado o también llamado media de una variable aleatoria discreta es:
µ = E(x) = ∑ xk f (xk )
k
√
σ= σ2
Distribuciones Uniforme
CONCEPTOS TEÓRICOS SOBRE DISTRIBUCIONES UNIFORME DISCRETA Y BINOMIAL 71
Definición D.3 Si la variable aleatoria X toma valores con idénticas probabilidades, en-
tonces la distribución ç uniforme discreta está dada por:
1
f (x; k) = , x = x1 , x2 , . . . , xk
k
k
∑ xi
i=1
µ=
k
k
∑ (xi − µ)2
σ2 = i=1
k
Considere el experimento de lanzar una moneda justa un número n de veces, es decir que
1
la probabilidad de caer cara es de p = ; sea X la variable aleatoria el número de caras
2
72 CONCEPTOS TEÓRICOS SOBRE DISTRIBUCIONES UNIFORME DISCRETA Y BINOMIAL
µ = E(x) = np
σ2 = npq
Por ejemplo, se lanza una moneda justa 10 veces (esto quiere decir que la probabilidad de
éxito “salir cara” es de 1/2 ).
1
µ = E(x) = 10 · =5
2
CONCEPTOS TEÓRICOS SOBRE DISTRIBUCIONES UNIFORME DISCRETA Y BINOMIAL 73
1 1 10
σ2 = 10 · · = = 2.5
2 2 4
Bibliografía
[1] E, Ballester. “Pensamiento estadístico que muestran los profesores al estudiar la
centralidad y la variabilidad en un contexto de estadística dinámica con tecnología”.
CINVESTAV-IPN. 2006.
[2] G, Burrill. “Simulation as a tool to develop statistical understanding” en Proceed-
ings of the Sixth International Conference on Teaching Statistics. Cape Town South
Africa.2002.
[3] J, Garfield; R, delMas; B, Chance. “Reasoning about sampling distributions” en
The Challenge of Developing Statistical Literacy, Reasoning and Thinking. Kluwer
Academic Publishers. 2004.
[4] J, Garfield; D, Ben Z-vi. “A framework for teaching and assessing reasoning about
variability”. Statistic Education Research Journal. 2005.
[5] J, Hammerman; A, Rubin. “Strategies for managing statistical complexity with new
software tool”. Statistic Education Research Journal. 2004.
[6] Instituto de Investigación en Matemáticas Aplicadas y Sistemas de la UNAM (IIMAS)
y el Instituto Nacional de Estadística, Geografía e Informática (INEGI). (2001). “El
mundo de los números: la estadística en la vida cotidiana”. Variabilidad. México. D.
F.
[7] S, Inzunsa. “Significados que estudiantes universitarios atribuyen a las distribuciones
muestrales en un ambiente de simulación computacional y estadística dinámica”
CINVESTAV-IPN.2006.
[8] R, Lock.“Using Fathom to promote interactive explorations of statistical concepts” en
Proceedings of the Sixth International Conference on Teaching Statistics. Cape Town
South Africa. 2002.
[9] K, Lipson.“The role of computer based technology in developing understanding of the
concept of sampling distribution” en Proceedings of the Sixth International Conference
on Teaching Statistics. Cape Town South Africa. 2002.
[10] J.D, Mills. “Using Computer Simulation Methods to Teach Statistics: A Review of
the Literature” en Journal of Statistics Education.
[11] M, Pfannkuch; C, Wild. “Towards and understanding of statistical thinking” en The
challenge of developing statistical literacy, reasoning and thinking. Kluwer Academic
Publishers. 2004.
74 CONCEPTOS TEÓRICOS SOBRE DISTRIBUCIONES UNIFORME DISCRETA Y BINOMIAL