Tema 11 Los Datos y Su Procesamiento

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 18

100

TEMA N°
18

LOS DATOS Y SU
PROCESAMIENTO

1. El procesamiento como parte de la


investigación

Conviene recapitular brevemente el proceso que la investigación ha seguido hasta


aquí. Iniciada como la formulación de un problema que de algún modo
desafía los conocimientos del investigador habrá de recorrer luego un largo
camino donde será preciso atender simultáneamente a dos niveles: el teórico y el
empírico. Para el primero de ellos nuestro trabajo se resumirá en la construcción del
llamado marco teórico, que, convenientemente operacionalizado, nos ilustrará
respecto a los datos que es preciso obtener para satisfacer los interrogantes
iniciales. En cuanto al nivel empírico nuestra aproximación a la realidad
que dará estructura da en un cierto tipo de diseño, implementado en
determinadas técnicas de recolección de datos que habrán de indicamos
como conseguirlos. El instrumento de recolección de datos sintetizará ambos planos
y será la herramienta concreta que nos proporcione los datos requeridos.
Finalizadas las tareas de recolección el investigador quedará en posesión de un
cierto número de datos, a partir de los cuales será posible sacar las
conclusiones generales que apunten a esclarecer el problema formulado en los
inicios de la investigación. Pero esa masa de datos, por sí sola, no nos dirá
nada, no nos permitirá obtener ninguna sintesis de valor si, previamente, no ejercemos
actividades tendientes a organizarla, a poner orden en
sobre ella una serie de
todo su con junto. Estas acciones son las que integran el procesamiento
de datos.
La primera división que deberemos hacer en todo el conjunto de datos
obtenidos será de tipo bien elemental, separando de un lado la información que
es de tipo numérica de la información que se expresa verbalmente,
mediante palabras. Los datos numéricos quedarán como tales, ya sean
registros parciales, mediciones de variables, etc., aunque se procesarán para
lograr su clara y rápida comprensión por el lector. El objetivo final es construir
con ellos cuadros estadísticos, promedios generales y gráficos
ilustrativos de tal modo que se sinteticen sus valores y puedan, a partir de ellos,
extraerse enunciados teóricos. Los datos que poseen una forma verbal podrán
sufrir dos destinos difer tratará de convertirlos en datos numéricos o
quedarán tal como estaban, como información no cuantificada. Puede
ser que sea necesario agrupar las respuestas a una pregunta abierta de un
cierto cuestionario (datos de tipo verbal), para hacer con ellas una tabla de valores
que nos indique la frecuencia de cada una de las respuestas. O, simplemente, se
dejarán las respuestas tal como se obtuvieron, seleccionando de entre
101

ellas las más expresivas y significativas. El criterio a adoptar dependerá de


circunstancias concretas: de los objetivos del trabajo, de la posibilidad de
cuantificar cada variable, del tamaño del universo o nuestra considerados, etc. En
grupo de datos verbales, estas dos
todo caso se nos abrirán, ante cada
posibilidades de procesamiento, entre las que deberemos optar.
Una vez adoptado un criterio frente a cada categoría de datos disponibles se
podrán abordar ya, con mayor claridad acerca de nuestros objetivos, las tareas básicas del
procesamiento. En primer lugar será preciso hacer una revisión detallada de todos los
datos obtenidos, atendiendo en especial a su coherencia. Si se trata de cuestionarios
o de pautas de observación, de registros de test, sociogramas, o de
cualquier otro instrumento de recolección, habrá que examinar cada uno
de ellos para analizarlos internamente, descubriendo posibles
incongruencias, omisiones o errores, y enmendándolos si cabe hacerlo. Es
decir, se revisará sistemáticamente toda la información disponible,
juzgando su calidad y el grado de confianza que merece cada una y
seleccionando aquellas que pueden incluirse en el informe de investigación,
aquellas que deben corregirse o modificarse en algo (acudiendo, llegado el caso, a una
nueva recolección de datos) y las

que, por sus graves deficiencias, deberán ser excluidas sin


más.
Para cada tipo de datos se procederá entonces como
sigue:
110

- Los datos numéricos se procesarán agrupándolos en intervalos; se tabularán; se


construirán con ellos cuadros estadísticos, calculándose además las medidas
de tendencia central o de dispersión que parezcan necesarias. - Los datos verbales
que se desea presentar como numéricos sufrirán una primera operación que se
denomina codificación; luego se trabajarán como los anteriores, tabulándose,
volcándose a cuadros y haciéndose los cálculos correspondientes. - Los datos verbales
que habrán de manejarse en forma puramente conceptual y no matemática
seguirán el proceso que indicaremos cuando tratemos el parágrafo relativo a
datos secundarios (ver 5.).

El siguiente esquema resume aproximadamente lo que hasta aquí hemos manifestado:


102

DATOS
PROCESOS

Codificación
Tabulación
construcción de cuadros

Numéricos
.. No
Si
A transformarse en numéricos ---------
. Si

Si
Si
A
Verbales

Que permanecen como | información verbal -------- No

No
No

2. Codificación
El objetivo de este procedimiento es el de agrupar numéricamente los
datos que se expresan en forma verbal, para poder luego operar con
ellas cama si se tratara, simplemente, de datos cuantitativos.
Para lograrlo se habrá de partir de un cúmulo de informaciones que tengan una minima
homogeneidad con lo cual se hará factible integrarlas. Pueden tratarse de cientos de
respuestas a una misma pregunta, o de una variedad de posibles situaciones
observadas mediante un mismo ítem de una pauta de observación. En ambos
casos existirá una determinada variedad de respuestas o de observaciones que
representen las elecciones o los comportamientos de los objetos de estudio.

El primer paso a dar frente a todos estos datos es realizar una revisión
atenta de un grupo reducido de todas ellas, para poder encontrar una
tipologia de respuestas posibles en concordancia, por otra parte, con
las formulaciones teóricas que guían la investigación, y con los
criterios adoptados en la etapa de operacionalización. A cada
categoria de respuesta habremos de darle un código particular, un
número o letra diferente, que servirá para agrupar tras de sí a todas las respuestas
u observaciones que seán idénticas o que, al menos, aparezcan como
equivalentes. Luego procederemos a señalar a cada uno de los
cuestionarios o pautas con el código que le corresponde en cada caso,
con lo que quedará sintetizada la respuesta que contiene.
Supongamos que hemos preguntado, por medio de entrevistas
estructuradas hechas a una muestra, la opinión que tienen las personas respecto
a las Naciones Unidas. Si la pregunta ha sido abierta cada responden te se
hará explayado, sintetizando su visión al respecto en algunas frases. La
codificación nos permitirá agrupar sus respuestas, para poder evaluar cuáles
son las opiniones más salientes al respecto. Nuestros códigos, por ejemplo,
podrán ser:
103
1. Es una institución que garantiza (o preserva, o protege) la paz
mundial. 2. Es una institución que debería ser reformada.
3. Es útil por los servicios que presta a los países menos desarrollados.
4. Es inoperante, ineficiente, etc. 5. No sabe; no puede opinar; (no
conoce)

Por supuesto que podrían elaborarse otros códigos, categorizando más


detalladamente o en menos grupos de respuestas. Casi siempre que se encuentran
expresiones que tienen un mismo sentido pero que se expresan a través de
palabras diferentes se unifican con un mismo código; excepcionalmente,
cuando no sólo interesa la idea sino además los aspectos lingüísticos con que
ésta se manifiesta, es necesario buscar un código para cada respuesta
tomada textualmente. Los casos difíciles de ubicar, de respuestas que
pudieran situarse en más de una categoría, sólo pueden ser resueltos
consultando con el marco teórico planteado inicialmente. Cuando aparecen
respuestas

ambiguas, extrañas o simplemente anómalas, es conveniente agruparlas en el código "otras


respuestas", para no abrir demasiadas categorías simultáneamente.
Una vez definidos estos códigos, y ya marcados los cuestionarios o pautas con los
mismos, estaremos en condiciones de proceder a la subsiguiente etapa, la de
tabulación.
112

3. Tabulación
La palabra tabulación deriva, etimológicamente, del latín, y significa hacer tablas,
listados de datos que permitan su agrupamiento y su contabilización. Para
ello es preciso ir contando cada una de las respuestas que aparecen,
distribuyéndolas de acuerdo a las categorías o códigos estructurados.
Para desarrollar esta tarea deberán confeccionarse planillas u
hojas de tabulación donde figuren los códigos en base a los cuales se
habrán de distribuir los datos, y espacios para señalar, mediante signos
convencionales, las unidades que contabilizando.
se van
Mostraremos, esquemáticamente, una planilla de tabulación:

Pregunta No
........
.
.
104

¿QUÉ OPINA USTED RESPECTO


ALAS NACIONES UNIDAS?

Códigos
Respuestas
Total

1) ........

3) .........

Total general.. Total de entrevistas

En la columna de códigos se anotarán cada uno de los que se hayan establecido en el


proceso de codificación de la variable si ésta no se presentaba inicialmente en
forma cuantificada. Si no es así, irán directamente los intervalos establecidos
para la distribución. En el espacio reservado a las respuestas se colocará por
cada cuestionario que se tabule, un signo en la categoría que corresponda según la
respuesta que en el aparezca.
Una vez tabulados todos los cuestionarios
(en relación a esa única pregunta, pues cada pregunta o punto de observación
requiere una tabulación contarán las respuestas anotadas en cada casillero,
expresándose en números en la columna que dice "Total".
Este proceso puede realizarse, muy rápidamente, mediante computadoras
electrónicas. Para ello es necesario preparar adecuadamente los
instrumentos de recolección, con casilleros especiales para que las
máquinas los procesen.
El resultado de la tabulación será este cómputo ordenado de las
respuestas. Sin embargo, las tablas obtenidas, no serán aptas todavía para
presentarse al público, ya que deberán sufrir todavía algunas
transformaciones de forma que permitan su mejor comprensión,
como veremos en la sección correspondiente (4.). Las tablas que
resultan de la tabulación deben considerarse, pues, como un material de trabajo,
como un producto preliminar todavía no acabado.

3.1. Tabulación de dos variables


Las explicaciones que hemos visto hasta aquí se han referido al caso
más simple de la tabulación, es decir el que se ocupa del
procesamiento de una sola variable (podríamos decir, también,
de un solo indicador). Existe muchas veces el interés de presentar
simultáneamente las mediciones correspondientes a dos variables, en especial para
tratar de percibir si se presenta algún tipo de relación o influencia entre ellas. Para
alcanzar este objetivo se emplea una tabulación llamada cruzada, o de doble entrada,
que
105

consiste en la contabilización de las respuestas a una pregunta discriminándolas de


acuerdo a las de otra variable diferente.

Nuestra planilla de tabulación quedaría ahora de la siguiente


manera, si pretendiéramos tabular los datos del ejemplo anterior
cruzándolos con los de la variable
edad:
meg....... preg....
.
:

OPINIÓN RESPECTO A LA ONU, SEGÚN


EDAD

Edades
Hasta
de 26
Más de

Código's
25 años
a 39 años
40 años
Total

Código 1
Código 2
.......

114
Totales

Si el primer cuestionario que tomáramos fuera de una persona de 23 años, cuya


opinión sobre el tema debiera incluirse en el código No 2, tendríamos que
hacer una señal en la casilla o celda que hemos marcado con la letra A.
Luego tomaríamos otra respuesta, por ejemplo, la de una persona de 37
años cuya respuesta pudiera incorporarse al código N° 1; haríamos así otra
marca, esta vez en el casillero señalado con una B. Es decir que, antes de efectuar
la marca que nos permite ir contando cada caso, tendríamos que ubicar al mismo de
acuerdo a las dos categorías que intervienen en nuestra tabla. Cuando
completáramos todos los casos de la muestra estariamos en posesión de un cuadro
de doble entrada, capaz de informarnos si las opiniones frente al tema se ven afectadas por
la edad de los entrevistados o si, por el contrario, se distribuyen de
modo uniforme cualquiera sea la edad de éstos. 3.2. Total de las
respuestas tabuladas
Cuando tabulamos respuestas a preguntas abiertas o cerradas, pero que permiten
elecciones múltiples, el total de respuestas obtenidas podrá ser mayor,
menor o igual. al del total de entrevistados. Esto, que puede resultar sorprendente, no se
debe a ningún error sino a consideraciones muy simples. En primer lugar, puede suceder que
algunas
106

personas no respondan a alguna determinada pregunta, por lo que el total de respuestas


sería entonces menor que el de respondientes. O puede suceder un
fenómeno que produce resultados contrarios: algunas personas tal
vez den dos respuestas diferentes para una misma pregunta, siempre que
ellas no sean contradictorias entre sí.
Veamos lo dicho con un ejemplo: Supongamos que hemos
entrevistado a 50 personas que han migrado desde el campo ala
ciudad, y que uno de los puntos requeridos ha sido la causa que provocó esa
migración. Algunas de ellas podrán decir que han migrado por motivos de trabajo, otras por
problemas de salud, para proseguir sus estudios,
para reunirse con el resto de
su familia, etc. Pero puede haber algunos migrantes que se hayan dirigido a la
ciudad para estudiar y trabajar a la vez, o por motivos de salud, pero también con el objeto
de reunirse con sus familiares. Existirán múltiples posibilidades al respecto, incluso
la de que algunos de ellos se nieguen a expresar sus respuestas, o eludan la
pregunta de diversas maneras. Después del trabajo de codificación
podríamos obtener la siguiente lista de motivos de migración:

OS

1: Motivos económicos 2: Motivos de


salud 3: Deseos de reunirse con
familiares 4: Deseos de proseguir
estudios 5: Otros motivos
Si del total de 50 personas encuestadas han respondido
solamente 46, pero si hay varias de ellas que han expresado más de un motivo
como causa de su presencia en la ciudad, podría presentarsenos la siguiente
situación:

Total de entrevistados ............


Total respondientes a la pregunta ..
50 46

Motivos indicados

Económicos
........
De salud ....
Familiares ......

Educacionales
107

Otros
...................
.............
.....

----------

Total
respuestas
..........
...

55

Como vemos, estarnos frente a tres cantidades distintas que nos indican
diferentes cosas: una es el total de gente consultada, otra el de la que efectivamente
respondió, y otra el total de las respuestas dadas, teniendo siempre presente que cada
persona ha podido dar más de una respuesta. La tabulación nos indica que han sido 27 los
entrevistados que dijeron haber migrado por razones de tipo económico, 02
por problemas de salud, etc.
Cuando se trate de tabular respuestas de elecciones múltiples debe tenerse
en cuenta que hay que tabular separadamente estos tres elementos, contando por un lado el
total de cuestionarios, el total de quienes no responden, y el total
correspondiente a cada código o intervalo.

4. Cuadros estadísticos
116

Decíamos que luego de terminar con la tabulación de toda la información contenida en


nuestros instrumentos de recolección de datos, es preciso presentar los resultados
hallados de modo tal que resulten fácilmente inteligibles, aun para los lectores no
especializados. Para lograrlo es preciso adoptar el criterio de presentar los datos en la
forma más clara posible, explicitando cualquier elemento que pudiera dar origen
a confusiones o dobles interpretaciones, ordenando toda la información de la manera más
rigurosa.

Esta actitud debe comenzar por el correcto titulado de cada cuadro. Ello significa que el
título debe contener todas las características de la información que se presenta
en forma concreta, específica y no difusa. Si hiciéramos la pregunta "¿Dónde
piensa usted ir en sus próximas vacaciones?", el cuadro estadístico correspondiente
debería titularse, sencillamente: "Lugares a donde los entrevistados piensan ir en
sus próximas
vacaciones". No podemos hablar ambiguamente aquí, poniendo, por ejemplo: "Lugares
preferidos por los entrevistados", pues no siempre la gente acude de vacaciones a los
sitios que más prefiere; tampoco se podría encabezar la información con el titulo "Lugares
donde pasan sus vacaciones los entrevistados", pues una persona puede tener decidido
concurrir aun cierto sitio pero luego no hacerlo por diversas razones.
108

Cuando en un cuadro aparecen dos variables deberá mencionarse primero


aquella
endiente y luego la independiente. Así quedaria, ver gráfico: "Opinión
de los entrevistados frente al control de la natalidad, según edad". Si existen más
variables se respetará la misma regla, anotando para el caso mencionado: "Opinión
de los entrevistados frente al control de la natalidad según sexo y edad". Después de
encontrar un título adecuado para el cuadro, la tarea siguiente es convertir en porcentajes las
cifras reales (llamadas absolutas) que hemos obtenido de la tabulación. Ello permite, por una
parte, tener una mejor idea de lo que puede representar una parte frente al todo; es muy
claro lo que significa que 23 por ciento de la gente prefiere X y no Y. En cambio
no percibimos tan bien el valor relativo de 171 respuestas favorables a X
sobre el total de 743 casos. De la misma manera, la práctica de la
porcentuación permite, de una rápida ojeada, percibir diferencias y
similitudes, apreciar variaciones y tendencias. Por ello su uso es constante en
prácticamente todos los cuadros estadísticos".
El valor total en función del cual se hace el cálculo de los porcentajes (en el
ejemplo anterior, 743), se llama base del porcentaje. Cuando tal base es un
número demasiado pequeño no se suele porcentuar, pues hacerlo nos podría inducir a una
idea falsa sobre la exactitud de la información: no podemos decir que 83,3 por ciento
de los integrantes de una muestra poseen automóvil por el simple hecho de que,
sobre seis personas consultadas, haya cinco que sí lo posean. Por eso, cuando la base es
menor de 15 o de 20 casos (el límite se fija convencionalmente, se presenta la información en
cifras absolutas y no relativas.
Puede ocurrir que, en un mismo cuadro, aparezcan diferentes bases,
algunas de las cuales pueden llegar a ser menores que las cifras fijadas como minimas. Por
más queesto suceda, nunca, en ningún caso, deben presentarse en un
mismo cuadro columnas en porcentajes y en absolutos simultáneamente.
O se presentan todas en absolutas o todas en porcentajes, o si ello no es
posible, se confeccionan dos cuadros diferentes, porque de otro modo se
induce directamente a una confusión al lector.
Las cifras presentadas deben tender a redondearse en lo posible, pue muy poco claro
leer que hay 32,87 por ciento de una cierta categoría, y 67,13 por ciento de la
contraria. Mucho más simple es hablar de 33 por ciento contra 67 por ciento.
Por supuesto que, cuanto mayor sea la muestra, más aceptable es incluir
valores decimales en las cifras presentadas. Si las bases son pequeñas,
en cambio, hay que evitar dar la impresión de una exactitud que en realidad la
información no posee.
109
Cuando se trate de un cuadro que expone una pregunta de elección múltiple, la

base del porcentaje será siempre el total de personas que responden, y no el total de
respuestas existentes, pues eso es lo que tiene más sentido lógico.

4.1. Cuadros con una sola variable


Se trata del caso más simple que puede presentarse, y no plantean
ninguna dificultad seria para su construcción. Simplemente se trata de
presentar una columna ordenada de valores, de acuerdo a ciertos modelos
formales convencionales. Existen dos modelos básicos de presentación. que
ejemplificamos seguidamente:

a)

Cuadro No .....

EDADES DE LOS ENTREVISTADOS

Total de la muestra
......................... 250
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

118
Total respondieron ....
247
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

Hasta 25 años....... De 26 a 39 años ... De 40 y más años


.
.
.
.

Aquí las bases se colocan en la parte superior de la columna, subrayándose


para indicar que sobre ellas se han calculado los valores porcentuales.

b)
Cuadro No ....

....... 34
EDADES DE LOS ENTREVISTADOS Hasta 25 años De 26 a 39 años
........ De 40 y más años
24
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

(247) 250
Total de la muestra ....
110

En este modelo la base del porcentaje aparece al pie de la columna encerrada entre
paréntesis, y el total de la muestra se anota aparte.
Cualquiera de estos dos formatos es correcto. Su utilización depende
de la voluntad del autor y, en gran parte, del modelo que sea usual en cada
institución. localidad o empresa.

4.2. Cuadros con dos o más variables


Son los que presentan el comportamiento simultáneo de más de una
variable, pretendiendo mostrar sus interrelaciones recíprocas. Surgen de
tabulaciones cruzadas (ver 3.1.) y se llaman de doble o triple entrada, según la
cantidad de variables incluidas en ellos.

En cuanto a su diseño es universalmente aceptado que la variable


supuestamente independiente se coloca horizontalmente, mientras que la
dependiente se sitúa en la vertical.

Daremos un ejemplo sencillo para ilustrarlo. Sea la variable independiente


la edad. que se supone ejerce algún tipo de influencia sobre las opiniones de la gente
tiene frente al problema X. Nuestro cuadro quedaria así:

Opiniones
Edades (años)

Hasta 25
26 a 39
40 y más
Total

Total entrevistas

A favor

Neutral

En contra

No sabe

No contesta

Para el caso de cuadros que posean tres o más variables el, criterio que
se adopta es situar a la variable dependiente, como antes, en la
vertical, mientras que las independientes o intervinientes se sitúan en la
horizontal. Debemos agregar que, salvo excepciones muy poco frecuentes,
nunca se utilizan cuadros de más de tres entradas,
111

pues el análisis y la comprensión de cuadros más complejos se hace realmente difícil,


incluso para gente especializada.

4.3.
Graficación

La graficación es una actividad derivada de la anterior, y consiste en expresar


visualmente los valores numéricos que aparecen en los cuadros. Su objeto es permitir
una comprensión global, rápida y directa, de la información que aparece en cifras. Es
sumamente útil, especialmente cuando nos dirigimos a lectores con poca
preparación matemática, aunque siempre es recomendable por el valor
sintético que posee.

Raramente se grafica toda la información que se presenta en una


investigación pues ello sería un trabajo dilatado, que no se justifica mayormente; la
corriente y más aconsejable es graficar las informaciones más importantes y
generales que se presten a
una expresión gráfica.

120
Para llevar adelante esta tarea existe una infinidad de formas posibles que incluyen,
entre las más conocidas, los gráficos de barras, los histogramas, los gráficos
de "pastel", las escalas gráficas, etc. El criterio del investigador -junto con sus
conocimientos matemáticos- serán los encargados de determinar cuál es el gráfico
más apropiado para
cada conjunto de datos.
112
OPINIÓN FRENTE AL PROBLEMA X, DE ACUERDO A NIVEL SOCIO-ECONÓMICO Y
EDAD

• Nivel S.E.
Alto
Bajo
Totales

Edades
Hasta
39
40 y más
Total
Hasta
39
40 y más
Total
Hasta
39
40 y más
Total

Total entrevistas

Opniones

A favor

Neutrales
En contra

No sabe

No contesta

5. Procesamiento de datos secundarios


Incluiremos en este punto las operaciones que es necesario realizar con
aquellos datos verbales que no pretendemos cuantificar, sino que
manejaremos en forma puramente conceptual (ver 1.). Por lo general la
mayoría de estas informaciones se recolecta mediante fichas, a las que nos
referiremos de ahora en adelante, aunque las consideraciones que
exponemos son válidas, en general, para todo tipo de información
verbal. Partimos, entonces, de una masa de datos, donde se supone que toda
la
información necesaria para desenvolver la investigación. Estos
datos, sumados a la experiencia del investigador, permitirán
elaborar y desarrollar planteamientos que satisfagan los
interrogantes iniciales. La primera labor que se requiere es ordenar
esta masa de datos, clasificarla de modo que puedan permitir una
inspección sistemática y profundizada. Tal clasificación sólo puede
hacerse en base a un esquema general del trabajo, al listado
ordenado de capítulos y de puntos que, en la etapa del diseño, ya
se habrá elaborado. Este esquema nos permitirá agrupar el material de acuerdo
a los temas que se tratán, y en función del marco teórico que orienta al
trabajo en general.
Cada una de las fichas se agrupará entonces con las otras que se refieren al
mismo punto de investigación. Una vez así clasificadas estarán en
condiciones de ser cotejadas
entre sí y analizadas, de acuerdo a
los métodos que se expondrán en LA CONCLUSIÓN DE LA
INVESTIGACIÓN.

También podría gustarte