Boletines

Boletín Electrónico N° 2
ANÁLISIS ESTADÍSTICO, VARIABLES ALEATORIAS: ESCALAS DE MEDICIÓN



El objetivo del análisis estadístico es encontrar herramientas que permitan describir sucesos o fenómenos que ocurren en la vida real (que son visualizados como propiedades de objetos tales como personas, empresas, marcas, etc.) y estudiar sus interrelaciones.

Estos sucesos se denominan aleatorios porque pueden ocurrir en más de una forma o, dicho en otros términos, pueden arrojar un resultado distinto en cada elemento que se observa, además, el conocimiento de las condiciones que los determinan no permiten predecir un resultado en particular.

Las variables con las que trabaja el investigador son construcciones operativas que se utilizan para representar estos sucesos, son funciones matemáticas que establecen una correspondencia entre las propiedades de los objetos y un sistema de códigos que puede ser numérico o no.

En estadística, al nombre "variable" se le agrega el apellido "aleatoria", que da cuenta de la naturaleza de los fenómenos que se estudian en esta disciplina y que se relaciona con la "posibilidad" de arrojar un resultado distinto en cada elemento que se observa.

Un problema que surge con bastante frecuencia en las aplicaciones estadísticas dentro del campo de las ciencias sociales es que se realizan operaciones entre los valores de las variables sin tener en cuenta si estas operaciones están permitidas por el nivel de medición elegido.

Si elegimos al azar una persona de un grupo de personas podemos ver que le ocurren determinadas cosas o que tiene determinadas propiedades, por ejemplo:

  • es mujer
  • cursó estudios universitarios incompletos
  • tiene 30 años
  • tiene tres hijos
El investigador necesita cuantificar estas características, para lo cual va a definir variables asociadas con cada una de ellas, por ejemplo:
  • sexo (varón, mujer)
  • nivel de estudios alcanzado (primario, secundario, universitario)
  • edad (medida en años)
  • cantidad de hijos (ninguno, entre uno y tres, más de tres)
Podemos ver que para definir cada variable usamos un nombre y un listado de los valores que puede tomar. El nombre de la variable representa al fenómeno que queremos estudiar y el listado de valores está relacionado con los posibles resultados de este fenómeno, pero como es una construcción operativa diseñada por el investigador podría ser diferente, por ejemplo:
  • sexo (másculino, femenino)
  • nivel de estudios alcanzado (hasta secundario incompleto, secundario completo y más)
  • edad (menor de 30, de 30 y más)
  • cantidad de hijos (medida en números enteros)
En la variable sexo sólo cambiamos la "etiqueta" de sus valores, en el resto de las variables hicimos un reagrupamiento de los resultados del fenómeno que representa.
Vemos que en el caso de sexo existen sólo dos resultados posibles que podemos llamar de distinta forma: "mujer", "femenino", "1", "M", etc. y "varón","masculino", "2", "V", etc.; mientras que en el caso de la edad son posibles muchas más alternativas, desde la edad en años cumplidos, hasta diferentes categorías armadas con tramos de edades distintos.

Una de las etapas involucradas en la elaboración de un formulario para una investigación específica consiste en la definición del tipo de "escala" o "nivel" de medición de cada uno de los sucesos que se van a estudiar. Se entiende por tipo de escala de medición al conjunto de supuestos que rigen la correspondencia entre las propiedades de los objetos, el sistema de códigos y las propiedades matemáticas que tienen esos códigos.

Existen tres niveles de medición de menor a mayor jerarquía:
  • Nominal. Se aplica a sucesos que sólo admiten categorías no ordenables, por ejemplo: sexo, región, religión, etc..
  • Ordinal. Se aplica a sucesos que admiten, a lo sumo, categorías ordenables, por ejemplo: nivel de escolaridad, nivel de satisfacción con un servicio, etc..
  • Cuantitativa. Se utiliza para sucesos entre cuyos resultados se puede establecer una distancia: edad en el primer ejemplo, cantidad de hijos en el segundo ejemplo, ingreso familiar medido en $, etc..

Las variables definidas por un nivel de medición de mayor jerarquía admiten ser redefinidas en niveles de menor jerarquía, pero esto no es cierto a la inversa.

La escala nominal sólo nos permite clasificar a los objetos. Los códigos asignados ubican a cada objeto en un grupo sin ninguna implicancia de orden. La única relación definida entre los códigos asignados a los objetos es la determinación de igualdad.

La escala ordinal nos permite rankear a los objetos, es decir, saber si un objeto tiene más o menos de un atributo que otro, pero no cuánto. Las relaciones definidas entre los códigos asignados a los objetos son la determinación de igualdad y de orden.

La escala cuantitativa nos permite decir cuánto más o cuánto menos de un atributo tiene un objeto respecto de otro. Las relaciones definidas entre los códigos asignados a los objetos son todas las operaciones matemáticas.

El desconocimiento de estas reglas fundamentales lleva habitualmente a cometer errores graves en las aplicaciones estadísticas. El caso más frecuente es el de tomar los códigos de una variable definida mediante una escala ordinal como si se tratara de una escala cuantitativa y calcular medias, varianzas, regresiones, etc..