Boletines

Boletín Electrónico N° 15
ERRORES DEBIDOS AL MUESTREO: COEFICIENTE DE VARIACIÓN



En el Boletín anterior iniciamos la tarea de revisar los diversos usos que se le dan al término "error" en el contexto del muestreo. Se adelantó que un tema tan conflictivo como el cálculo del tamaño de muestra está totalmente relacionado con ese concepto, y que es necesario precisar cuál es el significado que le vamos a dar al término error para definir el método de cálculo más adecuado del tamaño de muestra.

En este Boletín encararemos el estudio de otro tipo de error, relacionado con el desarrollado anteriormente, que en su forma absoluta se denomina Desvío Estándar y en su forma relativa Coeficiente de Variación.


Vamos a hablar un poco acerca de la expresión que fue planteada en el Boletín anterior :  
fórmula 1

Si a lo llamamos Desvío Estándar de p, DE(p)


podemos reescribir a d como:

 

Así como cuando decíamos que el margen de error d estaba expresado en valores absolutos y que también podía expresarse en términos relativos a P.

fórmula 2


también en este caso podemos expresar el Desvío Estándar en términos relativos, obteniendo el conocido Coeficiente de Variación:

fórmula 3



Por último, de las fórmulas 2 y 3 se deduce que

fórmula 4


Como hemos visto existen muchos conceptos diferentes y relacionados que se denominan "error". Frecuentemente en las "fichas técnicas" de las muestras utilizadas en investigación de mercado se mencionan valores de error sin aclarar a cuál se refieren y sin comprender el significado de las cifras citadas.


A continuación mostramos algunos casos reales bajados de Internet como ejemplo:

    Ejemplos reales de errores usuales
  • La cantidad de encuestados en la zona fue de 4 mil 746 hogares, distribuidos en 2 mil 299 en el área rural y 2 mil 447 en la urbana. El margen de error de la muestra en la región es de un 5 por ciento.
  • El error de la muestra es de ± 3,25 para un nivel de confianza del 95% en sigma 2.

En conclusión, en estadística, la palabra "error" es una palabra ambigüa, no porque los conceptos lo sean, sino porque hay diferentes medidas del error. Deberíamos entonces pensar cuál de los indicadores que hemos descripto es el más adecuado para su aplicación en Investigación de Mercado.


Nuestra propuesta es usar el Coeficiente de Variación (CV) por las siguientes razones:

  • Su cálculo no requiere ninguna hipótesis respecto a la probabilidad de error y dado que, en Investigación de Mercado rara vez las muestras son realmente probabilísticas, no tiene sentido el cálculo de medidas de error asociadas a la probabilidad.
  • Al enunciarlo nadie duda respecto a qué nos referimos
  • Como se trata de una medida relativa permite comparar la precisión de estimaciones muy diversas

Otro aspecto que se enuncia con frecuencia en forma equivocada, y que podemos ver en las citas anteriores, es relativo al apellido "de la muestra" asociado a la palabra "error". Como dijimos en Boletines anteriores "los errores son características de los estimadores y no de las muestras".

Creemos que el motivo de esta confusión se debe, en principio, a una traducción errónea al español del término "sampling errors" cuyo significado correcto es "errores muestrales" y no "errores de la muestra", seguida por una repetición automática de la expresión sin demasiado análisis en cuanto a su verdadero significado.

Como confirmación transcribimos un extracto del Diccionario del International Statistical Institute (ISI):

English : sampling error
Spanish : error de la muestra; error del muestreo


Ahora estamos en condiciones de encarar de lleno el cálculo del tamaño de muestra para la estimación de una proporción, lo que haremos en el siguiente Boletín.

En esta oportunidad utilizamos "p" en lugar de "P" porque se trata de dos conceptos diferentes. Se entiende por "P" a la
       proporción poblacional que se desea estimar (parámetro) y por "p" al estimador (variable aleatoria) que se utilizará para
       calcular esa estimación. En este caso se trata del desvío estándar de la variable aleatoria "p".
Se entiende por "errores muestrales" los errores de estimación ocasionados por la aleatoriedad implícita en el uso de una
       muestra en lugar de la población completa.