Boletines

Boletín Electrónico N° 16
ERRORES DEBIDOS AL MUESTREO: TAMAÑO MUESTRAL



En los dos Boletines precedentes hemos desarrollado los diferentes conceptos de "error", asociados a las estimaciones por muestreo y relacionados con el cálculo del tamaño de muestra. En este Boletín retomaremos esas nociones para abordar de lleno el problema del tamaño muestral para la estimación de proporciones.

En principio debemos tener alguna hipótesis acerca del valor de la proporción que queremos estimar y plantear un valor aceptable para el CV, por ejemplo, 0.1 o un 10%.

Si seguimos con el ejemplo planteado anteriormente, donde la proporción que queríamos estimar era de alrededor del 0,60, ya tenemos los datos necesarios para calcular el tamaño de muestra. De la fórmula 4 del CV despejamos n y reemplazamos los valores:

fórmula 5
   
 
Entonces n resulta igual a 67.


Podemos ver, en la fórmula 5, que, para un CV dado, el tamaño de muestra n aumenta a medida que disminuye la proporción que queremos estimar. Es decir:

"Cuanto más raro sea el fenómeno que estudiamos más casos necesitaremos para acercarnos a su conocimiento", tal como surge intuitivamente.


Por otra parte, para una proporción P dada, cuanto menor sea el CV que estamos dispuestos a aceptar más grande debe ser el tamaño de muestra que necesitaremos. Es decir: "cuanto más grande sea la precisión pretendida más casos necesitaremos".

Una vez aclarados estos aspectos, nos gustaría referirnos a algunos conceptos muy difundidos pero erróneos

  1. Volviendo a la fórmula 5, vemos que el parámetro que queremos estimar aparece en el denominador y, su complemento, en el numerador. Es decir, que se necesitarán tamaños de muestra diferentes para estimar el valor de P y para estimar el valor de su complemento Q o (1-P) porque el cociente Q/P no es igual a P/Q. Este razonamiento contradice una sentencia muy difundida que dice que para estimar a P se necesita el mismo tamaño de muestra que para estimar a su complemento (1-P).

  2. Más arriba se explicó por qué es necesaria una muestra mayor cuanto más raro sea el fenómeno a estudiar, sin embargo, muy frecuentemente se escucha que "cuando no se conoce la proporción P a estimar conviene plantear P = 0,50, pues se trata de la hipótesis más conservadora, es decir, la que nos arroja el tamaño de muestra mayor".

Ahora bien, ¿dónde se originan estas confusiones?

Las dos afirmaciones anteriores, que resultan erróneas cuando se pretende controlar el CV (que, como ya vimos, es un error relativo), son ciertas cuando lo que se desea controlar es el DE o error absoluto. Y, en ese caso, si bien los errores absolutos son iguales se obtienen errores relativos muy diferentes.

Más arriba habíamos calculado el tamaño de muestra para estimar una proporción P del 0,60, con un CV del 10%. Si intercambiamos los valores de P y Q calculamos el tamaño de muestra necesario para estimar una proporción del 0,40:



Vemos que el tamaño de muestra aumenta respecto de n = 67, que obtuvimos anteriormente, debido a que ahora queremos estimar una proporción menor.

Ahora bien, qué pasaría si en lugar de calcular n con la fórmula 5 lo hiciéramos a partir de la fórmula 3. En ese caso, despejando n nos queda la siguiente fórmula para su cálculo:

fórmula 6


Reemplazando por los valores tenemos:



Hemos obtenido el mismo resultado anterior. Obviamente, esta fórmula da el mismo resultado cuando P es 0,60 que cuando P es 0,40, pero, para eso, d no debe variar, debe seguir siendo 0,12 y, por lo tanto, lo que ha variado, sin que lo hayamos notado, son los errores relativos: CV y   . En otras palabras, con una muestra de 67 estimaremos un P de 0,40 con menos error relativo que un P de 0,60.

Ahora vayamos al punto 2 señalado más arriba. Veamos ahora qué pasa con el tamaño de muestra cuando P y Q son iguales, es decir, P = Q = 0,50.



Evidentemente, 69 es mayor que 67 pero, al mantener el d = 0,12, lo que ha cambiado sin que lo advirtamos es el error relativo, es decir, la estimación cuando P es 0,50 será menos precisa que cuando P es 0,60. Vemos que es falso, que resulta "más conservador" suponer P = Q = 0,50.

En el siguiente Boletín cerraremos el tema de los diversos usos del término "error" en el contexto del muestreo, analizando otra falacia muy difundida: la del tamaño muestral de 400 unidades, que satisface cualquier necesidad de estimación.