Juego de abalorios: Segundo relato





NOTA BENE  

Para comprender por qué decimos que cualquiera de estos catorce relatos matemáticos que estamos publicando es un juego de abalorios, es condición necesaria leer la introducción inicial que figura en el siguiente enlace: 



2- De estadísticas, autos caros y cajas de fósforos

El filósofo y matemático inglés Bertrand Russell (1872-1970) fue un prolífico y agudo escritor. En 1950 recibió el Premio Nobel de Literatura, y se lo recuerda, además de por sus muchas contribuciones científicas y literarias, por su ingenio. A él se le debe, por ejemplo, la siguiente explicación sobre el funcionamiento de la estadística, que llama la atención por su sencillez y su claridad.

En la isla Solitaria vivían únicamente dos personas: un hombre riquísimo y excéntrico, varias veces millonario, y un ermitaño que no tenía nada. Entre sus numerosas aficiones, el millonario era muy conocido por su colección de automóviles de lujo, que incluía dos carísimos Rolls Royce.

Un día, llegó a la isla una comisión investigadora encargada de efectuar un relevamiento estadístico, para el cual debió realizar numerosas encuestas entre los dos habitantes. Cuando llegaron al rubro automóviles, los funcionarios observaron que en la isla existían dos Rolls Royce. Confirmaron, también, que los habitantes de la isla eran dos; luego, se dedicaron a elaborar el índice de automóviles Rolls Royce per cápita. Este nombre pomposo no designaba otra cosa que la cantidad promedio de autos de la marca citada en poder de los habitantes.

Luego de preparar las planillas correspondientes, hicieron el siguiente cálculo:

En conclusión, anotaron que en la isla había un automóvil para cada habitante, según el promedio calculado.

Bertrand Russell utilizó este ejemplo con el objeto de destacar que, a veces, es posible llegar a conclusiones engañosas a partir de cálculos estadísticos bien realizados. Sin lugar a dudas, el promedio de coches por habitante fue muy bien hecho; pero es posible que, por ejemplo, un desprevenido lector de diarios pueda suponer que las condiciones de vida de la isla Solitaria eran maravillosas, con una economía de efectos muy beneficiosos para todos sus habitantes. Y es obvio que la realidad no era así.

Entonces, ¿qué prevenciones deben tomarse para corregir este "equívoco informativo"?
A partir del ejemplo citado, se pueden hacer dos observaciones relevantes para una estadística:

1) Los datos que se consideren tienen que ser relativamente numerosos. Un promedio es estadísticamente significativo, cuando las cantidades que se promedian son bastante mayores que 2. Podríamos pensar que el valor informativo del promedio de automóviles lujosos por habitante (tal como fue calculado) sería más confiable si la isla Solitaria hubiera estado poblada por 10 o más personas.

2) Una vez cumplida la exigencia anterior, aparece una condición bastante más sutil: no debe haber demasiada diferencia entre el valor máximo y el valor mínimo que intervienen en la operación de promediar. (En el caso del ejemplo, es adecuado pensar que es muy fuerte el contraste entre 0 automóviles de lujo -para el ermitaño- y 2 autos de lujo -para el millonario.)

Si analizamos otro caso, podremos ver con detenimiento la importancia de la segunda condición.


Supongamos que un fabricante de cajas de fósforos, pensadas para contener 100 unidades cada una, quiere saber la cantidad promedio de fósforos que hay en cada caja. Conoce, por experiencia, que las máquinas que intervienen en el proceso casi nunca colocan 100 fósforos, pero sí cantidades que no difieren sustancialmente de 100. 
Para conocer la cantidad promedio de fósforos, toma una muestra de 10 cajas y anota los resultados que observa:


Como nota que el valor 70 es demasiado diferente, no lo toma en cuenta para el promedio: está seguro de que hubo algún problema con la máquina que intervino en el envasado de esa caja. El fabricante desecha ese dato y realiza el promedio con las cantidades restantes:

 
con lo que, entonces, tiene la seguridad de que el promedio obtenido informa aceptablemente acerca del funcionamiento de sus máquinas, en general, y de los fósforos ofrecidos en venta.

Hay algunos fabricantes que tienen reparos en desechar valores significativamente diferentes (como la cantidad 70 del ejemplo anterior) y prefieren utilizar otro indicador estadístico llamado mediana. La mediana se calcula ordenando los datos de menor a mayor. Si la cantidad de datos es par, se toma el promedio de los dos datos del centro. Si la cantidad es impar, el dato que aparece en el centro es la mediana. En el caso de los fósforos, hay diez datos. Al ordenarlos, queda la siguiente sucesión:

en la que se destacaron los valores centrales. El promedio usual de estos dos valores es:
En conclusión, la mediana arroja un valor aceptable, que no está afectado por la cantidad 70. Conviene destacar que el valor informativo de la mediana (a diferencia del promedio) está menos afectado por valores que puedan surgir como producto de errores y que, por lo tanto, podrían ser estadísticamente indeseables.


Comentarios