Según el estudio al que se hace referencia en el blog La Ciencia de la Mula Francis, nuestra estatura durante la noche aumenta entre 10 y 25 mm. Luego, durante el día, perdemos esos milímetros. Quiero comprobar si en mi caso y en el de Gabriela esto se cumple(no me veo pidiendo a ninguna otra persona que se deje medir 24 veces durante 4 días). Para ello utilizaré el concepto 'intervalo de confianza'. Avanzo mis conclusiones: sí, Gabriela y yo crecemos durante la noche, pero no crecemos los dos lo mismo, (ella crece más), ni todas las noches lo mismo, y no siempre entre 10 y 25 mm.
Antes de empezar con el estudio, quiero hacer una breve introducción sobre los intervalos de confianza. Utilizaré un ejemplo relacionado con un proceso industrial. Imaginemos que en un proceso de moldeado de vidrio la altura de las botellas sale por debajo de la especificación, y queremos hacer una prueba para ver si mejoramos esa cota. Hemos fabricado 100 000 botellas y de estas hemos medido 100. La media de esas 100 botellas es 99,1 mm. Entonces cambiamos un parámetro del proceso buscando que la botella salga más alta. Fabricamos 2000 botellas y medimos 20. Estas 20 nos dan una media de 99,3. Es decir, la media de 20 botellas después está mejor que la de 100 botellas antes. Pero lo más probable es que si midiéramos las 100 000 botellas de antes la media sería algo diferente que la media de la muestra, 99,1. Y si midiéramos las 2000 botellas de después la media tampoco sería 99,3.
Lo que si podemos hacer en base a cada muestra es establecer un 'intervalo de confianza' de la media. Podremos decir, por ejemplo, 'La media de las 100 000 botellas antes está entre a y b, con una confianza del 95% '. Así, podremos comparar el intervalo de confianza de las medias antes del cambio y el intervalo después, y si no se solapan, podremos decir que los datos que tenemos nos llevan a afirmar que las botellas de después son más altas. La definición que recoge Wikipedia es la siguiente:
En estadística, se llama a un par o varios pares de números entre los cuales se estima que estará cierto valor desconocido con una determinada probabilidad de acierto. Formalmente, estos números determinan un intervalo, que se calcula a partir de datos de una muestra, y el valor desconocido es un parámetro poblacional. La probabilidad de éxito en la estimación se representa con 1 - α y se denomina nivel de confianza. En estas circunstancias, α es el llamado error aleatorio o nivel de significación, esto es, una medida de las posibilidades de fallar en la estimación mediante tal intervalo.1
Vuelvo con el estudio de la estatura. En la anterior entrada que trataba de contrastar este estudio con los datos que yo podía tener a mano llegaba a la conclusión de que si quería ver cambios de 10 mm. entre el momento de levantarse y el de acostarse tenía que centrarme en Gabriela y yo mismo, ya que el proceso de medida en el caso de los niños tenía una variabilidad excesiva.
1º LOS DATOS DE PARTIDA
En la siguiente tabla recojo los datos obtenidos durante 4 días. Para reducir la variabilidad del sistema de medida el dato de estatura es la media de tres estaturas, medidas una detrás de otra. He medido las estaturas justo al levantarnos y al acostarnos, y estos son los resultados.
2º PRIMERA CONCLUSIÓN, CON PREGUNTA
No todos los días uno crece lo mismo en la cama. Y hay días en los que yo crezco menos de 10 mm. Pero, ¿puede que la media de lo que yo crezco esté entre 10 y 25 mm? Para responder a esta pregunta asumo unas premisas que pueden no ser exactas, (y que exigirían más datos).
3º CÁLCULO DE INTERVALOS DE CONFIANZA
Con las premisas anteriores, calculo el intervalo de confianza con una probabilidad de éxito del 95%, para lo que varía mi estatura y la de Gabriela. El cálculo lo hago según la fórmula que ofrece wikipedia y está en esta tabla.
Con una probabilidad de equivocarnos del 5%, podemos decir que la media de lo que crece Gabriela está entre 17,7 y 21,3, y la media de lo que crezco yo está entre 8,25 y 12,8. Y por lo tanto, en lo que se refiere a las medias, el caso de Gabriela y mío encaja en las conclusiones del estudio de La Mula Francis.
Para terminar, comparto un artículo que habla del riesgo de tomar decisiones tomando como significativos resultados que son producto del azar. Por poner otro ejemplo diferente al del artículo, nadie apostaría todos sus ahorros a que al lanzar una moneda vaya a salir cara sólo porque en los dos primeros lanzamientos haya salido cara, y sin embargo en muchas ocasiones se toman decisiones en base a datos como esos. De eso habla este artículo.
http://blogs.hbr.org/2014/08/sometimes-you-win-sometimes-you-lose-and-sometimes-its-meaningless/
Antes de empezar con el estudio, quiero hacer una breve introducción sobre los intervalos de confianza. Utilizaré un ejemplo relacionado con un proceso industrial. Imaginemos que en un proceso de moldeado de vidrio la altura de las botellas sale por debajo de la especificación, y queremos hacer una prueba para ver si mejoramos esa cota. Hemos fabricado 100 000 botellas y de estas hemos medido 100. La media de esas 100 botellas es 99,1 mm. Entonces cambiamos un parámetro del proceso buscando que la botella salga más alta. Fabricamos 2000 botellas y medimos 20. Estas 20 nos dan una media de 99,3. Es decir, la media de 20 botellas después está mejor que la de 100 botellas antes. Pero lo más probable es que si midiéramos las 100 000 botellas de antes la media sería algo diferente que la media de la muestra, 99,1. Y si midiéramos las 2000 botellas de después la media tampoco sería 99,3.
Lo que si podemos hacer en base a cada muestra es establecer un 'intervalo de confianza' de la media. Podremos decir, por ejemplo, 'La media de las 100 000 botellas antes está entre a y b, con una confianza del 95% '. Así, podremos comparar el intervalo de confianza de las medias antes del cambio y el intervalo después, y si no se solapan, podremos decir que los datos que tenemos nos llevan a afirmar que las botellas de después son más altas. La definición que recoge Wikipedia es la siguiente:
En estadística, se llama a un par o varios pares de números entre los cuales se estima que estará cierto valor desconocido con una determinada probabilidad de acierto. Formalmente, estos números determinan un intervalo, que se calcula a partir de datos de una muestra, y el valor desconocido es un parámetro poblacional. La probabilidad de éxito en la estimación se representa con 1 - α y se denomina nivel de confianza. En estas circunstancias, α es el llamado error aleatorio o nivel de significación, esto es, una medida de las posibilidades de fallar en la estimación mediante tal intervalo.1
Vuelvo con el estudio de la estatura. En la anterior entrada que trataba de contrastar este estudio con los datos que yo podía tener a mano llegaba a la conclusión de que si quería ver cambios de 10 mm. entre el momento de levantarse y el de acostarse tenía que centrarme en Gabriela y yo mismo, ya que el proceso de medida en el caso de los niños tenía una variabilidad excesiva.
1º LOS DATOS DE PARTIDA
En la siguiente tabla recojo los datos obtenidos durante 4 días. Para reducir la variabilidad del sistema de medida el dato de estatura es la media de tres estaturas, medidas una detrás de otra. He medido las estaturas justo al levantarnos y al acostarnos, y estos son los resultados.
Persona | Día | Estatura noche | Estatura Mañana | Diferencia |
Gabriela | 1 | 1646,7 | 1667 | 20,3 |
Gabriela | 2 | 1650 | 1667,7 | 17,7 |
Gabriela | 3 | 1649,3 | 1667,7 | 18,3 |
Gabriela | 4 | 1644,3 | 1666 | 21,7 |
Juan | 1 | 1822,7 | 1830,3 | 7,7 |
Juan | 2 | 1822,7 | 1835,7 | 13 |
Juan | 3 | 1822,7 | 1834,3 | 11,7 |
Juan | 4 | 1823,3 | 1833 | 9,7 |
2º PRIMERA CONCLUSIÓN, CON PREGUNTA
No todos los días uno crece lo mismo en la cama. Y hay días en los que yo crezco menos de 10 mm. Pero, ¿puede que la media de lo que yo crezco esté entre 10 y 25 mm? Para responder a esta pregunta asumo unas premisas que pueden no ser exactas, (y que exigirían más datos).
- Premisa 1: la distribución de la diferencia de estatura entre la noche y la mañana sigue una distribución normal.
- Premisa 2: los 4 días que he medido son representativos. (Esta premisa me genera más dudas, pues dadas las razones que expone La Mula Francis, posiblemente influya lo que uno duerma (y en vacaciones se duerme más) y la actividad física que uno haga de día).
3º CÁLCULO DE INTERVALOS DE CONFIANZA
Con las premisas anteriores, calculo el intervalo de confianza con una probabilidad de éxito del 95%, para lo que varía mi estatura y la de Gabriela. El cálculo lo hago según la fórmula que ofrece wikipedia y está en esta tabla.
Con una probabilidad de equivocarnos del 5%, podemos decir que la media de lo que crece Gabriela está entre 17,7 y 21,3, y la media de lo que crezco yo está entre 8,25 y 12,8. Y por lo tanto, en lo que se refiere a las medias, el caso de Gabriela y mío encaja en las conclusiones del estudio de La Mula Francis.
Persona | Día | Estatura noche | Estatura Mañana | Diferencia |
Gabriela | 1 | 1646,7 | 1667 | 20,3 |
Gabriela | 2 | 1650 | 1667,7 | 17,7 |
Gabriela | 3 | 1649,3 | 1667,7 | 18,3 |
Gabriela | 4 | 1644,3 | 1666 | 21,7 |
Media muestra | 1.647,58 | 1.667,10 | 19,50 | |
Desviación muestra | 2,60 | 0,80 | 1,84 | |
Límite superior | 17,70 | |||
Límite inferior | 21,30 | |||
Persona | Día | Estatura noche | Estatura Mañana | Diferencia |
Juan | 1 | 1822,7 | 1830,3 | 7,7 |
Juan | 2 | 1822,7 | 1835,7 | 13 |
Juan | 3 | 1822,7 | 1834,3 | 11,7 |
Juan | 4 | 1823,3 | 1833 | 9,7 |
Media muestra | 1822,85 | 1833,325 | 10,525 | |
Desviación muestra | 0,3 | 2,30 | 2,32 | |
Límite superior | 8,25 | |||
Límite inferior | 12,80 |
Para terminar, comparto un artículo que habla del riesgo de tomar decisiones tomando como significativos resultados que son producto del azar. Por poner otro ejemplo diferente al del artículo, nadie apostaría todos sus ahorros a que al lanzar una moneda vaya a salir cara sólo porque en los dos primeros lanzamientos haya salido cara, y sin embargo en muchas ocasiones se toman decisiones en base a datos como esos. De eso habla este artículo.
http://blogs.hbr.org/2014/08/sometimes-you-win-sometimes-you-lose-and-sometimes-its-meaningless/
Comentarios
Publicar un comentario