
Resumen del libro The Book Of Why. The New Science Of Cause And Effe: The New Science of Cause and Effect por Judea Pearl y Dana Mackenzie
Resumen corto: The Book of Why (2018) introduce conceptos básicos de métodos estadísticos y nos explica como entender el mundo a través de un modelo matemático de causalidad. Durante décadas, los estadísticos han insistido en el mantra «correlación no implica causalidad». El resultado ha sido el estancamiento en muchas formas de investigación, y este libro tiene como objetivo cambiar esta tendencia.
¿Quién es Judea Pearl?
Judea Pearl es una científica y filósofa. En 2011, ganó el premio Turing, el prestigioso premio en informática. Es autor de Causality, Probabilistic Reasoning in Intelligent Systems and Causal Inference in Statistics.
¿Quién es Dana Mackenzie?
Dana Mackenzie es escritora y matemática. Es el autor de The Universe in Zero Words y The Big Splat, o How Our Moon Came to Be.
Colección de Los mejores libros de Productividad y Aprendizaje(PDF)


La causalidad
No importa cuál sea nuestra disciplina o lo que hagamos para ganarnos la vida, en algún momento estamos obligados a tener algunas preguntas fundamentales sobre cómo las cosas llegaron a ser como son, o cómo deberían ser.
Cuando pasamos de la experiencia personal y anecdótica y buscamos reglas más sustanciales para seguir adelante, podemos usar las matemáticas y las estadísticas para ayudarnos. Para sacarle partido, debemos distinguir entre los factores que afectan el resultado y los que parecen hacerlo, separar entre causalidad y correlación.
La causalidad indica que una relación es de causa y efecto, mientras que la correlación implica una especie de conexión entre dos variables, pero nada lo es.
En este libro, los autores Pearl y Mackenzie nos ayudan a replantear algunas de las «verdades» básicas en matemáticas, para sacar un mayor partido a nuestro conocimiento y mejorar nuestro proceso de toma de decisiones. Incluso podríamos aprender a jugar un poco mejor con nuestra vida en el camino.
Correlación no implica causalidad
La frase «correlación no implica causalidad» se ha aceptado como un hecho durante las últimas décadas. En parte, esto se debe al hecho de que la comunidad científica ha minimizado la causalidad como idea. A principios del siglo XX, el matemático inglés Karl Pearson personificó este punto de vista.
El laboratorio de biometría de Pearson era la principal autoridad en estadística del mundo, y era probable que afirmara que la ciencia no era más que datos puros. La idea era que, dado que no se podía probar la causalidad, no se podía representar como datos.
Vio la causalidad como científicamente inválida. A Pearson le gustaba probar su punto señalando correlaciones que consideraba falsas. Uno de sus ejemplos favoritos era la observación de que si una nación consume más chocolate per cápita, produce más premios Nobel. Para él, era una correlación sin sentido, buscar la causalidad era innecesario.
Pero este intento de ridiculizar esconde un factor causal. Es más probable que las naciones más ricas consuman más chocolate, ya que es más probable que produzcan avances científicos notorios para el comité del Nobel.
Además de eso, más tarde resultó que la causalidad podía representarse matemáticamente. Esto es lo que demostró el genetista Sewall Wright mientras investigaba en la Universidad de Harvard en 1912.
Wright estaba estudiando las marcas en el pelaje de las cobayas para determinar hasta qué punto eran hereditarias. Encontró la respuesta a esta pregunta causal utilizando datos.
Comenzó con un diagrama matemático. Wright dibujó flechas que conectaban causas y resultados, vinculando los colores del pelaje de los animales con los factores contribuyentes en su medio ambiente y desarrollo.
Wright desarrolló un diagrama para representar estas relaciones, en el que un signo «mayor que» (>) significa «tiene un efecto». : factores de desarrollo> período de gestación> patrón del pelaje.
Wright luego convirtió este diagrama en una ecuación algebraica, usando los datos recolectados. Demostró que el 42 por ciento del patrón de pelaje de Gwen fue causado por la herencia, mientras que el 58 por ciento fue el resultado de factores de desarrollo.
Esto no significa que podamos encontrar causalidad en cualquier tipo de correlación, pero sí que significa que antes de decir que hay dos elementos que no tienen una relación real, deberíamos estudiar el trasfondo y ver si realmente hay alguna relación. En el caso del chocolate seguimos sin poder decir que haya causalidad entre el consumo de chocolate per cápita de un país y el número de premios Nobel. Pero sí que podemos decir que ambos factores podrían estar afectados por un tercero que quizá no hemos tenido en cuenta en nuestro análisis.
Mi toma en el tema es que lo Pearson estaba intentando hacer era advertirnos de los peligros de depender demasiado de los datos, porque con suficientes datos, casi siempre hay algún tipo de correlación. Aunque todo esté relacionado porque todo en el mundo interactúa, cuando hablamos de causalidad nos referimos a que algo tiene un efecto suficientemente grande como para que sabiendo lo que pasa en x podamos hacer predicciones sobre el comportamiento de y.
Siguiendo con el ejemplo de chocolate, si tuviésemos una nación imaginaria llamada Chocolate Lover, en la que un 3 del PIB va a consumir chocolate, podríamos tener una nación con un consumo de chocolate extremadamente alto, pero que quizá no tiene un aumento en el numero de premios Nobel. La correlación entre premios Nobel y consumo de chocolate solo tiene sentido si el uso de recursos de los países es similar en porcentajes.
Para solucionar este problema, los autores han desarrollado un proceso para mirar más allá de la observación inicial de los datos. Lo llaman la Escalera de la causalidad.
