Resumen del libro La Señal y el Ruido por Nate Silver (The Signal and The Noise)

Resumen del libro La Señal y el Ruido por Nate Silver (The Signal and The Noise)

Resumen corto: The Signal and the Noise o en español La señal y el ruido: Cómo navegar por la maraña de datos que nos inunda, localizar los que son relevantes y utilizarlos para elaborar predicciones infalibles nos explica porque tantas predicciones se equivocan y como solemos ser ‘’víctimas’’ de un mal uso de los datos y como evitar caer en los errores mas típicos. Por Nate Silver

¿Quien es Nate Silver?

Nate Silver es el autor del blog FiveThirtyEight en el que escribe lo que aprende sobre estadística, probabilidad y cómo funciona nuestra toma de decisiones. 

Su éxito a la hora de predecir cómo irían las elecciones de 2008 y sus predicciones sobre baseball hicieron que su blog fuese tan famoso que acabase siendo adquirido por ESPN

Su conocimiento sobre el campo de la estadística y la toma de decisiones ha sido condensado en el libro La Señal y el Ruido, para ayudarnos a tomar mejores decisiones.

3 de las ideas principales del libro The Signal and the Noise por Nate Silver

  • La mayoría de los economistas intentan hacer predicciones demasiado concretas
  • Hoy en día tenemos mucha información, pero sin criterio no vale nada
  • El teorema de Bayes

La mayoría de los economistas intentan hacer predicciones demasiado concretas

Los economistas, los comentadores de deportes, y la mayoría de profesiones que se dedican a hacer predicciones, tienen algo en común, se equivocan mas del 50% del tiempo. 

La razón por la que estos ‘’expertos’’ en los que muchos de nosotros confiamos, fallan tan a menudo, se debe principalmente a 2 factores:

  • Intentan ir demasiado al detalle, y la estadística no es capaz de decirnos algo tan preciso
  • Se olvidan de que el hecho de que creemos que algo sea mas probable, o cierto, no hace que lo sea

La estadística nos permite obtener intervalos de confianza que nos dicen por ejemplo que cierto evento tiene un 90% de posibilidades tener entre el valor x y z. 

Esto significa que con una gran probabilidad tendrá alguno de los valores en ese intervalo, pero nunca es 100% seguro, y la probabilidad de cualquier valor concreto siempre será infinitamente próxima a 0

Porque no podemos saber realmente que pasara tan al detalle. No tenemos ni las herramientas ni el conocimiento para ello hoy en día. Por eso solo podemos trabajar con intervalos

El segundo factor es simplemente que nos gusta autoengañarnos. De la misma forma que pensamos que si sale cara 10 veces debería salir cruz después, cuando en realidad la probabilidad es en teoría siempre del 50%.

Nos gusta creer lo que nos conviene en vez de aceptar la incertidumbre, porque nos hace sentir mas seguros, nos da confianza. Pero esa confianza la conseguimos a cambio de poder fallar a lo grande

Pero esto no significa que nuestro criterio no tenga utilidad.

Hoy en día tenemos mucha información, pero sin criterio no vale nada

Hoy en día, gracias a internet y los ordenadores, vivimos en la era de la información. Una era en la que tenemos tantos datos que es imposible que alguien los analice todos, y esto nos lleva a usar máquinas y programas para ello

Tener información, aunque no sea realmente útil, nos hace sentir bien, nos hace sentir seguros, como si tuviésemos algo sobre lo que sostenernos en una época llena de incertidumbre, y por eso tendemos a querer aceptar lo que nos dicen los datos

El problema es que muchas veces no sabemos cómo usar estos programas, o no entendemos del todo lo que nos quieren decir. 

Decidimos que solo porque nos lo diga una máquina ha de ser verdad, y olvidamos que esa máquina ha sido creada por personas y por lo tanto deberíamos poder entender los principios que lo rigen

Si algo es creado por humanos, es casi imposible que no descubramos errores en algún momento. Simplemente porque cada vez tenemos más información, y es probable que algo que pensábamos que era cierto hace 50 años no lo sea.

Por eso debemos usar una mentalidad crítica cada vez que trabajamos con datos, porque nunca podemos fiarnos al 100% de algo, y por lo tanto debemos medir la probabilidad de que sea cierto y las consecuencias de cada posibilidad

Solo entonces podremos pasar de ser controlados por número que no entendemos, a tener el poder de tomar decisiones y entender mejor el mundo. Aunque en todo momento debemos tener cuidado con los bias que tenemos dentro.

Lo queramos o no, en todo momento estamos siendo controlados por un montón de bias, es decir factores que afectan a nuestro juicio de forma subconsciente mientras nos dan la ilusión de que estamos siendo objetivos o razonables

Entre los bias más peligrosos está el de asumir que correlación y causalidad son lo mismo. Que dos cosas parezcan tener una relación, no implica que estas dos cosas tengan un efecto directo la una sobre la otra

Todo esta conectado, pero en un momento en el que no tenemos ni la tecnología ni el conocimiento suficiente para saber realmente qué conexiones existen, nos importa más la magnitud de la conexión que si existe o no una conexión

El teorema de Bayes

Uno de los teoremas más útiles en el mundo de estadística es el teorema de Bayes que nos permite ‘’medir’’ lo probable que es algo si asumimos que un ‘’hecho’’ es cierto

Esto significa que Bayes nos permite medir probabilidad condicional, de forma que la probabilidad que medimos de que pase el suceso B, solo tiene sentido si ha pasado el suceso A antes

Una forma de entenderlo es pensar que si ver la probabilidad de llegar a la ciudad B tras pasar por la ciudad A, la única forma de que usar Bayes tenga sentido es que realmente hayamos pasado por la ciudad A

Si vamos por otra ruta que no pase por A, entonces no tiene sentido calcular la probabilidad de pasar por A y llegar a B

Otro ejemplo típico que se suele usar para explica Bayes es el de que tenemos 1 caja con 5 bolas, entre ellas 4 rojas y 1 azul. Si queremos saber la probabilidad de sacar una bola azul la segunda vez que sacamos, habiendo sacado una roja la primera vez, solo podemos sacar 1 bola cada vez

En este ejemplo la probabilidad de sacar la bola azul la segunda vez, está condicionada por qué bola saquemos la primera. Si en cambio tras sacar una bola, volviesemos a meterla en la caja, entonces no tendría sentido hablar de probabilidad condicional, porque volvemos a la situación inicial

Ahora que sabemos que es la probabilidad condicional, lo siguiente es entender cómo funciona Bayes

Si una mujer se hace un mamograma, y la probabilidad de que sea un falso positivo, que no lo tenga de verdad, es del 15% y la probabilidad de tener la enfermedad es del 1% en la población y que la probabilidad de que el mamograma salga positivo es del 25% ¿Cuál es la posibilidad de que tenga cáncer de mama, si sale positivo para cáncer?

Podríamos pensar que la probabilidad de que realmente lo tenga si le ha dado positivo es de un 85%, porque solo el 15% de los positivos son falsos positivos. Pero la realidad es diferente, porque tenemos que tener en cuenta que solo el 1% de todas las personas tienen la enfermedad

Esto significa que en realidad la probabilidad es de 0.01*0.25 + 0.1*0.85 porque solo tiene sentido medir la probabilidad si sabemos cuántas personas tienen cáncer, sabemos cuántos de los que hacen el test salen positivos y sabemos cuantos de los test positivos son realmente positivos

Nuestras Categorias de Resumenes

Leave a Reply

Your email address will not be published. Required fields are marked *

This site uses Akismet to reduce spam. Learn how your comment data is processed.