
Resumen del libro Todo el mundo miente Lo que internet y el big data pueden decirnos sobre nosotros mismos por Seth Stephens-Davidowitz(2019) (Everybody Lies 2017)
Resumen corto: Everybody Lies o en español Todo el mundo Miente, presenta las ideas y descubrimientos que se consiguieron tras estudiar el sin fin de datos recopilados en Internet. Estos datos pueden ayudar a revelar información fascinante sobre la psicología, el comportamiento y las peculiaridades humanas. Resulta que las personas no solemos decir lo que realmente nos interesa a los demás.
No importa cuán fieles a nuestros principios y a los que nos rodean decimos ser, hasta cierto punto, seguimos mintiendo. Ya sea que se trate de inflar nuestras cualidades en una encuesta sobre nuestro estilo de vida o no contar tipo de cosas raras que hacemos cuando nadie está mirando, todos “obviamos” cierta información o usamos lo que en inglés se conoce como “white lie” o mentiras “piadosas”.
Pero con la creciente cantidad de datos que se recopilan, ahora es posible analizar patrones en nuestro comportamiento e identificar preferencias que nunca habríamos descubierto. En este resumen, aprenderemos más sobre lo que Big Data tiene para ofrecer; desde informar sobre el estado de nuestra salud, hasta revelar peculiaridades humanas, y realizar un sinfín de experimentos.
¿Quién es Seth Stephens-Davidowitz?
Seth Stephens-Davidowitz es un experto en datos de Internet y en big data en particular. Tiene diplomas de las universidades de Stanford y Harvard y anteriormente trabajó como científico de datos en Google.
Colección de Los mejores libros de Productividad y Aprendizaje(PDF)


¿Qué es el Big Data?
Big data se refiere a un gran volumen de datos, de tal magnitud, que la mente humana difícilmente puede comprenderlo. El big data es todo grupo de datos para los que se requiere poder computacional para reconocer patrones.
Utilizar los datos recopilados correctamente es esencial para refinar nuestra visión del mundo. Los datos nos proporcionan el material para confirmar o refutar nuestras corazonadas. Nos ayudan a identificar patrones y predicciones más precisos que la experiencia personal por sí sola. Pero todo esto solo es cierto si somos capaces de hacerlo de forma efectiva, y evitamos caer en sesgos cognitivos.
Por ejemplo, uno de los peligros que existe con el big data, es que casi cualquier cosa puede “ser cierta”, si jugamos con la estadística, por lo que es importante confirmar si nos estamos dejando llevar por el sesgo de confirmación o por algún error estadístico.
Cómo usar la ciencia de datos
La ciencia de datos, o data science, es una herramienta de gran utilidad, no por la cantidad de datos recopilados, sino el tipo de datos y la posibilidad de revelar patrones o hacer predicciones.
Google es un ejemplo de ello. El motor de búsqueda de Larry Page, fundado en 1998, se convirtió en un gigante no porque fueran capaces de recopilar datos. Más bien, lo que distingue a Google es que los datos recopilados se pueden usar de forma eficiente.
Antes de Google, cuando escribíamos “Daniel Goleman” en un motor de búsqueda, obteníamos páginas web que contenían la frase con más frecuencia, por lo que varios de ellos seguramente serían irrelevantes, o no tan buenos como nos gustaría. Los algoritmos Google se basaban en “relevancia”, definida al principio el número de enlaces de otros sitios hacia el resultado.
El enfoque de Google es un buen ejemplo de cómo podemos hacer predicciones basadas en los datos que tenemos, incluso si estos datos a simple vista no miden lo que buscamos. Por ejemplo, podríamos usar el big data con datos de Google para hacer un seguimiento de la propagación de alguna enfermedad, y eso es lo que hizo el ingeniero de Google Jeremy Ginsberg.
Demostró que las búsquedas en Google relacionadas con la gripe, como “síntomas de la gripe”, permiten hacer un seguimiento de la propagación de la enfermedad en distintas áreas geográficas.
El bigdata y la fruta
Se encuestó a los recién graduados de la Universidad de Maryland sobre sus notas, y entre los encuestados, el dos por ciento admitió que se habían graduado con una media inferior a 2,5 en una escala de cuatro puntos. Sin embargo; según los registros oficiales, la cifra fue un 1,1 por ciento. Este es un ejemplo, demuestra nuestra tendencia a contar “pequeñas mentiras”.
Las razones pueden ser varias, y dependen tanto del contexto, como de la persona o nuestro estado de ánimo. Según el autor, una de las principales razones es por aparentar. Es natural que queramos quedar bien, tanto para nosotros mismos como para los demás, las personas adaptan sus respuestas para tener una visión más positiva de sí mismas.
Este comportamiento de dar respuestas que nos hace parecer mejores se llama deseabilidad social. Queremos causar una buena impresión, incluso cuando se trata de encuestas anónimos, y a veces incluso nos lo creemos. Esta tendencia a mentir hace que las encuestas no sean poco fiables para tratar de entender el comportamiento, los pensamientos, los deseos y las creencias.
Aquí es donde entra el big data, los datos no mienten. Debido a que se recopila a través de un comportamiento online sin filtrar, uno de los pocos momentos en los que “creemos que nadie nos ve” revela más sobre nuestra naturaleza.
Uno de los ejemplos que menciona el autor es el del sexo anal. ¿Admitiría la gente que le gusta o que fantasea con ello? Probablemente no. Pero cuando el autor analizó datos del PornHub, descubrió que algunas mujeres buscaban “anal manzana”, lo que demuestra que existe gente con la parafilia de introducir fruta por su retaguardia, y que los datos nos pueden decir más sobre los seres humanos de lo que creemos.
Es difícil entender cuan grande es el big data
Cada día, cantidades asombrosas de datos vuelan solo a través de Google, sin mencionar otros motores de búsqueda u otras páginas web en general. El volumen de estos datos significa que ahora podemos hacer cosas que nunca antes podíamos hacer. Este es el tercer gran poder del big data.
El tamaño de los conjuntos de datos significa que podemos acercarnos y extraer información de forma de fiar. Consideremos un ejemplo del mundo real. El profesor de Harvard, Raj Chetty, quería investigar si la gente pensaba que el sueño americano todavía estaba vivo.
Decidió usar big data para ayudar a cultivar una respuesta a una pregunta precisa de : ¿pueden las personas cuyos padres son pobres convertirse en ricas? El equipo de Chetty utilizó registros fiscales recopilados por el Servicio de Impuestos Internos de Estados Unidos.
En total, tenían más de mil millones de observaciones fiscales. Los datos fueron reveladores. Mostró que, en comparación con otros países desarrollados como Dinamarca y Canadá, la situación en Estados Unidos no era buena para la gente pobre. Un estadounidense pobre tenía un 7,5 por ciento de posibilidades de lograr el éxito en el campo que eligió.
Pero para los daneses y los canadienses, las posibilidades eran de un 13,5 por ciento. Ese era el panorama general, pero la belleza del big data es que Chetty podía acercarse a diferentes estados, ciudades, pueblos y vecindarios.
Cuando lo hizo, descubrió que los datos revelaron que el sueño americano existía, pero solo en unos pocos lugares. En San Jose, California, un estadounidense pobre tenía un 12,9 por ciento de posibilidades de hacerse rico.
Pero para un estadounidense que crece en Charlotte, Carolina del Norte, las posibilidades eran solo del 4,4 por ciento. Es esta capacidad de acercamiento lo que demuestra cómo el big data puede brindarnos una comprensión matizada del mundo, donde sea y a la escala que elijamos.
