Correlación no es causalidad

Una de las diferencias que más me gusta resaltar es la que existe entre causalidad y correlación. ¿Cómo es esto? Allá vamos:

Para este ejemplo tomemos como lugar un campo y prestemos atención al gallo. Una “interesante” tarea podría ser anotar en un cuaderno la hora en la cada día canta el gallo y aparece el sol. Repitamos el ejercicio por un determinado período, digamos, un mes.

Si no me mintieron de chico deberíamos observar que cada vez que canta el gallo aparece el sol (nunca lo comprobé, pero supongamos que sí). He aquí un gran hallazgo: el canto del gallo provoca la salida del sol. ¿No? ¿El sol sale por otra cosa?

Bien, acá llegamos. Cuando dije que el gallo provocaba la salida del sol estaba alegando causalidad. Es decir, estaba afirmando que un evento A (canto del gallo) provocaba al evento B (salida del sol). Sin embargo, lo que tenía por delante no era más que una correlación, es decir, una relación recíproca entre dos variables. En palabras más claras, dos cosas se estaban moviendo juntas.

Prestemos atención al detalle de que ni siquiera cuando un evento ocurre después del otro puedo afirmar que existe causalidad. Cuando observo una correlación alta entre dos variables, A y B, y afirmo que A provoca a B podrían estar sucediendo otras cosas.

Por ejemplo, podría suceder que sea B quien cause a A. O tal vez podría existir una tercera variable, llamemos C, que estuviera causando a A y a B. O, y este es el caso que más me gusta, podría estar sucediendo que A y B se movieran por causas totalmente distintas, que no tienen nada que ver una con la otra.

Las diferencias entre los dos conceptos parecieran ser claras, y los peligros de confundirlos también. Sin embargo, existe mucho estudio que deduce conclusiones y causalidades a partir de la observación de correlaciones. Algunos sobre temas muy delicados y sensibles y que se ven compartidos por las redes sociales más de lo que uno desearía. Otros son la base de fuertes postulados de la economía y que llegan a ser tomados, incluso, como algún tipo de axioma. Acerca de esos estudios en algún otro post haré mención.

¿Existe alguna manera de determinar causalidad? Sí. ¿Cómo? Otro día lo charlamos.

Para terminar, les dejo un gran sitio web que muestra las correlaciones más absurdas que se puedan imaginar. Es muy ilustrativo para ejemplificar el caso en que dos variables se mueven juntas a pesar de no tener nada que ver una con la otra.

Por ejemplo, desde 1999 al 2009 se observa que la cantidad de películas en las que aparece Nicolas Cage está positivamente correlacionado con la cantidad de personas que mueren ahogadas en una pileta por año en Estados Unidos. Es decir, cuando Nicolas Cage aparece en más películas, más gente muere. Nicolas Cage es malo. ¡Asesino!

 

http://www.tylervigen.com/spurious-correlations

 

 

 

Deja un comentario

Tu dirección de correo electrónico no será publicada.