Llegar al corazón de la causalidad es fundamental para comprender el mundo que nos rodea.
Lo que hace que una variable (ya sea una especie biológica, una región de votación, las acciones de una empresa o un clima local) cambie de un estado a otro puede informar cómo podríamos moldear esa variable en el futuro.
Pero rastrear un efecto hasta su causa raíz puede volverse rápidamente insoluble en sistemas del mundo real, donde muchas variables pueden converger, confundir y oscurecer cualquier vínculo causal.
Ahora, un equipo de ingenieros del MIT espera proporcionar algo de claridad en la búsqueda de la causalidad.
Desarrollaron un método que se puede aplicar a una amplia gama de situaciones para identificar aquellas variables que probablemente influyan en otras variables en un sistema complejo.
El método, en forma de algoritmo, toma datos que se han recopilado a lo largo del tiempo, como las poblaciones cambiantes de diferentes especies en un entorno marino.
A partir de esos datos, el método mide las interacciones entre cada variable de un sistema y estima el grado en que un cambio en una variable (por ejemplo, la cantidad de sardinas en una región a lo largo del tiempo) puede predecir el estado de otra (como la población de anchoas en la misma región).
Luego, los ingenieros generan un “mapa de causalidad” que vincula las variables que probablemente tengan algún tipo de relación de causa y efecto.
El algoritmo determina la naturaleza específica de esa relación, por ejemplo, si dos variables son sinérgicas (es decir, una variable solo influye en otra si está emparejada con una segunda variable) o redundantes, de modo que un cambio en una variable puede tener exactamente el mismo efecto, y por lo tanto redundante, que otra variable.
El nuevo algoritmo también puede realizar una estimación de la “fuga causal”, o el grado en que el comportamiento de un sistema no se puede explicar a través de las variables disponibles; debe estar en juego alguna influencia desconocida y, por lo tanto, se deben considerar más variables.
“La importancia de nuestro método radica en su versatilidad en distintas disciplinas”, afirma Álvaro Martínez-Sánchez, estudiante de posgrado del Departamento de Aeronáutica y Astronáutica (AeroAstro) del MIT.
“Puede aplicarse para comprender mejor la evolución de las especies en un ecosistema, la comunicación de las neuronas en el cerebro y la interacción de las variables climatológicas entre regiones, por nombrar algunos ejemplos”.
Por su parte, los ingenieros planean utilizar el algoritmo para ayudar a resolver problemas en el sector aeroespacial, como la identificación de características en el diseño de aeronaves que puedan reducir el consumo de combustible de un avión.
“Esperamos que al incorporar la causalidad en los modelos, nos ayude a comprender mejor la relación entre las variables de diseño de una aeronave y cómo se relaciona con la eficiencia“, afirma Adrián Lozano-Durán, profesor asociado de AeroAstro.
En los últimos años, se han desarrollado varios métodos computacionales para tomar datos sobre sistemas complejos e identificar vínculos causales entre las variables del sistema, basándose en ciertas descripciones matemáticas que deberían representar la causalidad.
“Los distintos métodos utilizan distintas definiciones matemáticas para determinar la causalidad“, señala Lozano-Durán.
“Hay muchas definiciones posibles que parecen correctas, pero pueden fallar en determinadas condiciones”.
En particular, dice que los métodos existentes no están diseñados para diferenciar entre ciertos tipos de causalidad.
Es decir, no distinguen entre una causalidad “única“, en la que una variable tiene un efecto único sobre otra, aparte de todas las demás variables, y un vínculo “sinérgico” o “redundante”.
Un ejemplo de causalidad sinérgica sería si una variable (por ejemplo, la acción del fármaco A) no tuviera efecto sobre otra variable (la presión arterial de una persona), a menos que la primera variable estuviera emparejada con una segunda (el fármaco B).
Un ejemplo de causalidad redundante sería si una variable (los hábitos de trabajo de un estudiante) afecta a otra variable (su probabilidad de obtener buenas calificaciones), pero ese efecto tiene el mismo impacto que otra variable (la cantidad de sueño que obtiene el estudiante).
“Otros métodos se basan en la intensidad de las variables para medir la causalidad”, añade Arranz.
“Por lo tanto, pueden pasar por alto vínculos entre variables cuya intensidad no es fuerte pero que son importantes”.
En su nuevo enfoque, los ingenieros tomaron como base la teoría de la información (la ciencia que estudia cómo se comunican los mensajes a través de una red), basada en una teoría formulada por el difunto profesor emérito del MIT Claude Shannon.
El equipo desarrolló un algoritmo para evaluar cualquier sistema complejo de variables como una red de mensajería.
“Tratamos el sistema como una red, y las variables se transfieren información entre sí de una manera que se puede medir“, explica Lozano-Durán.
“Si una variable está enviando mensajes a otra, eso implica que debe tener alguna influencia. Esa es la idea de utilizar la propagación de la información para medir la causalidad“.
El nuevo algoritmo evalúa múltiples variables simultáneamente, en lugar de considerar un par de variables a la vez, como hacen otros métodos.
El algoritmo define la información como la probabilidad de que un cambio en una variable también produzca un cambio en otra.
Esta probabilidad (y, por lo tanto, la información que se intercambia entre variables) puede hacerse más fuerte o más débil a medida que el algoritmo evalúa más datos del sistema a lo largo del tiempo.
Al final, el método genera un mapa de causalidad que muestra qué variables de la red están fuertemente vinculadas.
A partir de la tasa y el patrón de estos vínculos, los investigadores pueden distinguir qué variables tienen una relación única, sinérgica o redundante.
Con este mismo enfoque, el algoritmo también puede estimar la cantidad de “fuga de causalidad” en el sistema, es decir, el grado en que no se puede predecir el comportamiento de un sistema en función de la información disponible.
“Parte de nuestro método detecta si falta algo“, dice Lozano-Durán.
“No sabemos qué falta, pero sabemos que necesitamos incluir más variables para explicar lo que está sucediendo”.
El equipo aplicó el algoritmo a una serie de casos de referencia que se utilizan habitualmente para probar la inferencia causal.
Estos casos van desde observaciones de interacciones depredador-presa a lo largo del tiempo, hasta mediciones de la temperatura y la presión del aire en diferentes regiones geográficas, y la coevolución de múltiples especies en un entorno marino.
El algoritmo identificó con éxito vínculos causales en todos los casos, en comparación con la mayoría de los métodos que solo pueden manejar algunos casos.
El método, que el equipo denominó SURD (descomposición sinérgica, única y redundante de causalidad), está disponible en línea para que otros lo prueben en sus propios sistemas.
“SURD tiene el potencial de impulsar el progreso en múltiples campos científicos y de ingeniería, como la investigación climática, la neurociencia, la economía, la epidemiología, las ciencias sociales y la dinámica de fluidos, entre otras áreas“, afirma Martínez-Sánchez.
Fuente: TechXplore