Path Analysis con Regresión Logística

Análisis Causal y Sistemas
de Ecuaciones Simultáneas
en Ciencias Sociales

José Eduardo Jorge, María de las Nieves Piovani,
Investigación: MetodologíaMara Leguizamón y Ulises Steciow

Modelos de Ecuaciones Estructurales. Variables Exógenas y Endógenas. Supuestos o condiciones de estos modelos. El caso de los Modelos Recursivos. Causalidad circular o influencia en dos direcciones: Modelos No Recursivos. Variables Instumentales y Regresión Logística en Dos Etapas. Ir a la Parte 1: Métodos y Técnicas en el Estudio de la Comunicación en Internet 

________________

Análisis Causal y Efectos Indirectos

Con el coeficiente estandarizado de regresión logística βpodemos explotar a fondo las posibilidades del Path Analysis. Se trata ahora de pensar nuestro problema no ya solo en términos de predicciones y asociaciones, sino de relaciones de causalidad. Una regresión como la de la Tabla 1 sugiere una serie de posibles “causas” del interés por la política.

Aunque una regresión pueda incluir interacciones relevantes entre las variables independientes, formular y contrastar hipótesis sobre el conjunto de vínculos causales entre todos estos factores requiere habitualmente, por la complejidad de los fenómenos sociales, salir del marco de una única regresión, y plantear –de modo formal o implícito- un sistema de ecuaciones o regresiones.

Figura 1 – Relaciones Causales

Causas y efectos de la comunicación en Internet

El sencillo diagrama causal de la Figura 1-B supone dos regresiones: una, del Interés, con Noticias y Activismo como predictores; otra, del Activismo, donde Noticias es el único predictor. Formalmente:

Sistema de Ecuaciones Simultáneas

𝛼o y 𝛼1 son constantes –como la de la Tabla 1- y los demás β son los coeficientes de la Figura 1-B. Este sistema posee dos variables endógenas –dependientes, explicadas dentro del modelo-, que son el Interés y el Activismo, y una variable exógena, determinada por fuerzas externas al sistema: Noticias.

Sistemas de Ecuaciones Estructurales

Para poder resolver –estimando sus parámetros mediante regresiones- un sistema de ecuaciones estructurales, éste debe cumplir una serie muy precisa de condiciones, que ya han sido descriptas en algunos textos clásicos (Asher, 1983; Heise, 1975; Berry, 1984).

El análisis de regresión asume, por ejemplo, que los predictores de una ecuación no están correlacionados con otras variables importantes que hayan podido omitirse. El efecto conjunto de estas últimas se concibe como un componente o “término de error” en la ecuación. Este error surge del hecho de que cada observación de la variable dependiente difiere del valor esperado basado en toda la población (este último valor es desconocido y el error solo se estima a través de los residuos de la regresión, que son la diferencia entre los valores observados y predichos).

Es posible demostrar que en modelos como el de la Figura 1-A, donde las variables se influyen mutuamente, ya no podemos asumir que los términos de error no están correlacionados con todos los predictores (Wooldridge, 2013: 555-60; Berry, op. cit.: 60-61). Las regresiones habituales arrojarían, en tales casos, estimaciones sesgadas e inconsistentes. Se aplica entonces una técnica especial: la construcción de variables instrumentales y la regresión en dos etapas (Wooldridge: 512-43; Bollen, 2012; Menard, 2010, 164-70).

Las ciencias sociales han apelado con frecuencia a los llamados sistemas recursivos. Éstos hacen un conjunto específico de supuestos sobre las relaciones causales entre las variables, para poder emplear la regresión del modo usual. Asumen, entre otras cosas, que todos los vínculos son unidireccionales, y que las variables endógenas se determinan secuencialmente, una a la vez. Un ejemplo simple son las ecuaciones de la Figura 1-B.

Un Modelo Recursivo

La utilidad de un modelo de esta clase depende de cuán realistas sean los supuestos de partida. Hemos construido, con las variables de la regresión de la Tabla 1, un sistema recursivo de cierta complejidad (Tabla 3). Además de explorar algunos nexos causales, el ejercicio servirá para ilustrar el grado en que los resultados de un análisis dependen de nuestras hipótesis iniciales, es decir, de la especificación del modelo. Esto se hará patente cuando formulemos después un diagrama distinto.

Tabla 3 – Un Modelo Recursivo. Path Análisis con Regresión Logística del Interés por la Política. Coeficientes Estandarizados βM

Modelos Causales Recursivos en Ciencias Sociales
Fuente: Jorge, José Eduardo; Piovani, María de las Nieves; Leguizamón, Mara, y Steciow, Ulises (2015): “Explorando el impacto político de la Web con técnicas avanzadas de análisis”, Question, 1(45), pp. 307-328. Click en la imagen para agrandar

Cada fila de la Tabla 3 representa una de las siete ecuaciones del sistema. La columna de la izquierda indica la variable dependiente de cada ecuación; las restantes columnas, sus predictores. La Edad, única variable exógena, es el único predictor de la Educación. Ambas son las variables independientes en la regresión de la Confianza Interpersonal. Luego, las tres predicen la Eficacia, y así siguiendo.

Para no aumentar la complejidad incluyendo tricotomías como variables dependientes, hemos transformado la Educación y la Confianza en los Partidos en dicotomías. Hacemos lo mismo con el Activismo. Además, excluimos del modelo al Género, que no es significativo. Por todo esto, los coeficientes βM  de la ecuación 7 del Interés no son iguales a los de la Tabla 2.

Cada coeficiente βM de la Tabla 3 corresponde a un predictor en una ecuación. Por ejemplo, 0,205 es el βM de la Educación en la regresión de la Eficacia. De los coeficientes no significativos estadísticamente, no podemos decir, en rigor, que su valor no sea cero.

Efectos Directos e Indirectos

El diagrama es muy complicado para mostrarlo íntegramente en un gráfico. La Figura 2 presenta las influencias directas que actúan sobre la variable Noticias; la Figura 3, las que ésta ejerce sobre otras variables.

Figura 2 – Efectos Directos (βM) que actúan sobre “Seguir las Noticias en la Web”

Path Analysis. Análisis del Camino o de los Senderos
Fuente: Jorge, José Eduardo; Piovani, María de las Nieves; Leguizamón, Mara, y Steciow, Ulises (2015): “Explorando el impacto político de la Web con técnicas avanzadas de análisis”, Question, 1(45), pp. 307-328. Click en la imagen para agrandar

Para estimar el impacto total de una variable sobre el interés por la política, sumamos a su impacto directo –su coeficiente βM en la ecuación 7 de la Tabla 3- todos sus efectos indirectos. Éstos son aquí más de 100, pero un buen número de ellos es insignificante. Algunos de los principales se ven en la Figura 4. Para facilitar su identificación, el itinerario que sigue el influjo indirecto de cada variable se dibuja en el color del rectángulo que simboliza a esa misma variable.

Noticias, por ejemplo, actúa sobre el Interés a través del Activismo Este impacto indirecto se calcula como el producto del βM de Noticias sobre el Activismo (0,168) multiplicado por el βM del Activismo sobre el Interés (0,156), lo que da 0,025 (o aproximadamente 0,03).

Figura 4 – Algunos Efectos Indirectos (βM) sobre el Interés por la Política

Análisis del Camino o Path Analysis
Fuente: Jorge, José Eduardo; Piovani, María de las Nieves; Leguizamón, Mara, y Steciow, Ulises (2015): “Explorando el impacto político de la Web con técnicas avanzadas de análisis”, Question, 1(45), pp. 307-328. Click en la imagen para agrandar

La Tabla 4 detalla el efecto total de cada variable sobre el Interés, sumando sus efectos directos e indirectos. Haber transformado algunas variables en dicotomías, para ingresarlas como variables dependientes en el PALR, ha tenido un costo alto para la Confianza en los Partidos y el Activismo, cuyo efecto directo cae notoriamente –compárese con su βM en la Tabla 2- respecto del modelo inicial.

Tabla 4 – Efectos Totales sobre el Interés por la Política

Path Analysis. Efectos Directos, Indirectos y Totales
Fuente: Jorge, José Eduardo; Piovani, María de las Nieves; Leguizamón, Mara, y Steciow, Ulises (2015): “Explorando el impacto político de la Web con técnicas avanzadas de análisis”, Question, 1(45), pp. 307-328. Click en la imagen para agrandar

Es posible conservar el Activismo en su forma cuantitativa y tratarlo como variable dependiente con una regresión ordinaria. Mantener la Confianza en los Partidos como tricotomía o variable ordinal haría más complejo el análisis, si bien podríamos –aunque sería más discutible- transformarla también en una escala cuantitativa.

Influencia Mutua o Causalidad Circular: un Modelo No Recursivo

Indagar la hipótesis de una relación de causalidad circular entre la exposición a las noticias online y el interés político tiene mucha importancia, porque es parte del núcleo de la teoría del “círculo virtuoso” sobre los efectos de los medios (Norris, 2000). Ésta sostiene que las personas políticamente activas tienden más que el resto a seguir las noticias políticas, y que esta exposición refuerza su interés (Jorge, 2010a).

Ingresamos ahora en un terreno poco explorado: el de la regresión logística en dos etapas (Menard, 2010). Al asumir que nuestras dos variables se influyen mutuamente, ya no podemos suponer: a) que las Noticias no están correlacionadas con el término de error en la ecuación del Interés; b) que el Interés no está correlacionado con el término de error en la regresión de las Noticias.

En este modelo no-recursivo, donde las variables no se determinan de manera secuencial, sino simultánea, ya no es posible calcular las regresiones directamente (Wooldridge, 2013; Bollen, 2012; Asher, 1983; Berry, 1984). Primero, debemos crear variables instrumentales para las Noticias y el Interés. Y en una segunda etapa, calcular: a) la regresión del Interés, usando la variable Interés original como dependiente, pero el instrumento Noticias como predictor; b) la regresión de Noticias, usando la variable Noticias original como dependiente, pero el Instrumento Interés como predictor.

Poniendo el foco en este influjo de dos vías, redefinimos la estructura del modelo e incorporamos nuevas variables. Con esto cumplimos además otros requisitos de un modelo no-recursivo, como el de estar identificado o sobre-identificado (Berry, 1984: 18-60). Intuitivamente, esto último significa que, en nuestro diagrama, el número y la estructura de las ecuaciones y variables exógenas –éstas, determinadas fuera del modelo- deben ser suficientes y adecuados para resolver las incógnitas del sistema.

Figura 5 – Modelo no-recursivo: causalidad circular entre Interés y Noticias

Causalidad Circular. Un Modelo No Recursivo
Fuente: Jorge, José Eduardo; Piovani, María de las Nieves; Leguizamón, Mara, y Steciow, Ulises (2015): “Explorando el impacto político de la Web con técnicas avanzadas de análisis”, Question, 1(45), pp. 307-328. Click en la imagen para agrandar

Nuestro nuevo esquema –Figura 5- es un sistema sobre-identificado. Asume que, de las 10 variables exógenas, la Edad y la Educación Alta influyen a la vez sobre el Interés y las Noticias. La cantidad diaria de horas que las personas miran TV y navegan en Internet, y el número de medios sociales on-line que usan, actúan sobre el hábito de seguir las Noticias, pero no sobre el Interés. Inversamente, la confianza en los partidos, la eficacia, el activismo y la confianza interpersonal, actúan sobre el Interés,  pero no sobre las Noticias.

Variables Instrumentales y Regresión en Dos Etapas

La base del procedimiento es construir una variable similar a las Noticias que no esté correlacionada con el término de error en la ecuación del Interés, para que podamos incluirla como predictor en la regresión de este último. Del mismo modo, es preciso hallar una variable similar al Interés para introducirla en la regresión de las Noticias. Estos predictores sustitutos son las variables instrumentales (o instrumentos).

A fin de construir estos dos instrumentos (para los detalles, remitimos al lector a la bibliografía citada), computamos sendas regresiones para el Interés y las Noticias, usando como variables independientes, en ambos casos, todas las variables exógenas del modelo (Tabla 5). Los valores de cada una de estas dos variables sustitutas son las probabilidades predichas para cada encuestado por la regresión correspondiente.

Esto crea, en principio, dos variables continuas, que pueden tomar cualquier valor entre 0 y 1. Siguiendo la recomendación de Menard (2010), las transformamos –empleando un punto de corte de 0,5- en variables binarias (como las originales), con solo dos valores posibles: 0 ó 1. Esto tiene el efecto de que la varianza del instrumento –que se ve atenuada en su versión continua- sea muy similar a la de la variable original. La Tabla 6 compara algunas características de los instrumentos y sus variables originales.

Tabla 5 – Regresiones del Interés y las Noticias
con todas las Variables Exógenas como predictores

Variables Instrumentales en Ciencias Sociales

Tabla 6 – Comparación de los Instrumentos con las Variables Originales

Variables Instrumentales en la Regresión Logística
Fuente: Jorge, José Eduardo; Piovani, María de las Nieves; Leguizamón, Mara, y Steciow, Ulises (2015): “Explorando el impacto político de la Web con técnicas avanzadas de análisis”, Question, 1(45), pp. 307-328  Click en las imágenes para agrandar

La segunda etapa del análisis es computar las regresiones de las dos variables endógenas del bucle no-recursivo, con los instrumentos entre sus predictores. El procedimiento consiste en: 1) calcular la regresión de la variable Interés original, usando como variables independientes a) el instrumento binario de las Noticias, y b) las variables exógenas que actúan sobre el Interés, excluyendo las que actúan solo sobre las Noticias; 2) calcular la regresión de la variable Noticias original, usando como variables independientes a) el instrumento binario del Interés, y b) las variables exógenas que actúan sobre las Noticias, excluyendo las que actúan solo sobre el Interés. Los resultados obtenidos están en las Tablas 7 y 8.

Tabla 7 – Regresión del Interés: Modelo no-recursivo

Regresión Logística con Variables Instrumentales

Tabla 8 – Regresión de Noticias: Modelo no-recursivo

Regresión Logística con Variables Instrumentales y Causalidad Circular
Fuente: Jorge, José Eduardo; Piovani, María de las Nieves; Leguizamón, Mara, y Steciow, Ulises (2015): “Explorando el impacto político de la Web con técnicas avanzadas de análisis”, Question, 1(45), pp. 307-328  Click en las imágenes para agrandar

La variable Noticias no es estadísticamente significativa en la regresión del Interés y los valores de sus coeficientes B y βM caen a la mitad comparados con los del modelo inicial de la Tabla 1. Por el contrario, el Interés no solo es un predictor significativo en la regresión de las Noticias en la Web, sino que su importancia es menor únicamente a la de usar Medios Sociales.

Este análisis, preliminar y exploratorio, sugiere que, en el caso específico del indicador “seguir noticias en la Web” en nuestra ECCP 2013, el interés por la política parece impulsar el hábito de informarse en Internet, mientras que una posible influencia de este hábito sobre el interés no es, como mínimo, lo bastante intensa para resultar significativa.

flecha-antAnterior: La Regresión Logística en Ciencias Sociales

José Eduardo Jorge, María de las Nieves Piovani, Mara Leguizamón y Ulises Steciow (2015): Explorando el Impacto Político de la Web con Técnicas Avanzadas de Análisis, Question, 1(45), pp.:307-328.
Texto editado en Octubre de 2016
boton-referencia-a

 

Secciones: III – III 

Cambio Cultural
Cultura Política Argentina

Déjenos su comentario

Artículos Relacionados

I: Métodos y Técnicas en el Estudio de la Comunicación en Internet

II: La Regresión Logística en Ciencias Sociales

III: Path Analysis, Variables Instrumentales y Sistemas de Ecuaciones

Aplicaciones del Análisis de Regresión Logística

Impacto de las Redes Sociales en la Política Argentina  

Medios y Política en Argentina

La Influencia de los Medios en la Política Argentina

Efectos Políticos del Diario Online y en Papel

Otras Técnicas

Hacia un Índice de Cultura Política Democrática: Regresión Lineal. Análisis Factorial

Valores Humanos Básicos en Argentina: Escalamiento Multidimensional

Teorías, Hipótesis y Operacionalización

Medios de Comunicación

Los Medios de Comunicación en la Democracia

Los Nuevos Medios y el Cambio Tecnológico

Los Efectos Políticos de los Medios de Comunicación

La Democracia Digital

El Impacto de las Redes Sociales 

Las Redes Sociales en las Campañas Políticas

La Democracia Digital

El Impacto de las Redes Sociales 

Las Redes Sociales en las Campañas Políticas

El Diario Digital: sus Características

Cultura Política y Democracia

Concepto de Cultura Política

La Cultura Democrática

Cultura Política Argentina

Teoría de la Cultura Política I

Teoría de la Cultura Política II

Los Problemas de las Nuevas Democracias

Bibliografía

Agresti, Alan (2007): An Introduction to Categorical Data Analysis, Wiley, New York.

Almond, Gabriel, and Verba, Sidney (1989): The Civic Culture, Sage, Newbury Parke [1963]

Asher, Herbert B. (1983): Causal Modeling, Sage, Newbury Park.

Berry, William D. (1984): Nonrecursive Causal Models, Sage, Newbury Park.

Bimber, B. & Copeland, L. (2013): “Digital media and traditional political participation over time in the U.S.”, Journal of Information Technology & Politics, Vol.10, Nº 2, 125–137.

Bollen, Kenneth A. (2012): “Instrumental Variables in Sociology”, Annual Review of Sociology, Vol. 38, 22.1-22.36.

Boulianne, Shelley (2009): “Does Internet Use Affect Engagement? A Meta-Analysis of Research”, Political Communication, Vol. 26, Nº 2,193-211.

Cho, J., Shah, D. V., McLeod, J. M., McLeod, D. M., Scholl, R. M., & Gotlieb, M. R. (2009): “Campaigns, reflection, and deliberation: Advancing an O-S-R-O-R model of communication effects”, Communication Theory, 19 (1), 66–88.

Curran, J.; Coen, S.; Soroka, S.; Aalberg, T.; Hayashi, K.; Hichy, Z.; Iyengar, S.; Jones, P.; Mazzoleni, G.; Papathanassopoulos, S.; Rhee, J.; Rojas, H.; Rowe, D.; Tiffen, R. (2014): “Reconsidering ‘virtuous circle’ and ‘media malaise’ theories of the media: An 11-nation study”, Journalism, 1-19.

Diamond, Larry (2008):The Spirit of Democracy, Henry Holt, New York..

Eckstein, Harry (1961): “A Theory of Stable Democracy”, Research Monograph Nº 10, Center of International Studies, Princeton University, April 10.

Heise, David (1975): Causal Analysis, Wiley, New York.

Inglehart, Ronald, and Welzel, Christian (2005): Modernization, Cultural Change, and Democracy, Cambridge University Press.

Inglehart, Ronald (1997): Modernization and Postmodernization, Princeton University Press, Princeton.

Inglehart, Ronald (1990): Culture Shift in Advanced Industrial Society, Princeton University Press, Princeton.

Jorge, José Eduardo (2010a): Cultura Política y Democracia en Argentina, Edulp, La Plata.

Jorge, José Eduardo (2014): “La Comunicación Política en las Redes Sociales. Enfoques Teóricos y Hallazgos Empíricos”, Question, Vol. 44. .

Jorge, José Eduardo (2013): “Los Nuevos Medios de Comunicación en la Cultura Política”, Anuario de Investigaciones 2011-2012, FPyCS.

Jorge, José Eduardo (2012): “La investigación de los efectos de los medios sobre la participación política. El enfoque de la cultura política”, Question, Vol. 35, 294-316.

Jorge, José Eduardo (2010b). “Los Medios de Comunicación y la Cultura Política en las Democracias Nuevas y Maduras”, Social Science Research Network (SSRN).

Jorge, José Eduardo (2010c): “Impacto de los medios de comunicación sobre el interés y el activismo político de los argentinos”, Question, Vol. 27.

Jorge, José Eduardo (2009): “Comunicación y Cultura Política en el Gran La Plata”, Anuario de Investigaciones 2006, FPyCS, La Plata, 158-65.

Jorge, José Eduardo (2008): “Actitudes hacia la política y la democracia, capital social y uso de medios en la Región del Gran La Plata”, Question, Vol. 20.

Jorge, José Eduardo; Lamanna, Gabriel A. y Piovani, María de las Nieves (2014): “El Impacto Político de los Medios Sociales en Internet”, Anuario de Investigaciones 2013, FPyCS.

Jorge, José Eduardo; Leguizamón, Mara y Steciow, Ulises (2013a): “Una metodología para el análisis de los efectos de los medios”, Question, Vol. 38.

Jorge, José Eduardo; Leguizamón, Mara y Steciow, Ulises (2013b): “La Influencia de la Educación sobre la Participación Política”, Question, Vol. 39.

Kline, Rex B. (2011): Principles and Practice of Structural Equation Modeling, The Guilford Press, New York.

Menard, Scott (2011): “Standards for Standardized Logistic Regression Coefficients”, Social Forces, Vol. 89, Nº 4, 1409-28

Menard, Scott (2010): Logistic Regression: From Introductory to Advanced, Sage, Thousand Oaks.

Menard, Scott (2004): “Six Approaches to Calculating Standardized Logistic Regression Coefficients”, The American Statistician, Vol. 58, No. 3, 218-223.

Menard, Scott (1995): Applied Logistic Regression Analysis, Sage, Thousand Oaks.

Mossberger, K.; Tolbert, C. J., & McNeal, R. S. (2008):  Digital Citizenship, The MIT Press, Cambridge.

Norris, Pippa (2000): A Virtuous Circle: Political Communications in Post Industrial Societies, Cambridge University Press, Cambridge.

Norris, Pippa, and Inglehart, Ronald: Cosmopolitan Communications. Cultural Diversity in a Globalized World, Cambridge University Press, Cambridge.

Putnam, Robert D. (2000): Bowling Alone, Simon & Schuster, New York.

Putnam, Robert D. (1993): Making Democracy Work, Princeton University Press, Princeton.

Schwartz, Shalom H. (2009): “Culture Matters: National Value Cultures, Sources, and Consequences”, in Wyer, R., Chi-yue, Ch., and Ying-yi, H. Understanding Culture, Psychology Press, New York, 127-50.

Schwartz, Shalom H. (2007): “Value Orientations: measurements, antecedents and consequences across nations”, en Jowell, R., Roberts, C.; Fitzgerald, R., and Eva, G. (eds.): Measuring Attitudes Cross-Nationally. Lessons from the European Social Survey, SAGE, London,169-203.

Tzelgov, Joseph and Henik, Avishai (1991): “Suppression Situations in Psychological Research”, Psychological Bulletin, Vol. 109, No. 3, 524-536.

Ullman, Jodie B. (2007): “Structural Equation Modeling”, en Tabachnick, B. y Fidell, L.: Using Multivariate Statistics, Pearson, Boston, 676-780.

Welzel, Christian (2013): Freedom Rising, Cambridge University Press, New York.

Wooldridge, Jeffrey (2013): Introductory Econometrics, South-Western, Mason.