Logo Facultad Humaniodades y Comunicaciones
Logo Facultad Humaniodades y Comunicaciones

27 Enero 2020

Teoría y metodología: una mirada al informe de “big data”

Teoría y metodología: una mirada al informe de “big data”
Óscar Jaramillo C.
Boletín Observatorio Internacional
No. 46 / Enero-febrero 
Facultad de Humanidades y Comunicaciones
Universidad Finis Terrae
 
 

La caracterización de los manifestantes chilenos como amantes del K-Pop y el hecho de señalar que el llamado “estallido social” podría haber sido causado por ciertos personajes de la farándula criolla, fueron algunos de los principales aspectos que motivaron las críticas –e incluso, la ridiculización- del informe de “big data” utilizado por el gobierno chileno.

Si bien es cierto que no se ha tenido acceso al estudio y que, por lo tanto, no podemos analizar su metodología, sí es posible apreciar que se está frente al típico caso que sucede cuando un analista está frente a datos que es incapaz de interpretar desde el punto de vista teórico.

Al observar la figura N° 1, se aprecia que efectivamente los líderes de opinión (influencers) que tuvieron un mayor número de interacciones con el hashtag #chiledesperto en Instagram, son youtubers, artistas, futbolistas, personajes de la farándula nacional y medios alternativos de corte humorístico.

Grfico de barras

Figura N° 1. Fuente: CrowdTangle. Producción propia.

 

Afirmar que esos “influencers” son los que viralizaron el hashtag #chiledesperto en Instagram, es un error que demuestra un aparente desconocimiento de lo que es la Escucha Social (Social Media Listening), el Análisis de Redes Sociales (Social Network Analysis) y la Teoría del Doble Paso de Lazarsfeld y Katz.

Lo que se observa es que los datos aportados por el estudio de “big data del gobierno -en su mayoría- son correctos, con la sola excepción de la caracterización de los manifestantes como amantes del K-Pop, pero que también se cometieron verdaderos “sacrilegios” desde el punto de vista teórico.

En primer lugar, está la confusión entre la Escucha Social y el Análisis de Redes Sociales, que llevó erróneamente a plantear que las personas que tienen un mayor nivel de interacciones en redes sociales viralizaron el “estallido social”.

El Análisis de Redes Sociales es un método de estudio basado en la teoría de redes que analiza y describe los vínculos que se producen en las redes sociales entre las personas y todo tipo de entidades. Se preocupa, fundamentalmente, de las relaciones que surgen entre los vértices (personas); los grupos que conforman y cómo comparten la información.

A su vez, el análisis de redes sociales permite determinar cómo un contenido se viraliza a través de una red social, ya que grafica cómo y por quiénes una información es compartida en un entorno social, tal como lo podemos apreciar en la figura N° 2.

Grfico de red

Figura N° 2. Gráfico de red del hashtag #chilesecanso en Twitter, desde el 17 al 21 de octubre de 2019. Fuente: Producción propia.

 

En cambio, la Escucha Social, lo que hace, es analizar el desempeño en las redes sociales de las publicaciones (posts) y de las cuentas públicas (grupos abiertos y páginas o perfiles abiertos). Lo que entrega es la métrica con la cantidad de “likes”, vistas, comentarios e interacciones que posee una publicación y una cuenta pública. En otras palabras, la Escucha Social, lo que hace, es medir el “rating” que las publicaciones, las marcas y los personajes públicos tienen en las redes sociales.

 

Quién hizo qué

 

Después del escándalo de Cambridge Analytica, las distintas redes sociales aplicaron nuevas normativas de protección de la vida privada, que afectaron la forma en que se estudian las redes sociales. Facebook e Instagram prohibieron la aplicación de herramientas de Análisis de Redes Sociales en sus plataformas y solo permiten -en la actualidad- la Escucha Social.

Twitter, en cambio, prohibió la Escucha Social y solo permitió el Análisis de Redes Sociales, con una limitación importante: restringió la búsqueda a solo 7 días hacia atrás, lo que impidió el acceso a material de corte histórico.

Dichas restricciones tienen una consecuencia importante sobre las conclusiones que sacó el gobierno chileno. No es posible afirmar que los personajes que tienen un mayor número de interacciones en Instagram viralizaron el contenido. Debido a que ese dato es aportado por la Escucha Social, solo se puede inferir que son los líderes de opinión que tuvieron un mayor “rating” en la red social al intervenir en la discusión generada por el hashtag.

Para poder determinar quién viralizó el contenido, se tendría que realizar un Análisis de Redes Sociales, cuestión que no es posible realizar en Instagram y Facebook debido a las limitaciones impuestas por ambas redes sociales. Por lo tanto, es imposible afirmar quién viralizó algo en Facebook e Instagram en la actualidad.

Por otra parte, es necesario recordar que Lazarsfeld y Katz son uno de los primeros -sino los primeros- investigadores en comunicación, en estudiar el flujo de la información al interior de los grupos humanos. En lo que denominaron como la Teoría del Doble Paso, explicaron la forma en que los líderes de opinión median y difunden los mensajes de los medios de comunicación en los grupos de personas, a través de la comunicación interpersonal.

Personajes como Mon Laferte, Gary Medel o Germán Garmendia, que son los que tuvieron un mayor nivel de interacciones en Instagram con el hashtag #chiledesperto, caerían dentro de la categoría de diseminadores o ciudadanos participativos, elaborada por Lazarsfeld y Katz. Son personajes que adhieren a la causa debido a los beneficios que tiene para ellos el hecho de hacerlo. En redes sociales, eso significa la obtención de una mayor métrica, con un crecimiento en las visualizaciones, los “likes” y la cantidad de comentarios. Ellos intervinieron cuando el suceso ya se había producido y, al identificarse con el grupo, adquirieron un aura que beneficia sus marcas personales.

El otro problema es la identificación que se hace de los manifestantes con el K-Pop. Nuevamente, debido a que no se tiene acceso a la metodología del estudio, solo podemos especular una teoría que explicaría la prevalencia del pop coreano como una variable espuria.

La hipótesis es que la vinculación entre el K-Pop y los manifestantes sería el resultado de un análisis de conglomerado jerárquico o no jerárquico, cuyo objetivo es clasificar a los sujetos en grupos homogéneos.

El problema está en que hacer este tipo de análisis en redes sociales no es posible, debido a que no se cumple el requisito estadístico de la normalidad de los datos. En las redes sociales, los datos se comportan de acuerdo a las distribuciones de Poisson o Binomial Negativa, debido a que son conteos con enormes cantidades de ceros.

Es por eso que en las redes sociales, los análisis de “cluster” se hacen a partir de las conexiones que tienen las personas entre sí. Lamentablemente, el análisis de “cluster” solo se puede realizar con herramientas de Análisis de Redes Sociales como Nodexl Pro o Gephi, por lo que sería un error metodológico hacer un análisis de  conglomerado con los datos de Instagram.

En definitiva, la polémica generada por el informe del “big data” del gobierno tiene su origen en problemas metodológicos y en la errónea interpretación teórica de los datos que llevaron al surgimiento de falsos positivos, como la caracterización de los manifestantes como amantes del pop coreano o que personajes de la farándula nacional viralizaron hashtags como #renunciapiñera o #chiledesperto.

 
Óscar Jaramillo Castro (PhD)
Doctor en Ciencias de la Información, Universidad Complutense de Madrid
Académico investigador, Escuela de Periodismo, Universidad Finis Terrae
Esta dirección de correo electrónico está siendo protegida contra los robots de spam. Necesita tener JavaScript habilitado para poder verlo.