8M y 9M en tiempo Real. Por Business Analytics

En nuestra anterior publicación, UN CAMINO ENTRE EL CÓMPUTO AFECTIVO, hemos hablado de cómo el campo del cómputo afectivo, parte de los temas de Inteligencia Artificial, explora formas diferentes para entender las emociones el usuario, utilizando elementos como los sensores corporales, reconocimiento facial o texto. Entender como el usuario se siente cuando interactúa con un producto, puede ayudar a modelar una mejor experiencia de uso. Para un ejemplo más, y aunque todavía no es un hecho, se presume que el control de la consola de Play Station 5 podría detectar el sudor de las manos y ritmo cardíaco.

Por lo tanto, el equipo de ROCKTECH BUSSINESS ANALYTICS trabajó en analizar un evento que tiene una relevancia en Twitter, se puede interpretar con el uso de la estadística y el cómputo afectivo (abreviado como C.A.). Por lo tanto, se ha recolectado tweets durante los días 7, 8 y 9 de Marzo con motivos del (día de la mujer) y el paro nacional de la mujer **( [paro nacional]. Los hashtag de interés fueron: “#Undiasinnosotras”, “#Undiasinmujeres”, “#8M”, “#Niunamenos”, “#Niunamas”, “#9M”. En total, se recolectaron 838746 tweets que contenían uno o más de los hashtag relacionados.
Por intervalos de tiempo, se analizan la información y se muestra el número de tweets que se procesan, información de frecuencia de las palabras más repetidas, el sentimiento provocado ( negativo o positivo ) que refleja cada uno de hashtag y un promedio ortográfico.
Hay que puntualizar que los resultados pueden variar dependiendo del algoritmo con que se procesen los datos, y que se han omitido los retweets para este análisis.

El total de información leída con los hashtags arriba mencionados fue de 838746 tweets iniciando el Sábado 7 de Marzo a las 23:28:59( UTC ) y terminando el Martes 9 de Marzo a las 23:43:55( UTC ).

Los criterios para aceptar el procesamiento de un tweet fueron los siguientes:

  • Que no sea un retweet.
  • Contener al menos un hashtag seleccionado.
  • Cumplir con un mínimo de español detectado.

BOTS

Para ejemplo del impacto de un posible bot( una cuenta que publica de manera automatizada ) detectado en este evento:
La cuenta @XXXX( se omite deliberadamente el nombre de la cuenta ) ha publicado un texto que se encuentra 158 veces en un rango de tiempo de 3 segundos:

Desaparezco en honor a las que no fueron encontradas, por las que fueron silenciadas, por las que aparecieron en cajas, bolsas de basura, como escoria, desaparezco un día, pero un día puedo desaparecer toda la vida #El9NingunaSeMueve #NiUnaMenos #9M #9demarzo

Alt Text

Además, se han detectado: 953 que se comportan como cuentas automatizadas.
estas publicaciones hechas por bots representan un 0.396% del total de la información, siendo el 99.67% generado de manera orgánica.
estos porcentajes pueden variar dependiendo de las condiciones que cumpla una cuenta para ser considerada como un bot.
La seguridad de que estas cuentas sean bots, puede variar dependiendo del algoritmo.

VELOCIDAD E IMPACTO EN LA RED SOCIAL

En la siguiente imagen se muestra la velocidad con la que se registraban tweets que contuvieran alguno o más de los hashtags mencionados.
Como puntos en los que la actividad fue más fuerte, se puede observar el Domingo 8 de Marzo, llegando a registrar hasta 1300 tweets por minuto, y comenzando a decaer el Lunes 8 de Marzo durante todo el día. El martes la velocidad de publicación vuelve a caer a 200 tweets por minuto.
Es interesante el rango de tiempo casi nulo de publicaciones que se registraron el Lunes por la tarde!

Alt

7 /Marzo.

Se procesaron 960( 0.11% ) tweets, de los cuales 624( 0.07% ) fueron descartados por contener palabras ambiguas al español y 31 (0.003%) contienen una formación de palabras que no permitieron ser analizados.

El promedio de ortografía fue de 62.15%.

La información de la frecuencia de las palabras se muestra en la siguiente imagen:

Alt

Se agregaron solo palabras con una frecuencia mayor a 100.

Polaridad emocional de hashtags

Alt

El hashtag #8M, con 960 publicaciones, y #Niunamenos con 65 tweets, mostaron el siguiente comportamiento. De los hashtag restantes no se encontraron tweet, aunque pudieron haber aparecido como retweets.

Alt

8/Marzo.

Siguiendo igual que el día anterior, estratificando los tweets por horas y días, el 8 de Marzo en el transcurso de las 23 horas, se procesaron 9934

( 1.18% ) tweets, mostrando ahora un porcentaje ortográfico de 58.29%.

Durante el mismo lapso de 1 hora la gráfica de frecuencias se muestra ahora de la siguiente manera:

Alt

Polaridad emocional de hashtags

A diferencia del día anterior, ahora 3 hashtags mostraron información.
#8M se ha encontrado en 9923 tweets, mientras que #Niunamenos y #niUnamas solo 2420 y 13 respectivamente. De los hashtag restantes no se encontraron tweets, aunque pudieron haber aparecido como retweets.

Alt
Alt
Alt

9 /Marzo.

Por último, el 9 de Marzo a las 23 hrs. se registraron 1422( 0.16% ) tweets, por palabras no detectadas en el español 640 tweets no se procesaron y 31 tweets se mostraron como no disponibles para leer. En este último día, el porcentaje de ortografía fue de 61.26%.
La gráfica de frecuencias para el último día queda de la siguiente manera:

Alt

Dentro de la información de frecuencial del 9 de Marzo, se detectó una cuenta de la que muchas personas hablaron en sus publicaciones y que, analizándola manualmente, muestra un comportamiento errático, y que publica demasiada información para provocar odio, o una división de puntos.

Polaridad emocional de hashtags

El hashtag #8M se ha encontrado 1416 veces, #Niunamenos 170 veces y #Niunamas 5 veces. De los hashtag restantes no se encontraron tweets, aunque pudieron haber aparecido como retweets.

Alt
Alt

Algunos comentarios

La velocidad con que se registraron tweets durante el día de la mujer y el paro nacional del pasado 9 de Marzo, registró una velocidad enorme de publicaciones llegando hasta 1300 tweet/minuto, contado intervalos de tiempo que no se escucharon, se escucharon alrededor de 800,000 tweets. En este informe y para una compresión en diferentes momentos del día, solo se analizaron 3 horas del Domingo, Lunes y Martes.

Hemos observado que usando la ROCKTECH BUSSINESS ANALYTICS, nos fue posible leer, registrar y procesar en tiempo real información suficiente para interpretar el sentimiento colectivo en este caso positivo y de apoyo durante tan importante suceso.

Alt Text

Como trabajo a futuro, usando el algoritmo de clasificación desarrollado en ROCKTECH, se clasificarán las palabras más importantes usando una polaridad positiva o negativa, lo que nos permitirá tener más precisión en la interpretación de datos. Tambien se prepara un análisis para calcular cuantas personas hicieron retweet de una cuenta etiquetada como bot.

Conclusiones

Está en mente del lector analizar el impacto social.

Pregunta:

¿ Qué tuvo que ver una ‘jirafa’ con este análisis?

Comentario:

Para más información sobre el proceso y diferentes usos de ROCKTECH BUSSINESS ANALYTICS, se pueden contactar a los siguientes correos:
juan.manriquez@rocktech.mx o pedro.cruz@rocktech.mx

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *