Detección de emociones en el espacio público: una comparación multilenguaje en Barcelona

Liya Yang, Carlos Marmolejo Duarte, Pablo Martí Ciriquián

Resumen


El análisis de sentimientos a través de los datos de LBSN (red social basada en la ubicación) ha sido un tema popular en los estudios urbanos desde el auge de las aplicaciones de redes sociales, como el estrés laboral, la emoción de los pasajeros del ferrocarril, el mapeo de sentimientos, etc. Aunque es difícil de medir variaciones de las emociones de masas en un nivel preciso, hay algunas correlaciones entre la emoción y el entorno espacial. Por lo tanto, comprender la emoción masiva es beneficioso para mejorar la asignación de las instalaciones urbanas y promover el entorno urbano. Sin embargo, la mayoría de las investigaciones se limitan a textos en inglés o en un solo idioma debido al área estudiada o los problemas técnicos de analizar diferentes idiomas. De hecho, los inmigrantes y visitantes suelen ocupar una parte importante en las metrópolis internacionales. El análisis basado en un solo idioma no es suficiente para revelar percepciones sobre la misma ciudad de personas que usan otros idiomas. Además, a excepción de las diferencias culturales, la emoción de masas es posiblemente diferente en diferentes espacios urbanos, como los espacios locales y turísticos. Como el idioma local suele ser distinto del de los visitantes, el análisis de sentimientos basado en varios idiomas podría reflejar las diferencias hasta cierto punto. Por lo tanto, este estudio tiene como objetivo detectar la diferencia de emoción en masa entre las personas que usan diferentes idiomas en el mismo espacio público. Además, los estudios anteriores se centran principalmente en un solo tipo de uso de la tierra, como atracciones turísticas o parques verdes. Para llenar el vacío, el objetivo final de la investigación es explorar la relación entre el entorno urbano y la emoción masiva.

Este estudio utiliza 30 meses de datos de Twitter para analizar las emociones masivas en Barcelona. Específicamente, el inglés, el español y el catalán están involucrados en la comparación de las emociones como estudio de caso, porque el número de tweets escritos por los tres idiomas representa aproximadamente el 90% de nuestro conjunto de datos. El análisis se compone de un análisis de palabras de alta frecuencia y análisis de sentimientos en plazas. El análisis de sentimientos se implementa mediante dos algoritmos de uso común: Senti-strength que estima los sentimientos en textos informales cortos y Svader que se enfoca específicamente en los textos de las redes sociales. Según el sentimiento (positivo, neutral, negativo) dado por el algoritmo, se asigna una puntuación integral de sentimiento a cada tweet. En resumen, el proceso incluye: 1) limpiar datos y eliminar tweets no individuales; 2) traducir tweets en español y catalán al inglés a través de la API de Google Translate; 3) calcular el puntaje de opinión de cada tweet a través del software Senti-strength y Svader; 4) comparar la clasificación de sentimientos de los dos software; 5) una verificación de muestra del análisis de sentimientos mediante evaluación manual; 6) comparar las diferencias de sentimiento entre los tres grupos de diferentes idiomas en veinte espacios públicos de Barcelona.

El resultado confirma las diferencias de las palabras de alta frecuencia entre los tres idiomas, aunque tienen algunas palabras en común. Los tweets catalanes de alta frecuencia aparecieron más palabras que son nombres de lugares locales. Los tweets en inglés contenían más palabras relacionadas con el turismo. Los tweets en español parecían estar en el medio. En términos de variaciones de sentimientos, la proporción de emoción positiva fue mayor que la emoción negativa en general. 


Palabras clave


Emoción publica; Twitter emoción; Espacio público; Ciudad Inteligente



DOI: http://dx.doi.org/10.5821/ctv.8515

Enlaces refback

  • No hay ningún enlace refback.