Identificación de puntos de interés turístico a través de datos de redes sociales
DOI:
https://doi.org/10.5821/ctv.8755Palabras clave:
Redes sociales, turismo, Big Data, análisis espacial urbanoResumen
En muchas ciudades europeas, el turismo de masas se está convirtiendo en una importante industria, pero los efectos de la creciente actividad de los visitantes están empezando a ser percibidas de manera negativa por sus habitantes. Las autoridades locales deben implementar políticas que modulen estas actividades para que puedan coexistir y ser compatibles con la vida diaria de la población residente. Sin embargo, estas políticas deben tener en consideración que la actividad turística tiende a concentrarse en áreas muy específicas, las cuales deben ser identificadas claramente antes de imponer formas específicas de tasación, o requerir la obtención de una licencia obligatoria para ciertas actividades. Para delimitar de manera clara estos ámbitos, esta investigación propone utilizar los datos de las redes sociales para identificar puntos calientes de actividad turística en Barcelona, como una fuente emergente de información en la toma de decisiones, utilizando como estudio de caso más de 75.000 fotografías geolocalizadas obtenidas del servicio Panoramio a través de su interfaz de programación de aplicaciones (API).
Esta aproximación al análisis urbano basada en datos debe solventar algunos aspectos de lo que algunos autores describen como “las 4 V del Big Data”: volumen, variedad, velocidad, y veracidad. En particular, esta investigación es especialmente sensible a dos aspectos (volumen y veracidad) que debían ser resueltos de manera efectiva. En el caso del volumen, el gran número de localizaciones dificultaba la aplicación de las técnicas de análisis espacial convencional, mientras que, en el caso de la veracidad, la naturaleza informal de los datos reducía la confianza en la precisión de su ubicación. La metodología siguió una aproximación basada en la estadística espacial, centrada en la distribución espacial de las localizaciones analizada a través en la estimación de la densidad por núcleo (KDE), con el ancho de banda determinado con el objetivo de identificar tendencias generales a la escala de estudio y reducir el ruido espacial.
Sin embargo, el análisis de la densidad de fotografías de manera aislada ignora la variación espacial de la intensidad de uso dentro de la ciudad, puesto que en áreas de mayor actividad es esperable una mayor concentración de fotografías, ceteris paribus. La estimación del nivel de actividad se realizó en base al inventario de locales de la ciudad de Barcelona, considerando que se trataba de un buen indicador de la intensidad de uso de los distintos ámbitos de la ciudad, bajo la premisa que una mayor presencia de locales es indicativa de una mayor actividad peatonal.
Para analizar el atractivo turístico teniendo en cuenta esta heterogeneidad espacial en el uso de la ciudad, se comparó la distribución espacial de fotografías en relación con la de actividad comercial en planta baja (como indicador indirecto de intensidad de uso). Para hacer equiparables ambas distribuciones, se desarrolló una metodología para normalizar los valores obtenidos del KDE, obteniendo un indicador (atractivo relativo) robusto respecto tanto a la resolución de discretización, el número de localizaciones y su distribución espacial. Las diferencias entre ambas superficies normalizadas fueron clasificadas en una escala divergente para identificar y cuantificar los puntos de actividad turística tanto fríos como calientes, permitiendo identificar las áreas de elevada presión turística y también los “desiertos” con muy escasa presencia de visitantes.
El enfoque propuesto propone una vía emergente de investigación en un campo de estudio tradicionalmente escaso en datos, y sugiere que las redes sociales son capaces de convertirse en una valiosa fuente de datos en la investigación urbana. Sin embargo, aunque la cantidad de datos disponible no tiene precedentes, también requiere nuevas técnicas de análisis, así como el conocimiento específico de los procesos de recopilación, limpieza, análisis y visualización de datos, para obtener resultados relevantes de forma rigurosa.