Recientemente la socióloga uruguaya Elina Gómez compartió su trabajo con análisis de datos sobre Cabildo Abierto en el territorio, un mapeo que da cuenta de las localidades en las que estuvo Guido Manini Ríos desde 2019 a 2023, según sus publicaciones en Instagram. La Mañana dialogó con la especialista sobre la ciencia de datos, su uso en políticas públicas y su potencial en la campaña electoral.
Elina Gómez es uruguaya, socióloga de formación, con una maestría en estudios sobre América Latina y se encuentra en curso de un doctorado en sociología. Trabajó como docente investigadora en la Unidad de Métodos y Acceso a Datos de la Facultad de Ciencias Sociales. Es docente de varias materias que tienen que ver con el análisis de datos cuantitativos y cualitativos. Antes trabajó en distintas ramas vinculadas a los datos, fundamentalmente para políticas públicas, en el Ministerio de Desarrollo Social (Mides).
La ciencia de datos tiene que ver con el vector metodológico de las carreras de ciencias sociales, en las que el análisis es una técnica para asistir investigaciones. Específicamente, en lo que tiene que ver con datos, son muchas las aplicaciones, como asistir al diseño de políticas públicas o investigar diferentes temas. A veces, cuando se piensa en datos se focaliza en lo cuantitativo, sin embargo, existe lo relativo a los datos textuales o cualitativos, recabados a partir de diferentes técnicas. “Allí es donde entran los métodos computacionales que han surgido en las últimas décadas y que ayudan a asistir al área social. En eso me especializo”, explicó Gómez a La Mañana.
En lo referido a políticas públicas, el análisis de datos se puede utilizar en diferentes momentos, en primer lugar, para el diseño del diagnóstico inicial, es decir, brindar información que permita perfeccionar un modelo de política basado en datos. Luego, pueden utilizarse para la evaluación y monitoreo de políticas públicas, área en la que trabajaba la entrevistada en el Mides.
Gómez indicó que este trabajo se hace desde la gestación del Mides y se ha caracterizado por tener un sistema “bastante bueno” de monitoreo y evaluación de políticas: el Sistema de Información Integrada del Área Social (Siias), que transmite en tiempo real la integración de datos de grandes volúmenes y permite asistir el diseño y evaluación de políticas.
Si bien esta herramienta permite cada vez más la generación y análisis de datos, la especialista sostuvo que “igualmente existen muchos desafíos, incluso con respecto a las técnicas que se deben mejorar”. Justamente, su tesis de maestría está centrada en mejorar los sistemas de focalización de transferencias monetarias del programa de asignaciones familiares, con técnicas basadas en aprendizaje automático, que es una subárea de la inteligencia artificial.
“Estas nuevas técnicas podrían ayudar a mejorar, por ejemplo, cuando se predice si un hogar es vulnerable o no, y atado a eso si recibe alguna prestación o no. Ese tipo de técnicas que han surgido en los últimos tiempos pueden complementar o potenciar a las tradicionales”, aseguró.
¿Todo puede pasarse a números?
Hay una pata de la ciencia de datos que tiene que ver con el análisis de textos, tema central de los cursos que Gómez dicta en la facultad. Cuando se habla de transferencias monetarias, se piensa en modelos aplicados a filtros administrativos o estadísticos, pero también hay un área que es procesamiento de grandes volúmenes de texto.
“Mi trabajo de doctorado es un proyecto interdisciplinario llamado Cruzar, del que participa la Facultad de Ingeniería en la parte más técnica. Tiene que ver con el procesamiento de archivos vinculados a la dictadura y terrorismo de Estado, y se trabaja con procesos singulares y masivos; estos últimos implican volúmenes de millones de documentos”, relató la entrevistada.
Gómez comentó que a través de la ciencia de datos se procesa el contenido con un análisis inductivo y deductivo, con el que sea posible buscar algo en esos documentos gracias a las técnicas avanzadas de procesamiento de lenguaje natural. Esto también ayuda a extraer información que emerge de esos documentos y que pueden ser interesantes para determinadas líneas de investigación.
“En este caso apliqué técnicas para el análisis masivo, pero siempre teniendo en cuenta que se deben complementar con un análisis singular y profundo contextual de los datos. Esto es muy importante cuando se hacen análisis de texto”, explicó.
Con ese proyecto, Gómez creó una aplicación que permite tener listados de personas, lugares, fechas, nombres. “En esa masividad permite vincular y encontrar en qué contexto se dicen determinados nombres y, por ende, se reduce la información. Eso es un componente muy importante, porque cuando se tiene masividad de datos, el primer desafío es recuperarlos, es decir, pasar de imágenes a textos y luego hacer un análisis que permita extraer información relevante en toda esa masividad”, dijo.
La importancia de la técnica y el contexto
“Las ciencias sociales computacionales permiten abrir nuevas fuentes o redescubrir fuentes tradicionales de otra manera. En mi tesis de doctorado estoy trabajando sobre archivos de hace cincuenta años, entonces no es una nueva fuente, sino una manera de recuperarla. En ese sentido, hago énfasis en el recorte y en la creatividad que hay para la construcción del dato, porque el dato en bruto en sí no tiene mucha cosa para decir, pero sí cómo se construye y analiza”, reflexionó la entrevistada.
Gómez dijo que siempre es importante la combinación entre el análisis más profundo cualitativo, que involucre lo contextual, con las técnicas de análisis masivo. Por ejemplo, en el análisis que realizó con Cabildo Abierto a través de posteos públicos en la cuenta de Instagram de Guido Manini Ríos, hizo un diccionario con una detección automática de localidades, “pero había sitios que se llamaban La Lucha o Esperanza, y esas palabras eran nombradas, pero no vinculadas a un lugar, entonces tuve que revisar esos casos ambiguos uno a uno para que no quedara sobrerrepresentado algo que no era”, explicó,
Indicó que hay que tener precaución y conocer el contexto porque, a veces, se aplican técnicas sofisticadas a cuestiones cuyo contexto no se conoce y quedan desencajadas o se cometen errores. “Es relevante tener en cuenta esto desde las ciencias sociales, porque a nivel tecnológico se puede tener mucho conocimiento, pero también hay que ver desde dónde se estudia, quiénes hacen las preguntas, por eso la combinación interdisciplinaria de lo técnico con lo teórico y contextual es central a la hora de pensar el análisis de datos desde esta perspectiva”, puntualizó.
Redes sociales y el caso de Cabildo Abierto
La socióloga Elina Gómez en entrevista con La Mañana indicó que una fuente muy interesante de obtención de datos públicos son las redes sociales. “Para los investigadores sociales que tomamos como objeto de estudio las interacciones, las nuevas modalidades son relevantes, y más con determinadas finalidades como, por ejemplo, el uso político de las redes. La digitalización de la vida hace que estemos emitiendo un mensaje que puede ser considerado como dato”, sostuvo.
Un ejemplo es el trabajo que realizó con Cabildo Abierto a través de posteos públicos en la cuenta de Instagram de Guido Manini Ríos. A Gómez le interesó combinar el análisis de texto con un análisis geográfico espacial, entonces los registros de la ubicación de los posteos fueron considerados datos. “Con un diccionario de localidades, lo que hice fue buscar las mencionadas en Instagram, y después mapearlos en el territorio, segmentadas por años”, detalló.
En ese sentido, afirmó que existe numerosa información disponible, pública, que puede ser utilizada y explotada. Gómez considera que hoy está subexplotada “porque hay un montón de cosas que se pueden hacer, pero también entra en juego la creatividad, en cómo usar esos datos. Considero que será un componente importante en la campaña electoral que se viene”, puntualizó.
La entrevistada agregó que los sociólogos abogan por que la mayor cantidad de datos sean públicos para el control ciudadano y la transparencia, de hecho, en todos los análisis que realiza deja a disposición las bases de datos que utilizó, así como su trabajo final que puede ser útil para verificar información.
“El trabajo con las recorridas de Cabildo Abierto por el territorio lo pude realizar porque existía un registro sistemático público de todas las actividades y además con su respectiva localización. Pero si otro político no dispone de ese registro, es más difícil hacer algo así”, señaló.
TE PUEDE INTERESAR: