Cuatro trabajos de investigadores del Instituto Milenio Fundamentos de los Datos (IMFD) en los que participan los profesores del DCC, Iván Sipirán, Aidan Hogan, Gonzalo Navarro, Matías Toro, Federico Olmedo y Éric Tanter, fueron publicados en Communications of the ACM. “Esta revista es la de mayor circulación en nuestra disciplina, buscando la divulgación de temas técnicos a un nivel que se pueda entender ampliamente. Publicar aquí le da una enorme visibilidad a la investigación que hacemos en Chile”, señala el profesor Gonzalo Navarro.
IA para el rescate de la herencia cultural
“The Role of Computing in the Study of Latin American Cultural Heritage” es el artículo científico del profesor Iván Sipirán, el cual nace en el contexto de la investigación que el académico desarrolla en temas de herencia cultural. En este trabajo, presenta un resumen de los esfuerzos que actualmente se están haciendo en el uso de la computación y la inteligencia artificial para manejar datos de herencia cultural y, al mismo tiempo, realiza un llamado de atención para aprovechar de mejor manera la oportunidad que existe en la región para realizar trabajos aún más grandes y mejores en este ámbito.
El académico cuenta que ha constituido un grupo de investigación junto con integrantes del Museo MAPA y de Antropología de las universidades Católica y de Chile. Y pese a que trabajar con datos de herencia cultural tiene un lado muy interdisciplinario, señala que quienes trabajan en esta línea son principalmente investigadores de las ciencias sociales: “Creo que la computación tiene una oportunidad en tomar esos datos que tienen muchos desafíos, que uno no los encuentra en otro tipo de problemas. Entonces en este paper hago un llamado de atención a que, ojalá, exista más fuerza de trabajo académica, más investigación y mejores recursos para llevar a cabo este tipo de tareas”, señala.
Privacidad diferencial
Otro de los artículos publicados es “Gradual Differentially Private Programming” de los investigadores Matías Toro, Federico Olmedo y Éric Tanter. El profesor Éric Tanter explica que esta investigación ataca el problema de cómo desarrollar sistemas de software que utilizan datos de usuarios sin violar su privacidad, mediante una técnica conocida como privacidad diferencial. “En específico, lo que proponemos ahí es flexibilizar los sistemas de tipos diseñados para apoyar a los programadores a respetar la privacidad diferencial, mediante el uso de un enfoque gradual, es decir, que mezcla verificación estática con verificación dinámica. Este enfoque permitirá facilitar la adopción progresiva y selectiva de anotaciones de privacidad en programas que explotan datos sensibles de individuos, proveyendo así retroalimentación temprana a los desarrolladores para que eviten violar la privacidad de datos de manera accidental”, comenta.
Entendiendo mejor el proceso constituyente
En tanto, “Telar and TelarKG: Data-Driven Insights into Chile’s Constitutional Process” se titula el artículo de los investigadores Renzo Angles, Naim Bro, Ivania Donoso-Guzmán, Juan Pablo Luna, Aidan Hogan, Juan Reutter, Henry Rosales-Méndez y Sergio Toro. Este trabajo interdisciplinario presenta el Proyecto Telar que lanzó el IMFD para analizar y entender mejor el primer proceso constituyente en Chile.
El académico Aidan Hogan explica que los objetivos del proyecto fueron: (1) levantar datos sobre el proceso constituyente de diversas fuentes, (2) analizar estos datos para llegar a conclusiones relevantes sobre el proceso constituyente; y, (3), divulgar estas conclusiones al público chileno. “Los análisis hechos fueron diversos, e incluyen observación del uso de bots en redes sociales, los temas más discutidos en redes sociales durante el proceso, la categorización y cohesión de ideologías emergentes dentro de los constitucionales a partir de sus patrones de votación, etc. Para divulgar los resultados, tuvimos un programa semanal en CNN Chile dedicado al Proyecto Telar para presentar y discutir nuestros resultados, y difundirlos directamente a la sociedad chilena”, comenta.
Implementación eficiente de bases de datos de grafos
Finalmente, Communications of the ACM incluye en su edición sobre investigación en Latinoamérica el artículo “Tackling Challenges in Implementing Large-Scale Graph Databases”, de los investigadores Diego Arroyuelo, Aidan Hogan, Gonzalo Navarro, Juan Reutter y Domagoj Vrgoč. Este trabajo relata la investigación que se realiza en el IMFD con respecto a implementar eficientemente bases de datos de grafos. “Estas bases de datos permiten representar fácilmente objetos y relaciones entre ellos, y están surgiendo con mucha fuerza como una alternativa a las tradicionales bases de datos relacionales en casos donde la información es más heterogénea y desestructurada. Todas las grandes compañías de Internet están desarrollando sus motores de bases de datos de grafos. Un ejemplo de base de datos de grafos pública es la Wikidata, que se usa para entregar información en las páginas de Wikipedia”, explica el profesor Gonzalo Navarro.
En el artículo se da cuenta de los principales resultados obtenidos y en qué están trabajando. Sobre esto, el profesor Navarro señala: “Un desafío de estas bases de datos es que resolver consultas sobre ellas es computacionalmente costoso. Por ejemplo, se está buscando una alternativa más eficiente para BlazeGraph, para reemplazarlo, y el IMFD está postulando uno de nuestros prototipos, MillenniumDB, para ser el soporte que mantenga la Wikidata”. El investigador comenta, además, que describen Ring, un desarrollo realizado en el IMFD, el cual permite resolver consultas de un subconjunto muy significativo de SPARQL usando muchos menos recursos de almacenamiento. Además señala que este artículo “describe los desafíos que actualmente enfrentan, que van por el lado de ofrecer acceso a información multimodal, es decir, no sólo sobre las relaciones representadas en el grafo, sino sobre otra información que pueden contener los objetos, dependiendo del tipo de dato que representan”.
--
Comunicaciones DCC