Resumen:
La plataforma de datos de Snowflake es impulsada por un motor de procesamiento de consultas elástico que permite a los clientes ejecutar consultas eficientemente sobre datos optimizados almacenados en la nube. En esta charla, daremos una visión general de cómo Snowflake organiza los datos y ejecuta consultas sobre ellos para acelerar trabajos de procesamiento analítico en tablas de gran tamaño. Describiremos el formato de tablas de Snowflake y mostraremos cómo este nos permite optimizar consultas a través de técnicas como agrupamiento automático (automatic clustering) y poda de particiones (partition pruning). Además, presentaremos el servicio de optimización de búsquedas (search optimization service) de Snowflake y describiremos cómo permite acelerar consultas altamente selectivas, consultas sobre datos geoespaciales y búsquedas en texto.
Short bio: Alejandro Salinger es Ingeniero de Software en la oficina de Snowflake en Berlín, donde trabaja en el aceleramiento de consultas en el equipo Database Search. Su experiencia en la industria e investigación incluye sistemas de bases de datos, indexación y búsqueda en texto, algoritmos y estructuras de datos, machine learning y computación paralela. Alejandro es Ingeniero Civil en Computación de la Universidad de Chile y posee un doctorado en Ciencias de la Computación de la Universidad de Waterloo, Canadá.
--
Comunicaciones #DCC50