INVESTIGACIÓN
¡Me gusta hacer a las Bases de Datos más rápidas y que utilicen menos almacenamiento! Recientemente he estado trabajando en Compresión de Datos y Vector Similarity Search (ANN) dentro de Bases de Datos de Vectores en conjunto con el Profesor Peter Boncz en CWI (Centrum Wiskunde & Informatica) — donde me encuentro actualmente haciendo mi PhD.
Antes, trabajé haciendo investigación en Social Data Science y Opinion Mining con la Profesora Carmen Vaca en la Universidad ESPOL.
PUBLICACIONES RECIENTES
ALP: Adaptive Lossless floating-Point Compression
[2023] Afroozeh, Azim, Leonardo Kuffo, and Peter Boncz
ALP es un algoritmo de compresión de datos de tipo float
y double
con una altísima velocidad de descompresión. Diseñado para aprovechar el esquema de almacenamientos de Bases de Datos columnares. ALP comprime mejor y es más rápido que Chimp128, Patas, Elf y Zstd. ALP le debe su velocidad a su simpleza, su diseño vectorizado (opera en 1024 valores a la vez) y al uso de instrucciones SIMD. ALP se encuentra en producción dentro de DuckDB; en donde contribuí para la implementación.
Mining worldwide entrepreneurs psycholinguistic dimensions from Twitter
[2018] L Kuffó, C Vaca, E Izquierdo, JC Bustamante
En este estudio caracterizamos a emprendedores de diversas partes del mundo a través del lenguaje que utilizaban para comunicarse en una red social. Logramos correlacionar las emociones dentro del discurso de los emprendedores con varios índices de emprendimiento.
Back to# 6D: Predicting Venezuelan states political election results through Twitter
[2017] R Castro, L Kuffó, C Vaca
Back to #6D propone un framework para hacer estimaciones de resultados electorales a gran escala utilizando una red social en donde las personas expresen sus opiniones. En este estudio utilizamos netamente datos de Twitter para estimar los resultados de las elecciones parlamentarias de Venezuela ocurridas en 2016.