Cliente:
Tecnologías usadas en este proyecto:
BigQuery
Deliverect
Google Cloud Platform
GStock
Phyton
Revo
Nuestro cliente, un actor destacado en la industria del entretenimiento se acercó a nuestro equipo con una necesidad específica: construir un almacén de datos sólido que les permitiera obtener información valiosa de la gran cantidad de datos generados por sensores y otras métricas de máquinas.
Para agilizar los procesos de extracción, transformación y carga (ETL), aprovechamos herramientas como Apache Airflow. Al orquestar las canalizaciones de ETL, garantizamos un procesamiento de datos eficiente y una integración perfecta con el almacén de datos. Esto permitió a nuestro cliente extraer información procesable de los datos de los sensores y las métricas de la máquina de manera oportuna y automatizada.
Para optimizar el consumo de estos datos, implementamos un modelo incremental y utilizamos tablas particionadas. Este enfoque nos permitió almacenar y recuperar de manera eficiente subconjuntos de datos relevantes, mejorando significativamente el rendimiento de las consultas y reduciendo los tiempos de procesamiento.
Los conocimientos basados en datos obtenidos a través de nuestras canalizaciones ETL optimizadas, combinados con el uso de un modelo incremental y tablas particionadas, permitieron a nuestro cliente optimizar sus sistemas de etiquetas láser, mejorando la eficiencia operativa y la experiencia general del huésped.
