Comment faire passer une entreprise de l'ère des données silotées à une véritable culture data-driven ?
Dans cet article, l'un de nos consultants experts data vous partage son REX à l'issue d'une mission de deux ans chez un acteur du secteur des transports. De l'évangélisation des équipes métier à la conception d'une Modern Data Stack sur mesure (GCP, BigQuery, Airbyte), découvrez les étapes clés de cette transformation technique et humaine pour faire de la donnée un véritable moteur de décision stratégique.
Cas d'usage : De zéro à la Modern Data Stack pour devenir Data Driven
Mission : Evangéliser un client opérant dans le transport à la pratique de la data.
Leur niveau au démarrage de la mission : une base de données PostgreSQL hors Cloud, avec une réplique en lecture seule, et un outil de BI branché dessus. Les différents outils (CRM, support) avaient leur propre base de données isolée.
Le projet était mené par l’équipe marketing.
Poser les fondations : exploration et acculturation à la donnée
Le chemin qui mène à la Modern Data Stack et au Data Driven est passionnant et jalonné de défis. Avant de proposer une architecture digne de ce nom, il a fallu dessiner les contours de besoins à servir, et, pour cela, démontrer les capacités de la data. Cela a commencé par de l’exploration de la base d’utilisateurs :
- Analyses socio-démographiques
- Étude du funnel d’acquisition - conversion - rétention afin de déterminer les évènements déclencheurs de la conversion
- Extraction de base d’utilisateurs pour le lancement de campagnes CRM
L’acceptation de la pratique de la donnée en interne est passée par une forte acculturation via la diffusion hebdomadaire de résultats d’études, et beaucoup de discussions autour d’un café. De l’humain, donc.
Concevoir l'architecture de la Modern Data Stack : le choix de GCP et BigQuery
Une fois cette étape passée, est arrivé le constat que l’on ne pourrait activer convenablement la donnée sans une architecture qui permettrait de la centraliser.
Le client avait la volonté de se diriger vers l’utilisation de la Google Cloud Platform et de son Data Warehouse BigQuery. Une fois la destination trouvée, restait à construire le chemin, donc trouver le bon EL (Extract - Load), outil destiné à acheminer automatiquement les données depuis de multiples sources vers une destination. J’avais trois contraintes :
- L’EL devait avoir un certain nombre de connecteurs pour accéder aux sources : PostgreSQL, Hubspot, Zendesk…
- Il devait pouvoir déverser dans BigQuery
- Les coûts devaient être les plus faibles possibles
Benchmark ELT : Pourquoi intégrer Airbyte à notre Modern Data Stack ?
Nous avons réalisé un benchmark des outils du moment. Nous devions trancher entre des outils SaaS du marché (Stitch, Hevo) et la possibilité pour le client d’héberger lui-même l’outil.
C’est la deuxième solution qui a été retenue : nous avons donc entrepris d’utiliser Airbyte. En effet, Airbyte possédait tous les connecteurs nécessaires, pour les sources comme pour la destination, offrait la possibilité de coder ses propres connecteurs, et l’hébergement sur un de nos serveurs assurait un coût maîtrisé.
Les cas d'usage débloqués grâce à une infrastructure de données centralisée
Nous avons pu alimenter BigQuery avec les différentes sources, mais également y déverser des données issues de l’Open Data, ce qui n’était pas possible auparavant car la réplique de la base de données de production était en lecture seule. Cette architecture plus moderne a permis de débloquer deux cas d’usage :
- La réalisation d’un outil interne de monitoring de la flotte de conducteurs, grâce aux données de production et aux données d’Open Data stockées sur BigQuery
- La refonte des calculs nécessaire au service financier pour les clôtures des exercices comptables de fin de mois, grâce à la puissance de calcul et aux capacités de scheduling de BigQuery
Conclusion : la Modern Data Stack, moteur indispensable de la culture Data Driven
C’est avec ce type de projets que la puissance de la donnée prend tout son sens et donc la nécessité de l’architecture qui se doit d’être à son service : ce que l’on appelle une Modern Data Stack.
Nous avons vu avec ce cas d’usage que la mise en place d’une telle architecture peut se faire simplement, graduellement, et avec des résultats très rapides. Elle nécessite cependant une vision de la part du client, vision qui dans notre cas est le fait de devenir Data Driven, et de devenir capable de prendre des décisions basées sur des faits via les données, et non sur une intuition.
Vous souhaitez bénéficier d'experts ou d'un accompagnement sur votre projet data ? Rendez-vous sur la page Contact.
