(Senior) Data Engineer

  • CDI
  • Juin 2023
  • Bordeaux
  • Paris

(Senior) Data Engineer

  • CDI
  • Juin 2023
  • Bordeaux
  • Paris

Descriptif du poste

Mirakl est le leader de l’économie de plateforme en fournissant la technologie et l’écosystème partenaire nécessaires au lancement d’une marketplace. Grâce à la Mirakl Marketplace Platform, les entreprises B2B et B2C peuvent accélérer leur croissance e-commerce en offrant plus de produits et de services à leurs clients.

 

A propos de Mirakl Labs

Nos équipes techniques et produits, nommées Mirakl Labs, sont principalement réparties entre nos 2 hubs situés à Paris et à Bordeaux. Elles collaborent au quotidien afin d'adresser les problématiques de nos clients et utilisateurs en répondant à différents challenges liés aux nouvelles fonctionnalités, à la scalabilité, la sécurité et l’ergonomie…

Elles opèrent en mode agile et s'organisent en Squads composées d'un Squad Lead, de 5 développeurs, d'un Product Manager et d'un QA. Chaque Squad est spécialisée sur un scope fonctionnel afin de concevoir et réaliser de nouvelles features, leurs évolutions et des APIs (avec un découpage en micro-services). Nos équipes Infrastructure, Architecture, Sécurité, Documentation, Product Design, Data et Support opèrent en transverse en apportant leur expertise et de la cohérence sur l’ensemble des produits.

Toutes les équipes sont responsables de leur périmètre et chacun des collaborateurs apporte son expérience et ses idées. Innovation, feedback et implication dans les prises de décision sont au cœur de notre philosophie.

Et pour favoriser ce partage avec d’autres passionnés, nous sommes sponsors, speakers, et hôtes de différents événements, meetups, et associations de la scène Tech en France. Au cours des dernières années, nous avons participé à des événements tels que Devoxx, ReactEurope, ProductConf et Flupa UX Days.

 

A propos du job

La solution SaaS Mirakl est le moteur des marketplaces des plus importants e-commerçants à travers le monde. Cette solution gère et produit de gros volumes de données qui présentent des challenges extrêmement intéressants pour les spécialistes de la donnée (produits, commandes, clients, niveaux de stock, prix, messages, appels API, données de navigation, séries temporelles, données géolocalisées etc.).

En tant que (Senior) Data Engineer au sein de l’équipe Data Mirakl, vos principales missions seront de :

  • contribuer à l'enrichissement de la Data Platform (ETL)
  • améliorer la robustesse de nos pipelines de production pour nos applications Machine Learning (inférence real time etc.)

Intégré(e) dans une équipe de spécialistes de la donnée (data engineers, machine learning engineers, data scientists, data analysts), vous êtes un des acteurs clés pour garantir la place de Mirakl comme solution dominante sur son marché.

 

Notre stack et nos outils

Apache Spark, Kafka, AWS, AWS EMR, Python, Airflow, Mlflow, Tensorflow, Delta, Kubernetes, Redshift, SQL, Terraform, Ansible

 

Au quotidien, vous allez :

  • Participer à la définition et à l’implémentation d’une architecture performante, robuste, scalable et aux coûts maîtrisés pour nos applications Spark ainsi que pour nos pipelines de production de Machine Learning (évaluation des feature stores, refactoring de DAG Airflow)
  • Accompagner les Data Scientists lors de leur mise en production (relecture de code, pair programming) et mettre en place les best practices
  • Optimiser et améliorer la CI/CD de l’équipe en collaboration avec l’équipe SRE
  • Assurer la montée en compétence des membres de l’équipe sur les sujets de MLOps et Data Engineering
  • Réfléchir à la meilleure façon d'intégrer les données Google Analytics dans la data platform
  • Partager ses connaissances et présenter les travaux devant toutes les équipes Labs

 

Ce qu’on peut vous apporter :

  • Des projets data driven, divers et variés (traitements massifs d’images, de textes, time series etc.) pour des produits différents de Mirakl
  • Une culture orientée sur la veille technologique
  • Des projets qui ont un vrai impact business devant être déployés sur des centaines de clients dans un contexte multilingue

 

Quelques exemples de sujets en cours :

  • Enrichissement des données produit à partir des images et des descriptions
  • Modération automatique des produits
  • Mapping automatique des données produit
  • Identification des produits à fort potentiels
  • Détection de comportements frauduleux
  • Sentiment analysis sur les messages échangés entre clients et vendeurs et dans les évaluations
  • Détermination de prix optimaux
  • Monitoring de la qualité de service des vendeurs
  • Des applications d’inférence en synchrone de nos modèles de ML

 

Vous aimerez ce job si :

  • Vous êtes passionné(e) par la data et les technologies modernes permettant d'en tirer partie
  • Vous vous intéressez à la data science et avez des connaissances générales sur les algorithmes de Machine Learning
  • Vous avez un background en développement et avez évolué dans un environnement Data
  • Vous avez a minima 4 ans d’expérience en environnement Machine Learning et/ou Data
  • Vous avez mis en production avec succès des applications Big Data faisant appel à du Machine Learning, du NLP, du traitement d’images dans des projets d'envergure, à fort volume de données
  • Votre maîtrisez Python, êtes un pro des frameworks data de la fondation Apache et êtes à l'aise dans un environnement AWS
  • Vous maîtrisez au moins un outil d’orchestration (Airflow, Data Pipeline ou tout autre outil similaire)
  • Vous présentez vos travaux de manière simple et accessible
  • Vous faîtes preuve d'un bon relationnel et vous aimez mentorer des collaborateurs
  • Vous parlez couramment anglais et français

 

Les plus pour le poste :

  • Vous avez une expérience significative dans le domaine du e-commerce
  • Vous avez déjà mis en place un Data Lake, Data Warehouse ou une Data Platform
  • Vous avez déployé des applicatifs en environnement Kubernetes
  • Vous avez mis en place des pipelines d'ingestion de données avec une approche CDC à l'aide de Debezium ou autre
  • Vous maîtrisez Java/Scala

Mirakl est engagée en faveur de la diversité, de l’égalité des chances et de l’inclusion. Nous célébrons nos différences car nous sommes convaincus que les qualités visibles et invisibles de chaque Mirakl Worker sont une source de force et d’innovation. Dans le cadre de cet engagement, nous étudions toutes les candidatures sans distinction de : genre, ethnicité, religion, orientation sexuelle, handicap, âge ou toute autre caractéristique protégée par la loi.

Bénéfices

    Mutuelle individuelle payée à 100%.
    Participation aux frais téléphonique et internet personnels.
    Contrat avec 25 CPs + RTT.
    Ticket restaurant (carte Swile).
    Choix de votre environnement de travail.
    2 jours de télétravail par semaine (full remote possible).
    Congé rémunéré d'un mois pour le second parent #ParentalAct.
    Indemnité kilométrique pour vos trajets domicile-travail en vélo.
    Aide au déménagement (vers Paris et Bordeaux).
    Nous offrons des BSPCE (selon performance et ancienneté).