Alternance - Data Engineer (H/F)

  • Nantes
  • Solocal

SOLOCAL : 1er acteur français du marketing digital, Solocal est le premier partenaire de toutes les entreprises locales, que ce soit des ETI, TPE, PME, mais aussi des grandes enseignes à réseaux ou des collectivités. Sa mission : dynamiser la vie locale. Chaque jour, Solocal conseille 309 000 entreprises clientes présentes partout en France et les accompagne pour booster leur activité. Solocal travaille à révéler le potentiel de toutes les entreprises en les connectant à leurs clients grâce à des services digitaux innovants (Présence relationnelle avec une gamme d'offres Connect, Site Internet et sites de e-commerce, Publicité digitale) et qu'elles peuvent piloter en toute autonomie via l'app Solocal Manager. Solocal se tient également aux côtés des internautes et mobinautes pour leur faire vivre la meilleure expérience digitale avec PagesJaunes et Ooreka. Le Groupe met ainsi à la disposition des professionnels et du grand public des services à très fortes audiences sur ses propres médias (21 millions de VU/mois), de la data géolocalisée, des plateformes technologiques évolutives, une couverture commerciale unique en France, des partenariats privilégiés avec les acteurs du numérique comme les Gafam. Engagé dans une stratégie sociétale et environnementale depuis 2013, Solocal adhère aux objectifs de développement durable des Nations Unies et est certifié Ecovadis et Gaïa Ethifinance avec une note de 80/100.

Description de l'offre :

  • Au sein d'une équipe de la direction technique du groupe, la mission s'inscrit autour de la collecte et la consolidation des données d'audience qualifiée des médias Solocal pour préparer le calcul de la performance et ROI de nos produits, restitués aux fronts clients, commerciaux et autres acteurs internes tels que des datascientists.
  • Les solutions développées doivent être adaptées à la volumétrie et au débit : 30 millions de visiteurs uniques / mois et 6 milliards de requêtes HTTP, 14ème audience française. Les traitements doivent être 100% conformes notamment au RGPD. Le modèle de données en sortie doit être adapté aux différents besoins de restitution en externe comme en interne.
  • Le projet est un pipeline de données, c'est-à-dire l'ingestion de flux de données, contrôles, intégration, consolidation des flux, agréations de données, indexations et partage de ces données.
  • Objectifs de la mission et tâches
  • La mission consiste en:
  • Participation aux développements de composants
  • Maintenance des flux sur cloud Google (GCP)
  • Développement du contrôle qualité des données et d'alertes sur la qualité des flux de données
  • Qualification de l'audience notamment pour mieux identifier les visites robotisées

Fonction : Informatique & Technologies

Domaine d'activité : Marketing / Communication / Publicité / RP

Type de contrat : Alternance

Conditions : Temps plein

Statut : Employé

Informations géographiques : Pays : France

Région : Bretagne

Département : 35 - Ille-et-Vilaine

Ville : Cesson-Sévigné

Profil recherché :

  • Niveau Bac+4/+5 en ingénierie des données / ingéniérie logicielle généraliste avec l'appétence pour le traitement de données massives.
  • Pratique de l'anglais oral et écrit
  • Environnement technique:
  • Langage : Python, Bigquery SQL et Javascript, Apache Beam/Java, scripts shell Spark/Scala
  • Cloud : Google Cloud Project (Pub/Sub, BigQuery, DataFlow, Storage, Functions, DataProc) orchestration par Airflow
  • CI/CD : GitlabCI - K8s- Méthodologie Scrum

Expérience : 0-1 an

Diplôme : BAC+4