Mission
Au quotidien, ce ne sont pas moins de 270 collaborateurs qui évoluent dans un écosystème innovant - mêlant IA, machine learning et IoT - et donnent du sens à notre raison d’être : permettre à chacun d’optimiser sa consommation d’énergie et son empreinte carbone en révélant tout le potentiel de la data.
Plus de 20 millions de particuliers et 70 000 professionnels (tertiaire, industrie, collectivité) bénéficient ainsi de solutions digitales dédiées aux fonctionnalités avancées : suivi multi-fluides, répartition des usages, alertes en cas de dépassement de seuil ou encore plan d’actions d’économies d’énergie, les utilisateurs ont toutes les clés en main pour consommer moins, et mieux.
Au sein de l'équipe Data, nos algorithmes sont au cœur de l'intelligence de nos produits : répartition de la consommation par usage, comparaison entre foyers similaires, estimation de DPE, optimisation du pilotage énergétique…
Nous travaillons en collaboration étroite avec la R&D du Groupe EDF sur la conception de ces modèles. Notre ambition aujourd'hui : renforcer notre capacité de recherche algorithmique en interne pour gagner en autonomie, mieux adapter nos solutions à nos enjeux produits, et être davantage moteurs dans nos choix de modélisation.
C'est dans ce contexte que nous créons ce poste de Data Scientist orienté Recherche & Innovation, au sein d'une équipe où vous travaillerez en étroite collaboration avec un autre Data Scientist tout en menant vos propres sujets de recherche en autonomie.
Au sein de l'équipe Data, vous serez responsable de la conception de systèmes algorithmiques destinés à alimenter nos plateformes énergétiques B2C et B2B.
Nos projets data suivent un cycle complet menant à l'intégration dans nos produits :
- Qualification du besoin en lien avec les enjeux Produits
- Recherche algorithmique & conception du modèle
- Préparation du modèle pour sa mise en production
- Déploiement & inférence en production
- Monitoring, contrôle de performances et amélioration continue
Vous
interviendrez principalement sur les étapes 1 à 3, de la compréhension du
besoin métier jusqu'à la préparation du modèle pour sa mise en production.
Concevoir des solutions algorithmiques adaptées à nos enjeux produits (70/80% du temps)
- Comprendre en profondeur les besoins métiers et la stratégie produit pour identifier les approches algorithmiques les plus pertinentes
- Concevoir des systèmes de modélisation parfois complexes : des écosystèmes de briques algorithmiques interdépendantes (prétraitement, modèles intermédiaires, moteur de décision) plutôt qu'un modèle isolé
- Explorer et analyser les jeux de données, calibrer les modèles, évaluer leur performance
- Intégrer les dimensions métier dans vos modélisations : nos algorithmes ne sont pas que de la statistique pure, ils traduisent aussi des réalités physiques (thermique du bâtiment, inertie énergétique, règles de calcul de DPE…)
- Interagir avec la R&D EDF : comprendre en détail leurs modèles, partager les contraintes propres à Datanumia, adapter les solutions à notre contexte produits
- Arbitrer le bon niveau de complexité : la meilleure solution n'est pas toujours la plus sophistiquée, c'est celle qui est adaptée à l'usage réel et au go-to-market
Contribuer à la préparation pour la mise en production (20/30% du temps)
- Produire un code structuré, modulaire et maintenable, en respectant les bonnes pratiques de l'équipe
- Packager vos travaux pour faciliter leur reprise par les ML Engineers lors de l'industrialisation
- Utiliser MLflow pour le suivi de vos expérimentations et la comparaison de modèles
- Collaborer avec les ML Engineer et les Feature Teams pour assurer une transition fluide vers la production
Exemples de sujets sur lesquels vous interviendrez
- Systèmes de recommandation d'actions pour les professionnels de l'énergie (audit énergétique, optimisations, etc.)
- Recommandations personnalisées pour les particuliers en exploitant la combinaison de nos briques algorithmiques existantes
- Calculs de gains énergétiques
- Optimisation de pilotage d’IoT intégrant des composantes mathématiques et physiques
- Prévisions de consommation
Profil
Formation
- Diplôme d'école d'ingénieur (spécialisation data science, mathématiques appliquées, statistiques) ou Master/Doctorat avec une forte composante mathématique et une pratique concrète du code.
Expérience
- 2 à 4 ans d'expérience en data science/modélisation statistique (ou sortie de thèse appliquée avec une vraie dimension code)
- Vous avez déjà mené au moins un projet de modélisation de bout en bout (exploration à conception à livraison d'un modèle exploitable)
- Idéalement, vous avez participé à l'industrialisation d'un modèle, même partiellement
Compétences techniques
Indispensable :
- Solide bagage en mathématiques et méthodes statistiques : classification, régression, prévision, détection d'anomalies, optimisation
- Maîtrise de Python et de l'écosystème ML (Scikit-learn, TensorFlow, PyTorch…)
- Capacité à comprendre et modéliser des phénomènes à composante physique/mathématique
Important :
- Expérience avec MLflow (ou équivalent)
- SQL pour la manipulation de données depuis un Data Lake/Data Warehouse
- Bonnes pratiques de code et d’architecture ML eng
Un plus :
- Connaissance d'un environnement cloud (AWS de préférence)
- Familiarité avec les problématiques de consommation énergétique, thermique du bâtiment, etc.
- Curiosité pour l'IA générative et ses applications potentielles
Ce qui fera la différence
- Vous savez penser "système" : concevoir un ensemble cohérent de briques algorithmiques, pas juste un modèle isolé
- Vous êtes pragmatique : vous cherchez la solution adaptée au contexte, pas la plus sophistiquée
- Vous avez une vraie curiosité métier : vous aimez comprendre le domaine dans lequel vous modélisez
- Vous savez communiquer vos choix de modélisation à des interlocuteurs variés (équipe Data, Product Owner, Chercheurs R&D)
- Vous êtes autonome et proactif(ve) : vous savez prendre des initiatives sur vos sujets de recherche tout en sachant collaborer étroitement avec l'équipe
- Vous avez une appétence technique pour rendre concrets vos travaux en les préparant à une mise en production

