Description du poste
Rejoignez un environnement stimulant et des équipes passionnées qui mettent leur talent et leur savoir faire au service des gares de demain. Plus de 3 700 collaborateurs, présents sur l'ensemble du territoire, contribuent en effet à repenser l'avenir des gares et à les intégrer au coeur des projets urbains. La force de SNCF Gares & Connexions, c'est d'intégrer une grande variété de profils et de faire travailler ensemble des métiers très différents.Sous la responsabilité du Responsable Data, le Stagiaire Data Scientist sera intégré au pôle Data Studio de SNCF G&C composé de Data Engineer, Data Scientist, Data Analyst, Data Manager. Il sera amené à intervenir sur toute la chaîne de valeur de la donnée : collecte, traitements, restitution, gouvernance.En tant que Data Scientist, ses missions principales seront les suivantes :Comprendre les enjeux stratégiques et opérationnels des métiers de la SA.Identifier, collecter, explorer et préparer les données pertinentes issues de sources variées et complexes.Concevoir, entraîner, évaluer et déployer des modèles statistiques et de machine learning (IA Gen, prédiction, classification, détection d'anomalies, segmentation, etc.).Produire des analyses exploratoires approfondies, permettant d'identifier des tendances, corrélations ou comportements clés.Industrialiser les modèles développés en collaboration avec l'équipe Infra et les Data EngineerDévelopper des notebooks analytiques, scripts ou API permettant la mise à disposition des résultats.Produire des visualisations et rapports d'interprétation des modèles pour faciliter la compréhension et la prise de décision des métiers.Documenter les approches, les modèles, les choix méthodologiques et les résultats.Durant son stage, il sera également amené à travailler sur des sujets de Data Visualisation pour répondre à des sujets transverses à l'équipe Data. A ce titre, il sera amené à :Comprendre les besoins métier en participant à des ateliers de cadrageConcevoir, modéliser et maintenir des modèles de données adaptés aux besoinsDévelopper et maintenir des pipelines de transformation assurant la fiabilité et la performance des flux de donnéesProduire des analyses et visualisations claires permettant aux équipes métiers de prendre des décisions éclairéesIndustrialiser les modèles développés en collaboration avec l'équipe Infra et les Data EngineerSous la responsabilité du Responsable Data, le Stagiaire Data Scientist sera intégré au pôle Data Studio de SNCF G&C composé de Data Engineer, Data Scientist, Data Analyst, Data Manager. Il sera amené à intervenir sur toute la chaîne de valeur de la donnée : collecte, traitements, restitution, gouvernance.En tant que Data Scientist, ses missions principales seront les suivantes :Comprendre les enjeux stratégiques et opérationnels des métiers de la SA.Identifier, collecter, explorer et préparer les données pertinentes issues de sources variées et complexes.Concevoir, entraîner, évaluer et déployer des modèles statistiques et de machine learning (IA Gen, prédiction, classification, détection d'anomalies, segmentation, etc.).Produire des analyses exploratoires approfondies, permettant d'identifier des tendances, corrélations ou comportements clés.Industrialiser les modèles développés en collaboration avec l'équipe Infra et les Data EngineerDévelopper des notebooks analytiques, scripts ou API permettant la mise à disposition des résultats.Produire des visualisations et rapports d'interprétation des modèles pour faciliter la compréhension et la prise de décision des métiers.Documenter les approches, les modèles, les choix méthodologiques et les résultats.Durant son stage, il sera également amené à travailler sur des sujets de Data Visualisation pour répondre à des sujets transverses à l'équipe Data. A ce titre, il sera amené à :Comprendre les besoins métier en participant à des ateliers de cadrageConcevoir, modéliser et maintenir des modèles de données adaptés aux besoinsDévelopper et maintenir des pipelines de transformation assurant la fiabilité et la performance des flux de donnéesProduire des analyses et visualisations claires permettant aux équipes métiers de prendre des décisions éclairéesIndustrialiser les modèles développés en collaboration avec l'équipe Infra et les Data EngineerBAC + 5 - Spécialité Data Science, Intelligence artificielle, Statistiques appliquées :Compétences en statistique appliquée, machine learning, deep learningCompétences en traitement et intégration de données (ETL / ELT, data pipelines), et déploiement de modèles (Azure ML, API, Docker)Maîtrise du langage Python, et notamment des principales bibliothèques data science (pandas, scikit-learn, numpy, matplotlib, seaborn, etc.)Maîtrise des concepts de modélisation de données et des outils de transformation (SQL, dbt, etc.)Connaissance des outils de visualisation (Power BI, Tableau, Looker...).Connaissance des environnements cloud (Azure, Databricks, Azure ML).Connaissance des bonnes pratiques de documentation, d'évaluation et de traçabilité des modèlesFamiliarité avec les méthodes agiles et les environnements collaboratifs.
#J-18808-Ljbffr