Senior Data Scientist | Data Scientist Sénior
Role Summary We are seeking a Data Scientist with experience manipulating large 2D and 3D media datasets. This role is centered on bridging the gap between raw data and high-quality machine learning inputs, requiring a blend of technical expertise and cross-functional leadership. Responsibilities Cross-Functional Coordination: Work with partner ML and Annotation engineers and TPMs to spec out data and training requirements. Data Strategy & Pipeline Oversight: Ensure that datasets are correctly curated, filtered, and processed to meet the rigorous standards of production-level machine learning. Requirements Translation: Act as a technical translator, taking high-level project goals and turning them into actionable data specs for engineering and annotation teams. Quality Assurance & Analysis: Maintain high standards for data integrity, ensuring that the media datasets used for training are representative and accurate. Résumé du poste Nous recherchons une personne spécialisée en science des données possédant une expérience dans la manipulation de vastes ensembles de données multimédias 2D et 3D. Ce rôle est axé sur le rapprochement entre les données brutes et des entrées de haute qualité pour l’apprentissage automatique, et requiert une combinaison d’expertise technique et de leadership interfonctionnel. Responsabilités Coordination interfonctionnelle : Collaborer avec les équipes partenaires d’ingénierie ML, d’annotation et les TPM afin de définir les exigences en matière de données et d’entraînement. Stratégie de données et supervision des pipelines : Veiller à ce que les ensembles de données soient correctement sélectionnés, filtrés et traités afin de répondre aux normes rigoureuses de l’apprentissage automatique en environnement de production. Traduction des exigences : Agir comme personne intermédiaire technique en transformant des objectifs de projet de haut niveau en spécifications de données concrètes pour les équipes d’ingénierie et d’annotation. Assurance qualité et analyse : Maintenir des normes élevées d’intégrité des données, en s’assurant que les ensembles de données multimédias utilisés pour l’entraînement sont représentatifs et exacts.