Description du poste
Vous aurez pour mission principale d’accompagner la mise en place de démonstrateurs et de solutions « centrées sur les données » en réponse à des questions posées par les équipes scientifiques. Vous vous appuierez sur votre expertise en technologies d’intelligence artificielle et de big data pour concevoir et préparer les outils les plus adaptés aux cas d’usage à traiter et préparer les données de façon optimale.
Ces missions seront menées dans le cadre de la collaboration renforcée avec le laboratoire océanographique et également en collaboration avec les homologues français, européens et internationaux. Elles pourront s’appuyer sur des prestations contractualisées auprès de sociétés de service en informatique dont il faudra assurer le pilotage.
Activités principales
Les activités principales seront les suivantes :
- Concevoir et mettre en place les solutions techniques les mieux adaptées pour les besoins scientifiques,
- Implémenter les différentes bibliothèques logicielles (bibliothèques mathématiques et géostatistiques, d’apprentissage, de visualisation de données, de cartographie, …) nécessaires à l’analyse des données et au développement des démonstrateurs,
- Adapter et/ou optimiser ces bibliothèques aux types de données traitées (océanographie) et aux infrastructures informatiques utilisées,
- Préparer et structurer les données pour permettre des traitements efficaces,
- Contribuer à l’entraînement des modèles,
- Contribuer à la définition des plateformes d’analyses de données et proposer des pistes d’amélioration,
- Contribuer à l’industrialisation et à l’intégration des solutions techniques développées dans le cadre des démonstrateurs (DevOps),
- Assurer au quotidien information, formation et support aux analystes de données : conseils d’emplois des bibliothèques, rédaction des documents associés (notebooks d’exemple, aide en ligne, wiki, manuel utilisateurs…),
- Contribuer au montage de projets communs de recherche avec les équipes des différents organismes.
Vous participerez également à l’ensemble des travaux généraux liés à la bonne marche du service ISI : contribution à l’élaboration de bonnes pratiques de développements et de déploiements logiciels, de conduite de prestations, d’assurance qualité des projets et des services, …
A plus long terme, suivant les profils, vos missions confiées pourront évoluer vers des rôles de coordination (chef de projet, architecte).
Ces travaux s’inscrivent dans les préceptes de l’Open Science (FAIR des données et des services, …) et reposeront pour l’essentiel sur des bibliothèques logicielles existantes, développées en mode collaboratif, et mises à disposition de la communauté scientifique sous des modalités « Open Source ». Ils pourront réciproquement constituer des contributions à ces développements communautaires.
Profil recherché
- Ingénieur en informatique ou en data science, de niveau bac+5, grande école ou équivalent,
- Une première expérience dans les domaines techniques cités ci-dessus sera appréciée. Cependant, si vous n’avez pas l’ensemble des compétences mentionnées, votre candidatures sera considérée. Des formations techniques complémentaires pourront être envisagées.
- Informatique générale : système Linux, bases de données relationnelles, …
- Expertise en développement et intégration de solutions d’intelligence artificielle et d’analyse de données,
- Très bonne connaissance des technologies logicielles associées : langages de programmation (Python, Julia, R, …), bibliothèques (numPy, cartoPy, Scikit-learn, Tensorflow, Pytorch…), notebooks (Jupyter),
- Expérience avérée de la démarche DevOps : plateforme de développement logiciel (GitLab, …), conteneurisation des applications (Docker, Singularity, …),
- Connaissance des technologies permettant un accès efficace à des données volumineuses : systèmes de fichiers adaptés, bases NoSQL, formats de fichiers adaptés (Parquet), plateformes de distribution de traitements (Dask, Spark), …
- Connaissance des infrastructures matérielles adaptées de type HPC/HPDA, notamment mise en œuvre de processeurs graphiques (GPU) dans un contexte d’analyse de données et/ou de machine learning,
- Connaissance de l’architecture et de l’interopérabilité des systèmes d’information : métadonnées, webservices, sémantique, …
Qualités personnelles :
- Aptitude à travailler en équipe dans des contextes variés (avec les collègues au sein de la collaboration renforcée, avec les analystes de données, avec les partenaires et les prestataires de service),
- Bonnes capacités relationnelles et rédactionnelles en français et en anglais,
- Sens du service,
- Rigueur,
- Fort intérêt pour l’observation et les données environnementales (dont les données marines),
- Intérêt pour les valeurs portées par l’Ifremer (développement de la connaissance de l’océan, développement durable).