Remote
Description du poste
Rejoignez tether, une start‑up innovante spécialisée dans les modèles d’intelligence artificielle de nouvelle génération. En tant qu’Ingénieur(e) Recherche IA dédié(e) au pré‑entraînement, vous intégrerez l’équipe « Modèles IA », dont la mission est de concevoir, optimiser et déployer des architectures de modèles de grande taille, incluant des systèmes multimodaux (texte, image, audio). Vous travaillerez en étroite collaboration avec des chercheurs, des data scientists et des ingénieurs systèmes pour pousser les limites de la performance IA tout en garantissant la robustesse, l’évolutivité et la reproductibilité des pipelines de pré‑entraînement.
**Missions principales**
- Concevoir et implémenter des architectures LLM (Large Language Models) novatrices, en explorant des approches de sparsité, de quantisation et de mix‑expert.
- Développer des pipelines de pré‑entraînement distribués à grande échelle (GPU/TPU), en optimisant l’utilisation des ressources cloud et on‑premise.
- Piloter la curation, le nettoyage et le filtrage de jeux de données massifs (terabytes), en assurant la conformité éthique et légale.
- Identifier, analyser et résoudre les goulets d’étranglement du pré‑entraînement (bottlenecks) : bande passante, I/O, synchronisation, perte de précision.
- Mettre en place des métriques de suivi de la qualité du modèle, de la stabilité du training et du coût énergétique.
- Publier des rapports techniques, des articles scientifiques et des présentations internes pour partager les avancées et les bonnes pratiques.
- Collaborer avec les équipes produit pour transformer les prototypes de recherche en solutions commercialisables.
**Profil recherché**
- Diplôme d’ingénieur, Master ou PhD en informatique, IA, mathématiques appliquées ou domaine connexe.
- Minimum 5 ans d’expérience professionnelle sur des projets de pré‑entraînement de modèles de type LLM ou multimodaux.
- Maîtrise avancée des frameworks Deep Learning (PyTorch, TensorFlow) et des bibliothèques de formation distribuée (DeepSpeed, Megatron‑LM, Horovod).
- Solide expérience en programmation Python et en environnement Linux (bash, Docker, Kubernetes).
- Connaissance approfondie des techniques d’optimisation du training : mixed‑precision, gradient checkpointing, pipeline parallelism.
- Expérience en gestion de données massives (Spark, Hadoop, Dask) et en mise en place de pipelines de data‑curation.
- Capacité à travailler de façon autonome, à prendre des initiatives et à communiquer clairement des concepts complexes à des interlocuteurs non‑techniques.
- Anglais courant (écrit et oral) indispensable ; le français est un plus.
**Ce que nous offrons**
- Contrat CDI à temps plein, 100 % télétravail avec flexibilité horaire.
- Environnement de travail stimulant, avec accès à des ressources de calcul de pointe (GPU/TPU, clusters HPC).
- Budget formation annuel pour conférences, cours en ligne et certifications.
- Participation aux projets open‑source et aux publications scientifiques.
- Culture d’entreprise axée sur l’innovation, la transparence et le bien‑être des collaborateurs.
- Rémunération compétitive et avantages sociaux (assurance santé, congés payés, programme de bien‑être).
Rejoignez une équipe passionnée qui façonne l’avenir de l’IA et contribuez à créer les modèles qui transformeront les industries du monde entier.