Remote
Stellenbeschreibung
Rejoignez tether, une start‑up technologique en pleine expansion basée à Dubaï, qui révolutionne le paysage de l’intelligence artificielle grâce à des modèles de langage de nouvelle génération. En tant qu’AI Research Engineer spécialisé dans le pré‑entraînement, vous intégrerez l’équipe AI Model, un groupe d’experts passionnés par la création d’architectures de modèles de pointe – petits, grands et multimodaux – et par l’optimisation de leurs performances sur des infrastructures massivement distribuées.
**Vos missions principales**
- Concevoir, implémenter et tester des architectures de modèles de langage (LLM) innovantes, en explorant des approches hybrides (texte‑image‑audio) et des techniques de compression pour rendre les modèles plus efficaces.
- Piloter le pré‑entraînement de modèles sur des clusters contenant plusieurs milliers de GPU NVIDIA, en utilisant des frameworks de calcul distribué (DeepSpeed, ZeRO, Megatron‑LM, etc.).
- Curater, nettoyer et enrichir les jeux de données massifs (terabytes) afin d’assurer la qualité et la diversité des corpus d’apprentissage.
- Optimiser les pipelines d’entraînement (data loading, mixed‑precision, pipeline parallelism) pour réduire les goulets d’étranglement et diminuer les coûts d’infrastructure.
- Mettre en place des benchmarks rigoureux et des tableaux de bord de suivi des métriques (perplexité, FLOPs, latence) pour mesurer les gains de performance.
- Collaborer étroitement avec les équipes produit, recherche et infrastructure afin de transformer les prototypes en solutions déployables à l’échelle industrielle.
- Publier des articles scientifiques, brevets ou présentations internes pour partager les avancées et positionner tether comme leader d’opinion dans le domaine du LLM.
**Profil recherché**
- Diplôme d’ingénieur, Master ou PhD en informatique, IA, mathématiques appliquées ou discipline équivalente.
- Minimum 4 ans d’expérience professionnelle en recherche ou ingénierie IA, idéalement sur des projets de pré‑entraînement de modèles de grande taille.
- Maîtrise avancée de Python et des bibliothèques de deep learning (PyTorch, TensorFlow) ainsi que des outils de calcul distribué (Horovod, DeepSpeed, Ray).
- Solide compréhension des architectures de réseaux de neurones (Transformers, Vision‑Language, Diffusion) et des techniques d’optimisation (AdamW, LAMB, quantisation, pruning).
- Expérience avérée avec les environnements GPU (CUDA, cuDNN) et les systèmes Linux/Unix.
- Capacité à travailler de façon autonome en remote, à gérer plusieurs projets simultanément et à communiquer clairement les résultats à des interlocuteurs techniques et non‑techniques.
**Ce que nous offrons**
- Un poste 100 % remote avec une flexibilité horaire adaptée aux fuseaux horaires mondiaux.
- Accès à une infrastructure de pointe (clusters GPU NVIDIA A100/A6000, stockage haute‑performance).
- Budget annuel dédié à la formation, conférences et publications scientifiques.
- Programme de stock‑options et primes de performance basées sur les résultats des modèles.
- Environnement de travail collaboratif, culture d’innovation et opportunités de progression rapide vers des rôles de lead research.
- Equipement (ordinateur portable haut de gamme, moniteurs) et prise en charge des frais de coworking si souhaité.
Si vous êtes animé par la curiosité scientifique, l’envie de repousser les limites du pré‑entraînement des IA et que vous cherchez un challenge stimulant au sein d’une équipe internationale, postulez dès maintenant et participez à la prochaine génération de modèles d’intelligence artificielle chez tether.