les offres de stages

Offre de stage — Stockage distribué pour plateformes IA

Intitulé du stage : Stockage distribué & Pipelines de données pour plateformes IA

Lieu : Alger (sur site & remote) / Durée : 4 à 6 mois Thèmes : Systèmes distribués, Stockage haute performance, Data Engineering

Vos missions

En lien direct avec notre équipe infrastructure, vous serez en charge de la mise en œuvre et de l'optimisation du stockage distribué pour les workloads IA :

  • Déploiement et configuration de systèmes de fichiers parallèles (BeeGFS Vs Lustre,)

  • Mise en place de pipelines de données haute performance pour l'entraînement multi-GPU

  • Utilisation de NVIDIA DALI et d'autres accélérateurs de data loading

  • Benchmarking du stockage (IOPS, débit séquentiel, métadonnées) avec fio, ior, mdtest

  • Étude de l'impact du stockage sur les performances d'entraînement (data loading bottleneck, caching local NVMe)

  • Mise en place de stratégies de tiering (cache GPU/NVMe ↔ stockage parallèle ↔ stockage objet)

  • Rédaction de documentation technique et de guides utilisateurs

Profil recherché
  • Solides bases en systèmes Linux et en administration système

  • Bonne maîtrise de Python et des outils de scripting (Bash)

  • Intérêt pour les systèmes distribués et le stockage haute performance

  • Connaissances en réseau (TCP/IP, RDMA, InfiniBand) appréciées

  • Notions de machine learning / deep learning (pour comprendre les besoins des workloads)

  • Familiarité avec les conteneurs (Docker, Apptainer) appréciée

  • Curiosité, autonomie, rigueur, esprit d'équipe

Ce que nous offrons
  • Un environnement matériel haut de gamme pour expérimenter sans contrainte

  • Un encadrement par une équipe d'experts infrastructure

  • Une montée en compétence rapide sur les outils standards de l'industrie HPC/IA

  • Des projets concrets, à forte valeur ajoutée

  • Perspective d'embauche à l'issue du stage pour les profils confirmés

Candidature : CV à [ job@umaitek.dz ] Objet : Candidature Stage — Stockage distribué IA

Offre de stage — Modélisation & Exploitation de plateformes GPU

Intitulé du stage : Modélisation & Exploitation de plateformes GPU

Lieu : Alger (sur site & remote) / Durée : 4 à 6 mois

Vos missions

En lien direct avec notre équipe infrastructure, vous serez en charge de la partie fonctionnelle IA :

  • Préparation et exécution de jobs de calcul sur cluster GPU

  • Mise en œuvre de workloads d'entraînement multi-GPU (PyTorch DDP, FSDP, DeepSpeed, NeMo)

  • Lancement et suivi de jobs via SLURM (scripts sbatch, gestion des ressources, files d'attente)

  • Utilisation de conteneurs HPC (Enroot/Pyxis, Apptainer) pour packager les environnements

  • Exécution de jobs d'inférence GPU (vLLM, Triton, TGI)

  • Benchmarking et optimisation des performances (throughput, latence, scaling multi-GPU)

  • Construction de scripts et templates de jobs réutilisables pour nos clients

  • Rédaction de documentation technique et de guides utilisateurs

Profil recherché
  • Solides bases en machine learning et deep learning

  • Bonne maîtrise de Python et PyTorch (ou TensorFlow)

  • Expérience pratique sur l'entraînement de modèles (projets, recherche, hackathons)

  • À l'aise sous Linux et en ligne de commande

  • Connaissance des LLM et de l'écosystème Hugging Face appréciée

  • Curiosité, autonomie, rigueur, esprit d'équipe

Ce que nous offrons
  • Un environnement matériel haut de gamme pour expérimenter sans contrainte

  • Un encadrement par une équipe d'experts infrastructure

  • Une montée en compétence rapide sur les outils standards de l'industrie IA

  • Des projets concrets, à forte valeur ajoutée

  • Perspective d'embauche à l'issue du stage pour les profils confirmés

Candidature : CV à [ job@umaitek.dz ] Objet : Candidature Stage IA — Modélisation & Exploitation GPU