les offres de stages

Offre de stage — Stockage distribué pour plateformes IA

Intitulé du stage : Stockage distribué & Pipelines de données pour plateformes IA

Lieu : Alger (sur site & remote) / Durée : 4 à 6 mois Thèmes : Systèmes distribués, Stockage haute performance, Data Engineering

Vos missions

En lien direct avec notre équipe infrastructure, vous serez en charge de la mise en œuvre et de l'optimisation du stockage distribué pour les workloads IA :

Déploiement et configuration de systèmes de fichiers parallèles (BeeGFS Vs Lustre,)
Mise en place de pipelines de données haute performance pour l'entraînement multi-GPU
Utilisation de NVIDIA DALI et d'autres accélérateurs de data loading
Benchmarking du stockage (IOPS, débit séquentiel, métadonnées) avec fio, ior, mdtest
Étude de l'impact du stockage sur les performances d'entraînement (data loading bottleneck, caching local NVMe)
Mise en place de stratégies de tiering (cache GPU/NVMe ↔ stockage parallèle ↔ stockage objet)
Rédaction de documentation technique et de guides utilisateurs

Profil recherché

Solides bases en systèmes Linux et en administration système
Bonne maîtrise de Python et des outils de scripting (Bash)
Intérêt pour les systèmes distribués et le stockage haute performance
Connaissances en réseau (TCP/IP, RDMA, InfiniBand) appréciées
Notions de machine learning / deep learning (pour comprendre les besoins des workloads)
Familiarité avec les conteneurs (Docker, Apptainer) appréciée
Curiosité, autonomie, rigueur, esprit d'équipe

Ce que nous offrons

Un environnement matériel haut de gamme pour expérimenter sans contrainte
Un encadrement par une équipe d'experts infrastructure
Une montée en compétence rapide sur les outils standards de l'industrie HPC/IA
Des projets concrets, à forte valeur ajoutée
Perspective d'embauche à l'issue du stage pour les profils confirmés

Candidature : CV à [ job@umaitek.dz ] Objet : Candidature Stage — Stockage distribué IA

Offre de stage — Modélisation & Exploitation de plateformes GPU

Intitulé du stage : Modélisation & Exploitation de plateformes GPU

Lieu : Alger (sur site & remote) / Durée : 4 à 6 mois

Vos missions

En lien direct avec notre équipe infrastructure, vous serez en charge de la partie fonctionnelle IA :

Préparation et exécution de jobs de calcul sur cluster GPU
Mise en œuvre de workloads d'entraînement multi-GPU (PyTorch DDP, FSDP, DeepSpeed, NeMo)
Lancement et suivi de jobs via SLURM (scripts sbatch, gestion des ressources, files d'attente)
Utilisation de conteneurs HPC (Enroot/Pyxis, Apptainer) pour packager les environnements
Exécution de jobs d'inférence GPU (vLLM, Triton, TGI)
Benchmarking et optimisation des performances (throughput, latence, scaling multi-GPU)
Construction de scripts et templates de jobs réutilisables pour nos clients
Rédaction de documentation technique et de guides utilisateurs

Profil recherché

Solides bases en machine learning et deep learning
Bonne maîtrise de Python et PyTorch (ou TensorFlow)
Expérience pratique sur l'entraînement de modèles (projets, recherche, hackathons)
À l'aise sous Linux et en ligne de commande
Connaissance des LLM et de l'écosystème Hugging Face appréciée
Curiosité, autonomie, rigueur, esprit d'équipe

Ce que nous offrons

Un environnement matériel haut de gamme pour expérimenter sans contrainte
Un encadrement par une équipe d'experts infrastructure
Une montée en compétence rapide sur les outils standards de l'industrie IA
Des projets concrets, à forte valeur ajoutée
Perspective d'embauche à l'issue du stage pour les profils confirmés

Candidature : CV à [ job@umaitek.dz ] Objet : Candidature Stage IA — Modélisation & Exploitation GPU

Contact

Email

Téléphone

contact@umaitek.dz

+213 (0)23 607 305

ADDRESSE

Cite J8 N 110 Jolie vue Kouba Alger ALGERIE

Politique de Confidentialité >

Prise Rendez-vous

Nous prenons contact avec vous sous les 48H

Intégrateur de solutions IT depuis plus de 15 ans : Data Center, Réseaux, Cybersécurité, HPC et Intelligence Artificielle

UMAITEK ALGERIE

FOLLOW US