👉 Un peu de contexte :
Notre Lab'Innov est la structure R&D d'Aubay Solutec.
Nous travaillons sur des sujets d'innovation en mode R&D sur des sujets liés à des sujets techniques divers (IA, Data Science, IoT ...).
Comment ça fonctionne ?
En groupe de 4 à 6 étudiant(e)s (avec le soutien d'experts), vous allez travailler sur une problématique liée à un sujet innovation ou avec un enjeux pour le futur (ex : De la conception de musique par de l'IA, utiliser l'IA dans le cadre de la protection de l'environnement, traduction de langue des signes ...).
Tout d'abord, vous travaillerez sur un état de l'art, ensuite la mise au point de Proof of Concepts et enfin le projet en lui même.
Ici, nous vous proposons le projet Cohérence des Données.
👉 De quoi ça parle ?
Dans le contexte d'une analyse de données conventionnelle, il est fréquent de s'appuyer sur des données provenant de multiples sources. Ces données peuvent présenter des variations en termes de nature et de format. Face à cette diversité, il devient crucial d'harmoniser les données afin de résoudre les incohérences existantes.
La qualité des données traitées au sein d'une entreprise est un enjeu majeur pour sa productivité. Ceci est encore plus vrai avec le déploiement d'applications basées sur l'intelligence artificielle.
Le volume de données que peut traiter une entreprise a atteint une taille où la simple ressource humaine ne suffit plus à la contrôler. De plus sa forme peut être diverse : des images, du texte ou de l'audiovisuel. Il est pour cela nécessaire de pouvoir traiter ces contenus avec des outils intelligents qui prennent en compte les enjeux de l'entreprise.
Ce stage s'inscrit également dans le cadre d'une thèse « Vers un moteur intelligent de transformation et de qualité de données », actuellement menée au sein de notre équipe autour de ces mêmes problématiques.
👉 Ta contribution :
Ton rôle sera de développer des méthodes novatrices pour réconcilier ces données volumineuses. Il te faudra inventer des stratégies permettant de repérer les divergences, établir des liens entre les ensembles de données similaires ou complémentaires et choisir les données de référence adéquates.
👉 Pour toi :
Ce stage te donnera l'opportunité d'explorer les défis réels liés au traitement des données. Tu auras la chance de proposer une solution innovante à un problème bien connu mais encore souvent irrésolu dans le domaine de l'analyse de données.
Mots clés : Référentiel, Data Quality, IA
Stack technique : Deep Learning, PyTorch, TensorFlow
👉 Le profil que nous recherchons :
Nous recherchons des étudiants en dernière année d'école d'ingénieur, où équivalent, en recherche d'un stage de fin d'études à partir de septembre 2026. Avec une spécialisation ou appétence sur les domaines Data, IA, informatique.
A noter : selon les places restantes, éventuellement quelques places ouvertes pour des étudiants de 4ème année.