SOCIETEINFO - Data Scientist (H/F) - Stage

Compagnie : Intescia Group

Type d'emploi : Stage

1 Boulevard Ampère Carquefou, Pdl

Description de l'emploi - SOCIETEINFO - Data Scientist (H/F) - Stage

Description de l'offre d'emploi

Data Scientist (H/F)

Stage

Rejoignez le Groupe INTESCIA, leader de la Business Intelligence en Europe !

Qui sommes-nous ?
INTESCIA est un acteur majeur dans le domaine de la data, du digital et de l’intelligence économique. Nous accompagnons les entreprises en leur fournissant des solutions innovantes pour optimiser leur gestion, leur performance financière et leur prise de décision. Grâce à nos expertises en business intelligence, veille stratégique et data analytics, nous aidons nos clients à transformer l’information en un véritable levier de croissance.

Nos atouts :

Un groupe en pleine expansion, reconnu pour son expertise et ses solutions à forte valeur ajoutée.
Une culture d’innovation, où la créativité et l’amélioration continue sont au cœur de notre ADN.
Des équipes passionnées et engagées, évoluant dans un environnement stimulant et collaboratif.

Votre mission :

Le groupe INTESCIA recrute pour l’une de ses marques, SociétéInfo.

Intégré(e) à notre équipe, vous contribuerez à la conception d’un pipeline complet d’extraction et d’analyse de documents juridiques.

L’objectif est de transformer des documents PDF hétérogènes (statuts, actes, modifications, etc.) en données structurées exploitables, en combinant OCR avancé et intelligence artificielle (NER et modèles de langage récents).

Vous interviendrez sur un projet à forte valeur ajoutée, mêlant vision par ordinateur, NLP et modèles de langage modernes.

Vos activités :

OCR – Extraction et structuration de texte

Étudier et comparer différentes solutions OCR : Tesseract, EasyOCR, Google Vision API, etc.
Mettre en place une pipeline robuste d’extraction depuis des PDF hétérogènes
Nettoyer, structurer et normaliser les textes extraits
Gérer des cas complexes :
- Documents scannés
- Signatures
- Tableaux
- Colonnes multiples
- Qualité variable des scans

NER – Extraction d’entités juridiques

Développer un modèle de Named Entity Recognition (NER) pour identifier automatiquement :
- Dénomination sociale
- Numéro SIREN / SIRET
- Dirigeants
- Dates d’événements
- Types d’actes (création, modification, dissolution, fusion, etc.)
Tester et comparer différentes approches :
- Modèles pré-entraînés (SpaCy, HuggingFace, etc.)
- LLM récents (ex : Gemma)
- Méthodes hybrides inspirées d’approches modernes d’extraction structurée
Évaluer les performances (précision, rappel, F1-score) et proposer des optimisations

Le profil que nous recherchons :

Étudiant(e) en Master 1 ou Master 2 en Data Science, Intelligence Artificielle, Informatique ou équivalent
Intérêt marqué pour le NLP, les LLM et l’extraction d’information
Goût pour les projets techniques concrets avec impact métier

Vos compétences :

Bonne maîtrise de Python
Connaissances en NLP / Machine Learning
Expérience avec au moins une librairie type SpaCy, HuggingFace ou équivalent
Compréhension des problématiques liées à l’OCR et au traitement de documents
Rigueur, autonomie et esprit d’analyse

Expérience :

Une première expérience en projet NLP, OCR ou LLM est un plus
Une expérience sur des données juridiques ou documents structurés est appréciée

Ce que nous vous offrons :

Poste basé à : Carquefou
Type de contrat : Stage
Rémunération fixe
Horaires de travail : 09h00 - 17h00
Dates de démarrage :
- Mars 2026 (stage de M2)
- Mai 2026 (stage de M1)

Original job SOCIETEINFO - Data Scientist (H/F) - Stage posted on GrabJobs ©. To flag any issues with this job please use the Report Job button on GrabJobs.

Share Job

Get your Resume Reviewed for Free

Similar Data Scientist Jobs in France

Get your Resume Reviewed for Free

Adresse e-mail

Pourquoi signalez-vous ce travail?

I think it’s a discriminatory or offensive

I think it’s fraudulent or a scam

I think it’s trying to sell something unrelated to the job / it’s asking for money

I think it contains incorrect or broken information

Other

Toutes les offres d'emploi sont soumises aux Terms of Service de GrabJobs. Nous permettons aux utilisateurs de signaler les annonces qui pourraient enfreindre ces conditions. Les offres d'emploi peuvent également être signalées par l'équipe de modération de GrabJobs. Cependant, aucun système de modération n'est parfait, et le fait de signaler une annonce ne garantit pas qu'elle sera supprimée.

Setup your job alert:

Frequency

E-mail

En activant les alertes d'emploi, j'accepte les Terms et Privacy Policy de GrabJobs. Je peux me désabonner des alertes d'emploi à tout moment. Sauter

SOCIETEINFO - Data Scientist (H/F) - Stage

Description de l'emploi - SOCIETEINFO - Data Scientist (H/F) - Stage

Description de l'offre d'emploi

C'est fait !

Similar Data Scientist Jobs in France

Applications mobile