IA | Extraction de données structurées et non structurées - Data Engineering & Architecture des données - Réaliser la collecte, le stockage et la mise à disposition des données d’un projet en intelligence artificielle

Training created on 2/11/26. Last update on 6/5/26.
Programme version: 3

Type of training

Distance learning

Training duration

129 hours (30 days)

Accessibility

Yes

Certificate training

Yes

CPF funding

Training eligible for CPF funding
Net of VAT
Sign-up
Net of VAT
Sign-up
Net of VAT
Sign-up
Need to adapt this training to your needs? Do not hesitate to contact us for a customised quote! Contact us

IA | Extraction de données structurées et non structurées - Data Engineering & Architecture des données - Réaliser la collecte, le stockage et la mise à disposition des données d’un projet en intelligence artificielle


Objectives of the training

  • Automatiser l’extraction de données depuis un service web, une page web (scraping), un fichier, une base de données et un système big data.
  • Développer des requêtes SQL d’extraction adaptées au système de gestion de base de données.
  • Développer des règles d’agrégation et d’homogénéisation des données issues de différentes sources.
  • Créer une base de données dans le respect du RGPD à partir des données préparées.
  • Développer une API REST mettant à disposition le jeu de données.

Profile of beneficiaries

For whom
  • Pour tout candidat sans prérequis de diplôme ou d'expérience professionnelle.
  • Tous secteurs d’activité.
  • Pour les entreprises qui innovent et imaginent les cas d'usages de l'intelligence artificielle : les industries, les startup, les TPE, les PME, et les majors du numériques.
  • Pour les entreprises qui vendent des services d'intelligence artificielle : les agence web, les ESN, les majors du numériques, les éditeurs de services.
  • Pour les entreprises qui exploitent l'intelligence artificielle pour leur développement ou leur stratégie : les grands comptes, les banques et assurances, la grande distribution et le transport.
  • La compréhension du métier de développeur en intelligence artificielle.
Requirements
  • Avoir un Bac+2 scientifique, informatique ou tertiaire,
  • La maîtrise des compétences informatiques fondamentales : utilisation d'un système de fichiers d'un système d'exploitation, navigation internet, installation d'applications ;
  • La maîtrise du français au niveau B2 ;
  • Avoir une bonne connexion internet
  • Avoir un ordinateur, une webcam et un micro

Training content

Module 1 – Automatiser l’extraction de données non structurées et/ou structurées
  • Extraire des données non structurées depuis un service web et une page web (scraping).
  • Extraire des données structurées depuis un fichier et une base de données.
  • Interagir avec un système big data.
  • Programmer le script adapté afin de pérenniser la collecte des données nécessaires au projet.
Module 2 – Développer des requêtes SQL d’extraction depuis un système de gestion de base de données
  • Appliquer le langage SQL propre au système de gestion de base de données.
  • Développer des requêtes d’extraction complexes.
  • Interroger un système big data via un langage de requête adapté.
  • Préparer la collecte des données nécessaires au projet.
Module 3 – Nettoyer des données en développant des règles d’agrégation et d’homogénéisation des données
  • Agréger des données issues de différentes sources.
  • Programmer la suppression des entrées corrompues.
  • Programmer l’homogénéisation des formats des données.
  • Structurer le jeu de données final prêt au stockage.
Module 4 – Créer une base de données dans le respect du RGPD
  • Élaborer les modèles conceptuels des données.
  • Élaborer les modèles physiques des données.
  • Programmer l’import des données préparées.
  • Appliquer les principes du RGPD au stockage du jeu de données.
Module 5 – Développer une API REST mettant à disposition le jeu de données
  • Concevoir une architecture REST.
  • Développer une API permettant l’exploitation du jeu de données.
  • Mettre à disposition les données pour les autres composants du projet.
  • Documenter les endpoints.

Teaching team

• Intervenants : professionnels dans le domaine et aguerris aux méthodes pédagogiques Personnes en charge du suivi : • Coordinatrice des relations clients et des inscriptions : Mélanie Garinet • Coordinatrice des examens et des certifications : Allison Foulon • Responsable technique et pédagogique : Jean-Denis Coindre • Tel : 06 89 44 06 97 • Email : contact@evolution5.fr Outils techniques de la visio : Lors de la convocation, vous recevrez la procédure pour vous connecter (logiciel, lien et accès pour la visio)

Monitoring of implementation and evaluation of results

  • Cas pratiques et mises en situation professionnelle, faisant l'objet d'une soutenance orale devant le jury de certification ainsi que d'un rendu de livrables en amont de la soutenance orale.
  • Evaluation de connaissances au démarrage
  • Formation à distance en visio avec exercices en inter-sessions. (Pour les entreprises : la formation peut se dérouler intra-entreprise et dans leurs locaux)
  • Certificat de réalisation de formation
  • Jury devant des professionnels

Technical and educational resources

  • Exercices / Cas pratiques
  • Livret de formation
  • Les vidéos E-Learning seront accessibles sur notre plateforme Digiforma

Quality and satisfaction

Non disponible à ce jour sur 2025.

Certification procedures

Expected results at the end of the training
  • C1 Automatiser l’extraction de données depuis un service web, une page web (scraping), un fichier de données, une base de données et un système big data en programmant le script adapté afin de pérenniser la collecte des données nécessaires au projet. C2 Développer des requêtes de type SQL d’extraction des données depuis un système de gestion de base de données et un système big data en appliquant le langage de requête propre au système afin de préparer la collecte des données nécessaires au projet. C3 Développer des règles d'agrégation de données issues de différentes sources en programmant, sous forme de script, la suppression des entrées corrompues et en programmant l’homogénéisation des formats des données afin de préparer le stockage du jeu de données final. C4 Créer une base de données dans le respect du RGPD en élaborant les modèles conceptuels et physiques des données à partir des données préparées et en programmant leur import afin de stocker le jeu de données du projet. C5 Développer une API mettant à disposition le jeu de données en utilisant l’architecture REST afin de permettre l’exploitation du jeu de données par les autres composants du projet.
Obtaining procedure
  • Cas pratiques et mises en situation professionnelle, faisant l'objet d'une soutenance orale devant le jury de certification ainsi que d'un rendu de livrables en amont de la soutenance orale.
Certification details
  • RNCP 37827 BC01 "Réaliser la collecte, le stockage et la mise à disposition des données d’un projet en intelligence artificielle" Centre de formation : EVOLUTION5 Centre Certificateur : SIMPLON

Reception capacity

Between 1 and 6 learners

Login delay

15 days

Accessibility

Accessibilité ou possibilités d’adaptation des modalités proposées aux apprenants en situation de handicap. Nos formations sont accessibles aux personnes en situation de handicap, nous contacter. Nous étudions toutes les situations pour envisager une intégration dans la formation, pour cela n’hésitez pas à nous faire part de vos besoins au moment de votre inscription. Si malgré tous nos efforts, il nous était impossible d’adapter notre accueil, nous prévoyons une orientation vers des organismes appropriés.