IA | Extraction de données structurées et non structurées - Data Engineering & Architecture des données - Réaliser la collecte, le stockage et la mise à disposition des données d’un projet en intelligence artificielle

Formation créée le 11/02/2026.
Version du programme : 1

Type de formation

Distanciel

Durée de formation

35 heures (15 jours)

Accessibilité

Oui

Formation certifiante

Oui

Financement CPF

Formation finançable CPF
Net de TVA
S'inscrire
Net de TVA
S'inscrire
Net de TVA
S'inscrire
Besoin d’adapter cette formation à vos besoins ? N’hésitez pas à nous contacter afin d’obtenir un devis sur mesure ! Nous contacter

IA | Extraction de données structurées et non structurées - Data Engineering & Architecture des données - Réaliser la collecte, le stockage et la mise à disposition des données d’un projet en intelligence artificielle


Objectifs de la formation

  • Automatiser l’extraction de données depuis un service web, une page web (scraping), un fichier, une base de données et un système big data.
  • Développer des requêtes SQL d’extraction adaptées au système de gestion de base de données.
  • Développer des règles d’agrégation et d’homogénéisation des données issues de différentes sources.
  • Créer une base de données dans le respect du RGPD à partir des données préparées.
  • Développer une API REST mettant à disposition le jeu de données.

Profil des bénéficiaires

Pour qui
  • Pour tout candidat sans prérequis de diplôme ou d'expérience professionnelle.
  • Tous secteurs d’activité.
  • Pour les entreprises qui innovent et imaginent les cas d'usages de l'intelligence artificielle : les industries, les startup, les TPE, les PME, et les majors du numériques.
  • Pour les entreprises qui vendent des services d'intelligence artificielle : les agence web, les ESN, les majors du numériques, les éditeurs de services.
  • Pour les entreprises qui exploitent l'intelligence artificielle pour leur développement ou leur stratégie : les grands comptes, les banques et assurances, la grande distribution et le transport.
Prérequis
  • L'entrée en formation est possible pour tout candidat sans prérequis de diplôme ou d'expérience professionnelle.

Contenu de la formation

Module 1 – Automatiser l’extraction de données non structurées et/ou structurées
  • Extraire des données non structurées depuis un service web et une page web (scraping).
  • Extraire des données structurées depuis un fichier et une base de données.
  • Interagir avec un système big data.
  • Programmer le script adapté afin de pérenniser la collecte des données nécessaires au projet.
Module 2 – Développer des requêtes SQL d’extraction depuis un système de gestion de base de données
  • Appliquer le langage SQL propre au système de gestion de base de données.
  • Développer des requêtes d’extraction complexes.
  • Interroger un système big data via un langage de requête adapté.
  • Préparer la collecte des données nécessaires au projet.
Module 3 – Nettoyer des données en développant des règles d’agrégation et d’homogénéisation des données
  • Agréger des données issues de différentes sources.
  • Programmer la suppression des entrées corrompues.
  • Programmer l’homogénéisation des formats des données.
  • Structurer le jeu de données final prêt au stockage.
Module 4 – Créer une base de données dans le respect du RGPD
  • Élaborer les modèles conceptuels des données.
  • Élaborer les modèles physiques des données.
  • Programmer l’import des données préparées.
  • Appliquer les principes du RGPD au stockage du jeu de données.
Module 5 – Développer une API REST mettant à disposition le jeu de données
  • Concevoir une architecture REST.
  • Développer une API permettant l’exploitation du jeu de données.
  • Mettre à disposition les données pour les autres composants du projet.
  • Documenter les endpoints.

Équipe pédagogique

• Intervenants : professionnels dans le domaine et aguerris aux méthodes pédagogiques Personnes en charge du suivi : • Coordinatrice des relations clients et des inscriptions : Mélanie Garinet • Coordinatrice des examens et des certifications : Allison Foulon • Responsable technique et pédagogique : Jean-Denis Coindre • Tel : 06 89 44 06 97 • Email : contact@evolution5.fr Outils techniques de la visio : Lors de la convocation, vous recevrez la procédure pour vous connecter (logiciel, lien et accès pour la visio)

Suivi de l'exécution et évaluation des résultats

  • • Cas pratiques et mises en situation professionnelle, faisant l'objet d'une soutenance orale devant le jury de certification ainsi que d'un rendu de livrables en amont de la soutenance orale. • Evaluation de connaissances au démarrage • Formation à distance en visio avec exercices en inter-sessions. (Pour les entreprises : la formation peut se dérouler intra-entreprise et dans leurs locaux) • Certificat de réalisation de formation • Jury devant des professionnels

Ressources techniques et pédagogiques

  • Exercices / Cas pratiques Livret de formation Les vidéos E-Learning seront accessibles sur notre plateforme Digiforma

Modalités de certification

Résultats attendus à l'issue de la formation
  • C1 Automatiser l’extraction de données depuis un service web, une page web (scraping), un fichier de données, une base de données et un système big data en programmant le script adapté afin de pérenniser la collecte des données nécessaires au projet. C2 Développer des requêtes de type SQL d’extraction des données depuis un système de gestion de base de données et un système big data en appliquant le langage de requête propre au système afin de préparer la collecte des données nécessaires au projet. C3 Développer des règles d'agrégation de données issues de différentes sources en programmant, sous forme de script, la suppression des entrées corrompues et en programmant l’homogénéisation des formats des données afin de préparer le stockage du jeu de données final. C4 Créer une base de données dans le respect du RGPD en élaborant les modèles conceptuels et physiques des données à partir des données préparées et en programmant leur import afin de stocker le jeu de données du projet. C5 Développer une API mettant à disposition le jeu de données en utilisant l’architecture REST afin de permettre l’exploitation du jeu de données par les autres composants du projet.
Modalité d'obtention
  • Cas pratiques et mises en situation professionnelle, faisant l'objet d'une soutenance orale devant le jury de certification ainsi que d'un rendu de livrables en amont de la soutenance orale.
Détails sur la certification
  • RNCP 37827 BC01 "Réaliser la collecte, le stockage et la mise à disposition des données d’un projet en intelligence artificielle" Centre de formation : EVOLUTION5 Centre Certificateur : SIMPLON

Capacité d'accueil

Entre 1 et 6 apprenants

Délai d'accès

15 jours

Accessibilité

Nos formations sont accessibles aux personnes en situation de handicap. Merci de nous faire part de vos besoins lors de l’inscription. Chaque demande sera examinée avec attention. Si nécessaire, nous vous orienterons vers un organisme spécialisé.