Nouveauté 2025 : Découvrez les formations sur l'Intelligence Artificielle

Formations Google Cloud Plateform - IT - Informatique

Formation Google Cloud Platform : Ingénierie des Données

Niveau :

Satisfaction de nos apprenants en 2024 : 98%
Taux d’assiduité : 100%

Tout savoir sur votre formation :

Formez-vous selon vos disponibilités ! Vous proposez 3 dates au choix et votre formateur vous confirme la date souhaitée.

En présentiel dans votre entreprise, dans l’un de nos 54 centres de formation ou en distanciel par visioconférence.

Contexte de la formation

Vous souhaitez maîtriser l’ingénierie des données sur Google Cloud Platform ? Vous voulez transformer les données brutes en informations exploitables pour accélérer votre carrière ? Vous êtes au bon endroit.

Dans le monde numérique actuel, les données sont devenues un atout stratégique incontournable. Le rôle des data engineers est donc essentiel pour transformer ces données brutes en informations exploitables. Ces professionnels sont capables de redéfinir les infrastructures des entreprises pour gagner en flexibilité et en scalabilité grâce à l’essor du cloud computing, et en particulier de Google Cloud Platform (GCP). Les compétences en data engineering sur GCP permettent non seulement de se démarquer dans son domaine, mais aussi d’accélérer sa carrière. Elles offrent de nombreux bénéfices professionnels, tels que la capacité à répondre aux besoins croissants en gestion et analyse des données dans le cloud. De plus, elles constituent un atout personnel en termes de développement de compétences techniques de pointe.

Maintenant, imaginez-vous devenir un expert certifié en data engineering sur GCP.

Avec Expertisme, Organisme de Formation certifié QUALIOPI, vous pouvez rendre ce rêve réalité. Notre formation Data Engineering sur Google Cloud Platform vous permet d’acquérir une connaissance approfondie des services et outils proposés par Google Cloud Platform, tels que BigQuery, Dataflow, Pub/Sub, et Composer. Vous apprendrez à concevoir et optimiser des pipelines de données robustes, à gérer des volumes massifs de données avec une latence minimale et une haute disponibilité, et à garantir l’intégrité et la confidentialité des données traitées. Votre formateur expert métier vous guidera tout au long de ce parcours, vous donnant les clés pour construire des architectures de données efficaces et pour intégrer des données provenant de sources variées. De plus, la formation est conçue pour être adaptable et efficace, vous permettant de mettre immédiatement en pratique les compétences acquises.

N’attendez plus pour transformer votre carrière. Avec notre formation en data engineering sur Google Cloud Platform, vous vous positionnerez en tant qu’expert dans un secteur en pleine expansion. Vous serez mieux préparé à relever les défis liés à la gestion des données dans des environnements complexes et en constante évolution. De plus, votre entreprise bénéficiera de pipelines de données plus dynamiques et sécurisés, conduisant à des décisions basées sur des données fiables et en temps réel.

Rejoignez-nous dès maintenant et écrivez votre propre succès dans le domaine du data engineering sur Google Cloud Platform. Ne manquez pas cette opportunité unique d’accélérer votre carrière et de devenir un acteur clé de la transformation numérique de votre entreprise.

À qui s’adresse cette formation ?

Cette formation s’adresse principalement aux développeurs expérimentés dont la responsabilité est axée sur la gestion des transformations de méga données. Ainsi, les profils concernés sont ceux qui œuvrent dans l’extraction, le chargement, la transformation, le nettoyage et la validation des données. Les ingénieurs en données, les architectes de solutions, les analystes de données, les administrateurs de bases de données et les chefs de projet en informatique sont particulièrement concernés par cette formation. De plus, les professionnels qui cherchent à maîtriser les outils et techniques spécifiques à la plateforme Google Cloud pour améliorer leurs compétences actuelles en ingénierie des données peuvent également bénéficier de cette formation. En somme, ce programme est conçu pour tous ceux qui travaillent activement à transformer et à structurer des données complexes pour en faciliter l’analyse et la prise de décision.

Objectifs

  • Maîtriser les fondamentaux de l’architecture des données sur la plateforme Google Cloud
  • Savoir implémenter des pipelines de données efficaces et optimisés sur Google Cloud Platform
  • Comprendre et appliquer des techniques d’analyse et de visualisation des données avec les outils de Google Cloud
  • Être capable de concevoir et de mettre en œuvre des stratégies de sécurité pour la gestion des données sur Google Cloud Platform
  • Acquérir les compétences nécessaires pour passer la certification Google Cloud Certified – Data Engineer.

Programme

    • Exploration du rôle d’un data engineer
    • Analyse des défis de l’ingénierie des données
    • Introduction à BigQuery
    • Compréhension des data lakes et des data warehouses
    • Démonstration Federated Queries avec BigQuery
    • Comparaison des bases de données transactionnelles et des data warehouses
    • Démonstration Recherche de données personnelles dans votre jeu de données avec l’API DLP
    • Travail en collaboration avec d’autres équipes de données
    • Gestion de l’accès aux données et gouvernance
    • Construction de pipelines prêts pour la production
    • Étude de cas d’un client Google Cloud Platform (GCP)
    • Travaux pratiques : Analyse de données avec BigQuery
    • Introduction aux data lakes
    • Stockage de données et options ETL sur GCP
    • Construction d’un data lake à l’aide de Cloud Storage
    • Démonstration : Optimisation des coûts avec les classes et les fonctions cloud de Google Cloud Storage
    • Sécurisation de Cloud Storage
    • Stockage de tous les types de données
    • Démonstration : Exécution de requêtes fédérées sur des fichiers Parquet et ORC dans BigQuery
    • Cloud SQL en tant que data lake relationnel
    • Travaux pratiques : Charger la BDD Taxis dans le Cloud SQL
    • Le data warehouse moderne
    • Introduction à BigQuery
    • Démonstration : Requêtes de Terabits de données en quelques secondes
    • Chargement de données
    • Démonstration : Interrogation de Cloud SQL à partir de BigQuery
    • Exploration des schémas
    • Exploration des jeux de données publics BigQuery avec SQL à l’aide de INFORMATION_SCHEMA
    • Conception de schémas
    • Champs imbriqués et répétés
    • Champs imbriqués et répétés dans BigQuery
    • Optimisation du partitionnement et du clustering
    • Démonstration : Tables partitionnées et groupées dans BigQuery
    • Transformation de données par lots et en continu
    • Travaux pratiques : Charger des données avec la console et la CLI. Travailler avec les tableaux et les structures
    • Les approches d’intégration EL, ELT et ETL (Extraction, chargement et transformation de données)
    • Les considérations de qualité
    • Comment effectuer des opérations dans BigQuery
    • Démonstration : ELT pour améliorer la qualité des données dans BigQuery
    • Les lacunes
    • ETL pour résoudre les problèmes de qualité
    • L’écosystème Hadoop
    • Exécution de Hadoop sur Cloud Dataproc GCS au lieu de HDFS
    • Optimisation de Dataproc
    • Travaux pratiques : Exécuter des jobs Apache Spark sur Cloud Dataproc
    • Cloud Dataflow
    • Pourquoi les clients apprécient-ils Dataflow ?
    • Pipelines de flux de données
    • Templates Dataflow
    • Dataflow SQL
    • Travaux pratiques : Pipeline de flux de données simple (Python/Java). MapReduce dans un flux de données (Python/Java). Entrées latérales (Python/Java)
    • Création visuelle de pipelines de données par lots avec Cloud Data Fusion
    • Orchestration du travail entre les services GCP avec Cloud Composer – Apache Airflow Environnement – DAG et opérateurs
    • Démonstration : Chargement de données déclenché par un événement avec Cloud Composer, Cloud Functions, Cloud Storage
    • Surveillance et journalisation
    • Travaux pratiques : Construire et exécuter un graphe de pipeline dans Cloud Data Fusion (composants, présentation de l’interface utilisateur, construire un pipeline, exploration de données en utilisant Wrangler). Utilisation de Cloud Composer
    • Traitement des données en streaming
    • Présentation de Cloud Pub/Sub
    • Travaux pratiques : Publier des données en continu dans Pub/Sub
    • Fonctionnalités streaming de Cloud Dataflow
    • Travaux pratiques : Pipelines de données en continu
    • Fonctionnalités streaming BigQuery
    • Cloud Bigtable
    • Travaux pratiques : Analyse en continu et tableaux de bord. Pipelines de données en continu vers Bigtable
    • Fonctionnalités Analytic Window
    • Utilisation des clauses With
    • Fonctions SIG
    • Démonstration : Cartographie des codes postaux à la croissance la plus rapide avec BigQuery GeoViz
    • Considérations de performance
    • Travaux pratiques : Optimiser vos requêtes BigQuery pour la performance. Créer des tables partitionnées par date dans BigQuery (optionnel)
    • Qu’est-ce que l’intelligence artificielle (IA) ?
    • De l’analyse de données ad hoc aux décisions basées sur les données
    • Options pour modèles de machine learning (ML) sur Google Cloud Platform
    • Les données non structurées sont difficiles à utiliser
    • API ML pour enrichir les données
    • Travaux pratiques : Utiliser l’interface de programmation des applications (API) en langage naturel pour classer le texte non structuré
    • Qu’est-ce qu’un notebook ?
    • BigQuery Magic et liens avec Pandas
    • Travaux pratiques : BigQuery dans Jupyter Labs sur IA Platform
    • Façons de faire du machine learning (ML) sur Google Cloud Platform
    • Kubeflow AI Hub
    • Artificial Intelligence (AI) Hub
    • Travaux pratiques : Utiliser des modèles d’IA sur Kubeflow
    • BigQuery ML pour la construction de modèles rapides
    • Démonstration : Entraîner un modèle avec BigQuery ML pour prédire les tarifs de taxis à New York
    • Modèles pris en charge
    • Pourquoi AutoML ?
    • Auto ML Vision
    • Auto ML Natural Language Processing (NLP)
    • Auto ML Tables

Version 4. Mise à jour le 01/01/2025
© EXPERTISME – Groupe SELECT® 2025 Tous droits réservés. Les textes présents sur cette page sont soumis aux droits d’auteur.

Pré-requis

Avoir suivi une formation Google Cloud big data et machine learning ou posséder des connaissances équivalentes. Une bonne compréhension de l’infrastructure de Google Cloud, des services de données et des services d’apprentissage automatique.
Avoir des compétences en langage de requête. Vous devez être à l’aise avec les concepts comme les bases de données SQL, les requêtes de données, et la manipulation de données structurées.
Avoir des compétences en modélisation de données. Vous devez comprendre comment structurer, organiser et stocker des données pour une utilisation optimale.
Avoir des compétences en Python. Vous devez être capable de lire, d’écrire et de comprendre des scripts Python, qui est un langage de programmation largement utilisé en data science et en ingénierie de données.
Avoir des compétences en statistiques. Vous devez être à l’aise avec les principes de base des statistiques, tels que la moyenne, la médiane, l’écart-type, la distribution normale, etc.
Être muni d’un ordinateur relié à Internet, possédant une caméra, un micro et un haut-parleur.

Points forts de la formation

  • Votre plan pédagogique de formation sur-mesure avec l’évaluation initiale de votre niveau de connaissance du sujet abordé
  • Des cas pratiques inspirés de votre activité professionnelle, traités lors de la formation
  • Un suivi individuel pendant la formation permettant de progresser plus rapidement
  • Un support de formation de qualité créé sur-mesure en fonction de vos attentes et des objectifs fixés, permettant un transfert de compétences qui vous rende très rapidement opérationnel
  • Les dates et lieux de cette formation sont à définir selon vos disponibilités
  • Animation de la formation par un Formateur Expert Métier
  • La possibilité, pendant 12 mois, de solliciter votre Formateur Expert sur des problématiques professionnelles liées au thème de votre formation
  • Un suivi de 12 mois de la consolidation et de l’évolution de vos acquis.

Approche pédagogique

L’approche pédagogique a été construite sur l’interactivité et la personnalisation : Présentation illustrée et animée par le Formateur Expert, partage d’expériences, études de cas, mise en situation réelle.
Tous les supports sont fournis par support papier, mail ou clé USB à chaque stagiaire.

Méthodologie pédagogique employée :
Chaque formation en présentiel ou en distanciel est animée par un Formateur Expert Métier sélectionné selon ses compétences et expériences professionnelles. Apport d’expertise du Formateur, quiz en début et fin de formation, cas pratiques, échanges d’expérience. Accès en ligne au support de formation.

Méthodes utilisées et évaluation :
Evaluation et positionnement lors de la définition du projet pédagogique avec le(s) stagiaire(s). Un QCM est donné aux stagiaires le dernier jour de la formation pour valider leurs apprentissages. Une correction collective est effectuée par le Formateur. Une évaluation de fin de stage en direct est organisée entre le Formateur et le(s) stagiaire(s) pour recueillir et prendre en compte leurs appréciations. Une attestation de fin de stage est remise aux stagiaires.

Accessibilité

Toute demande spécifique à l’accessibilité de la formation par des personnes handicapées donnera lieu à une attention particulière et le cas échéant une adaptation des moyens de la formation.
Public en situation de handicap, contactez notre référent handicap au 01 42 66 36 42.

Formateur

Nos Formateurs sont des Experts Métiers intervenants sur les prestations inhérentes sur la thématique de la formation. Ils réalisent les audits et co-construisent l’offre et le déroulé de la formation avec l’Ingénieur Pédagogique avant validation par le Responsable Pédagogique. Ils sont sélectionnés pour leurs compétences pédagogiques et leurs expériences dans la formation pour adultes.

Référence : IT-95227

Durée : 28 heures soit 4 jours

Tarif : 3950€ HT / Personne

Cette formation vous intéresse ?

Nos Experts conçoivent votre formation
individuelle sur mesure lors de la définition
de votre projet pédagogique !

Remplissez le formulaire suivant :

L’un de nos conseillers vous contactera
dans les meilleurs délais.

Partagez cette formation :

Référence : IT-95227

Durée : 28 heures soit 4 jours

Tarif : Sur Devis

Formez vos équipes !

à partir de 4 collaborateurs
Nos Experts conçoivent votre formation intra-entreprise sur mesure lors de la définition de votre plan pédagogique !

Partagez cette formation :

Témoignages
de nos apprenants

Votre parcours de formation

Étape par Étape

Formations complémentaires - Formations Google Cloud Plateform / IT - Informatique sur-mesure

Vous avez besoin
d’une formation ?

Vous avez
besoin
d’une
formation ?