menu
arrow_back

Data Catalog : Qwik Start

—/100

Checkpoints

arrow_forward

Create a dataset

Copy a public New York taxi table to your dataset

Create a tag template and attach the tag to your table

Data Catalog : Qwik Start

30 minutes 1 crédit

GSP729

Google Cloud – Ateliers adaptés au rythme de chacun

Présentation

Data Catalog est un service de gestion des métadonnées entièrement géré et évolutif qui permet aux organisations d'identifier, d'interpréter et de gérer rapidement toutes leurs données.

Il offre une interface de recherche simple et intuitive pour la découverte de données, un système de catalogage flexible et performant pour la capture de métadonnées techniques et métier, ainsi qu'une base solide en termes de sécurité et de conformité avec les intégrations à Cloud Data Loss Prevention (DLP) et Cloud Identity and Access Management (IAM).

Google BigQuery est un entrepôt de données d'entreprise qui permet d'effectuer des requêtes SQL ultra-rapides grâce à la puissance de traitement de l'infrastructure de Google.

Il vous suffit de transférer vos données dans BigQuery. Nous nous chargeons du reste. Vous pouvez contrôler l'accès au projet et à vos données en fonction des besoins de votre entreprise, par exemple en autorisant d'autres personnes à afficher vos données ou à les interroger.

Utiliser Data Catalog

Vous pouvez interagir avec Data Catalog de deux manières :

  • En recherchant des éléments de données auxquels vous avez accès

  • En ajoutant des tags de métadonnées à des éléments

Cas d'utilisation de Data Catalog

Supposons que vous occupez le poste d'ingénieur de données au sein de votre entreprise. Votre responsabilité est de veiller à ce que vos collègues (data scientists ou analystes de veille stratégique, par exemple) puissent facilement trouver et utiliser tous les ensembles de données. Lorsqu'un nouvel ensemble de données est disponible, vous y signalez les informations importantes, par exemple s'il contient ou non des informations personnelles, qui en est le propriétaire, combien de lignes il comporte, etc.

Pour ce faire, vous ajoutez des tags à l'ensemble de données et aux tables. Data Catalog vous permet de créer des modèles de tag et de définir les types d'attributs auxquels associer ces tags. Ces modèles facilitent la consultation, le mappage et la recherche d'informations pertinentes dans vos ensembles de données et vos tables.

Objectifs de l'atelier

Dans cet atelier, vous allez apprendre à effectuer les tâches suivantes :

  • Activer l'API Data Catalog de manière à pouvoir utiliser ce service dans votre projet Google Cloud

  • Créer un ensemble de données avec BigQuery

  • Copier une table publique des taxis new-yorkais dans votre ensemble de données

  • Créer un modèle de tag Data Catalog

  • Ajouter les tags que vous venez de créer à votre nouvelle table

Inscrivez-vous sur Qwiklabs pour consulter le reste de cet atelier, et bien plus encore.

  • Obtenez un accès temporaire à Google Cloud Console.
  • Plus de 200 ateliers, du niveau débutant jusqu'au niveau expert.
  • Fractionné pour vous permettre d'apprendre à votre rythme.
Inscrivez-vous pour démarrer cet atelier