menu
arrow_back

Résolution des problèmes et évitement des pièges liés à la jointure des données

Résolution des problèmes et évitement des pièges liés à la jointure des données

Hours 5 Credits

GSP412

Google Cloud – Ateliers adaptés au rythme de chacun

Aperçu

BigQuery est la base de données d'analyse à faible coût de Google, entièrement gérée et qui ne nécessite aucune opération (NoOps). Avec BigQuery, vous pouvez interroger plusieurs téraoctets de données sans avoir à gérer d'infrastructure ni faire appel à un administrateur de base de données. Basé sur le langage SQL et le modèle de facturation à l'utilisation, BigQuery vous permet de vous concentrer sur l'analyse des données pour en dégager des informations pertinentes.

La jointure des tables de données peut vous fournir des renseignements très utiles sur votre ensemble de données. Toutefois, lorsque vous joignez des données, il se peut que vous vous heurtiez à des pièges courants qui peuvent altérer vos résultats. Cet atelier a pour objectif de vous apprendre à éviter ces pièges. Voici tout d'abord les types de jointures :

  • Jointure croisée : elle combine chaque ligne du premier ensemble de données avec chaque ligne du deuxième ensemble de données, où toutes les combinaisons sont représentées dans les résultats.
  • Jointure interne : elle nécessite la présence de valeurs de clé dans les deux tables pour que les enregistrements apparaissent dans la table de résultats. Les enregistrements n'apparaissent dans la fusion que s'il existe des correspondances dans les deux tables pour les valeurs de clé.
  • Jointure gauche : chaque ligne de la table de gauche apparaît dans les résultats, que la table de droite contienne ou non des correspondances.
  • Jointure droite : l'inverse d'une jointure gauche. Chaque ligne de la table de droite apparaît dans les résultats, que la table de gauche contienne ou non des correspondances.

Pour en savoir plus sur les jointures, reportez-vous à la page Jointure.

Vous utiliserez un ensemble de données d'e-commerce comprenant des millions d'enregistrements Google Analytics relatifs au Google Merchandise Store, chargé dans BigQuery. Pour cet atelier, vous disposez d'une copie de cet ensemble de données. Vous allez explorer les champs et les lignes qu'il contient afin d'obtenir des renseignements.

Pour en savoir plus sur la syntaxe permettant de suivre et de mettre à jour vos requêtes, consultez la section Syntaxe de requête SQL standard.

Objectifs de l'atelier

Dans cet atelier, vous allez :

  • utiliser BigQuery pour explorer un ensemble jeu de données ;

  • résoudre les problèmes de lignes en double dans un ensemble de données ;

  • créer des jointures entre les tables de données ;

  • comprendre chaque type de jointure.

Join Qwiklabs to read the rest of this lab...and more!

  • Get temporary access to the Google Cloud Console.
  • Over 200 labs from beginner to advanced levels.
  • Bite-sized so you can learn at your own pace.
Join to Start This Lab