menu
arrow_back

ETL-Verarbeitung in der GCP mit Dataflow und BigQuery

ETL-Verarbeitung in der GCP mit Dataflow und BigQuery

1 Hour 9 Credits

GSP290

Google Cloud-Labs zum selbstbestimmten Lernen

Übersicht

In diesem Lab erstellen Sie mehrere Datenpipelines, die Daten aus einem öffentlich verfügbaren Dataset in BigQuery aufnehmen. Dabei kommen folgende GCP-Komponenten zum Einsatz:

  • GCS – Google Cloud Storage
  • Dataflow – Google Dataflow
  • BigQuery – BigQuery-Tabellen

Sie erstellen Ihre eigene Datenpipeline und berücksichtigen dabei unter anderem die Designkriterien sowie die Details der Implementierung, damit Ihr Prototyp die Anforderungen erfüllt. Öffnen Sie unbedingt die Python-Dateien und lesen Sie die Kommentare, wenn Sie dazu aufgefordert werden.

Join Qwiklabs to read the rest of this lab...and more!

  • Get temporary access to the Google Cloud Console.
  • Over 200 labs from beginner to advanced levels.
  • Bite-sized so you can learn at your own pace.
Join to Start This Lab
Score

—/100

Create a Cloud Storage Bucket

Schritt durchführen

/ 20

Copy Files to Your Bucket

Schritt durchführen

/ 10

Create the BigQuery Dataset (name: lake)

Schritt durchführen

/ 20

Build a Data Ingestion Dataflow Pipeline

Schritt durchführen

/ 10

Build a Data Transformation Dataflow Pipeline

Schritt durchführen

/ 10

Build a Data Enrichment Dataflow Pipeline

Schritt durchführen

/ 10

Build a Data lake to Mart Dataflow Pipeline

Schritt durchführen

/ 10

Build a Data lake to Mart CoGroupByKey Dataflow Pipeline

Schritt durchführen

/ 10

home
Startseite
school
Katalog
menu
Mehr
Mehr