menu
arrow_back

Data Catalog: Qwik Start

—/100

Checkpoints

arrow_forward

Create a dataset

Copy a public New York taxi table to your dataset

Create a tag template and attach the tag to your table

Data Catalog: Qwik Start

30分 クレジット: 1

GSP729

Google Cloud セルフペース ラボ

概要

Data Catalog はフルマネージドのスケーラブルなメタデータ管理サービスです。このサービスを利用すれば、すべてのデータを迅速に検出、把握、管理できます。

データ検出のためのシンプルで使いやすい検索インターフェースと、テクニカル メタデータとビジネス メタデータの両方をキャプチャする柔軟で強力なカタログ化システムを備えており、Cloud Data Loss Prevention(DLP)および Cloud Identity and Access Management(IAM)との統合によってセキュリティとコンプライアンスの強固な基盤を確保できます。

Google BigQuery は、Google のインフラストラクチャの処理能力を利用して高速な SQL クエリを実現するエンタープライズ データ ウェアハウスです。

データを BigQuery に読み込んだら、後の処理は Google 側が行います。他のユーザーにデータの表示やクエリを許可するなど、ビジネスニーズに基づいてプロジェクトとデータへのアクセスを制御できます。

Data Catalog の使用

Data Catalog では、主に 2 つの操作を行います。

  • アクセス可能なデータアセットを検索する。

  • メタデータでアセットにタグ付けする。

Data Catalog のユースケース

自分が自社のデータ エンジニアであると想像してみてください。データ サイエンティストやビジネス アナリストなど、同僚があらゆるデータセットを簡単に探索して使用できるようにすることが仕事です。新しいデータセットを入手したら、重要な情報でアノテーションを付けます。例えば、PII データが含まれているかどうかや、データセットの所有者は誰か、データセットに含まれている行の数はいくつか、といった情報が含まれます。

こういった情報をアノテーションとして付けるには、対象のデータセットとテーブルにタグを追加します。Data Catalog を使用すると、タグ テンプレートを作成して、タグ付けしたい属性の種類を定義できます。これにより、データセットとテーブルに簡単にアクセスしてマッピングし、関連情報を見つけ出すことができます。

ラボの内容

このラボでは、次の方法について学びます。

  • Data Catalog API を有効にして、このサービスを Google Cloud プロジェクトで使用できるようにする。

  • BigQuery でデータセットを作成する。

  • New York Taxi 一般公開テーブルをデータセットにコピーする。

  • Data Catalog タグ テンプレートを作成する。

  • 新しく作成したテーブルに、新しく作成したタグを付ける。

Qwiklabs に参加してこのラボの残りの部分や他のラボを確認しましょう。

  • Google Cloud Console への一時的なアクセス権を取得します。
  • 初心者レベルから上級者レベルまで 200 を超えるラボが用意されています。
  • ご自分のペースで学習できるように詳細に分割されています。
参加してこのラボを開始