menu
arrow_back

Data Catalog を使用して、複数プロジェクトでデータセット メタデータを探索する

Data Catalog を使用して、複数プロジェクトでデータセット メタデータを探索する

1時間 30分 クレジット: 1

GSP789

Google Cloud セルフペース ラボ

概要

Data Catalog は、Google Cloud のデータ分析プロダクト ファミリーに含まれる、フルマネージドのスケーラブルなメタデータ管理サービスです。

適切なツールがないと、データアセットの管理に時間と費用がかかる可能性があります。Data Catalog は、組織がデータアセットを検索、整理、説明できる、一元化された場所を提供します。

Data Catalog を使用する

Data Catalog では、主に 2 つの操作を行います。

  • アクセス可能なデータアセットを検索する

  • メタデータでアセットにタグ付けする

ラボの内容

このラボでは、次の方法について学びます。

  • 2 つのプロジェクト、2 つのデータセット、2 つのユーザー アカウントを備えた、企業のシミュレーション環境でデータを探索する

  • UI で BigQuery テーブルを手動で移動する

  • 後ほどタグ付けする予定の機密データの列を把握するためにクエリを実行する

  • Data Catalog を使って、既存のデータセットを複数プロジェクトにわたり検索する

  • Data Catalog のタグ テンプレートを使って、リッチ メタデータでアセットにタグ付けする

メリット

  • 組織内の複数プロジェクトにわたってデータアセットを表示する

  • 再利用可能なタグ テンプレートを作成し、チームのためにリッチデータの説明を追加する

  • PII(個人を特定できる情報)が含まれるデータセットを素早くハイライト表示する

  • メタデータのアクセス制御は、ログインしたユーザーに基づいて継承される(別の Data Catalog ACL は不要)

Qwiklabs に参加してこのラボの残りの部分や他のラボを確認しましょう。

  • Cloud Console への一時的なアクセス権を取得します。
  • 初心者レベルから上級者レベルまで 200 を超えるラボが用意されています。
  • ご自分のペースで学習できるように詳細に分割されています。
参加してこのラボを開始