menu
arrow_back

データ結合における問題のトラブルシューティングと解決

データ結合における問題のトラブルシューティングと解決

1時間 クレジット: 5

GSP412

Google Cloud セルフペース ラボ

概要

BigQuery は、Google が低料金で提供する NoOps のフルマネージド分析データベースです。Google による一貫管理が行われ、インフラストラクチャの管理やデータベース管理者の設置など、お客様による管理運用の必要がないため、有用な情報取得のためのデータ分析に専念できます。BigQuery は SQL を使用しており、従量課金制モデルでも利用できます。

データテーブルを結合すると、データセットに関する有用な情報を取得できます。ただし、データを結合する際のよくある問題によって、不適切な結果が取得される場合があります。このラボでは、このような問題を回避する方法について詳しく学習します。 結合のタイプ:

  • クロス結合: 1 つ目のデータセットの各行と 2 つ目のデータセットの各行が結合され、すべての組み合わせが出力されます。
  • 内部結合: 結果テーブルにレコードを表示するには、両方のテーブルにキー値が存在する必要があります。両方のテーブルでキー値が一致している場合のみ、結合されてレコードが表示されます。
  • 左結合: 左側のテーブルの各行が結果に表示されます。一致するレコードが右側のテーブルにあるかどうかは問いません。
  • 右結合: 左結合の逆です。右側のテーブルの各行が結果に表示されます。一致するレコードが左側のテーブルにあるかどうかは問いません。

結合について詳しくは、結合ページをご覧ください。

ここでは、e コマースのデータセットを使用します。このデータセットには、Google Merchandise Store に関する数百万件の Google アナリティクスのレコードが含まれており、BigQuery に読み込まれています。このラボではこのデータセットのコピーを使用して、使用可能なフィールドや行からどのような分析情報が得られるのかを確認します。

クエリを理解、更新するために役立つ構文の情報については、標準 SQL クエリ構文をご覧ください。

演習内容

このラボでは、以下のタスクを実行します。

  • BigQuery を使用してデータセットを確認する

  • データセット内の重複する行のトラブルシューティングを行う

  • データテーブルを結合する

  • 結合の各タイプについて理解する

Qwiklabs に参加してこのラボの残りの部分や他のラボを確認しましょう。

  • Google Cloud Console への一時的なアクセス権を取得します。
  • 初心者レベルから上級者レベルまで 200 を超えるラボが用意されています。
  • ご自分のペースで学習できるように詳細に分割されています。
参加してこのラボを開始
スコア

—/100

Create a new dataset

ステップを実行

/ 25

Identify a key field in your ecommerce dataset

ステップを実行

/ 25

Pitfall: non-unique key

ステップを実行

/ 25

Join pitfall solution

ステップを実行

/ 25