—/100
Checkpoints
Create a new dataset
/ 25
Identify a key field in your ecommerce dataset
/ 25
Pitfall: non-unique key
/ 25
Join pitfall solution
/ 25
データ結合における問題のトラブルシューティングと解決
GSP412
概要
BigQuery は、Google が低料金で提供する NoOps のフルマネージド分析データベースです。Google による一貫管理が行われ、インフラストラクチャの管理やデータベース管理者の設置など、お客様による管理運用の必要がないため、有用な情報取得のためのデータ分析に専念できます。BigQuery は SQL を使用しており、従量課金制モデルでも利用できます。
データテーブルを結合すると、データセットに関する有用な情報を取得できます。ただし、データを結合する際のよくある問題によって、不適切な結果が取得される場合があります。このラボでは、このような問題を回避する方法について詳しく学習します。 結合のタイプ:
- クロス結合: 1 つ目のデータセットの各行と 2 つ目のデータセットの各行が結合され、すべての組み合わせが出力されます。
- 内部結合: 結果テーブルにレコードを表示するには、両方のテーブルにキー値が存在する必要があります。両方のテーブルでキー値が一致している場合のみ、結合されてレコードが表示されます。
- 左結合: 左側のテーブルの各行が結果に表示されます。一致するレコードが右側のテーブルにあるかどうかは問いません。
- 右結合: 左結合の逆です。右側のテーブルの各行が結果に表示されます。一致するレコードが左側のテーブルにあるかどうかは問いません。
結合について詳しくは、結合ページをご覧ください。
ここでは、e コマースのデータセットを使用します。このデータセットには、Google Merchandise Store に関する数百万件の Google アナリティクスのレコードが含まれており、BigQuery に読み込まれています。このラボではこのデータセットのコピーを使用して、使用可能なフィールドや行からどのような分析情報が得られるのかを確認します。
クエリを理解、更新するために役立つ構文の情報については、標準 SQL クエリ構文をご覧ください。
演習内容
このラボでは、以下のタスクを実行します。
-
BigQuery を使用してデータセットを確認する
-
データセット内の重複する行のトラブルシューティングを行う
-
データテーブルを結合する
-
結合の各タイプについて理解する
Qwiklabs に参加してこのラボの残りの部分や他のラボを確認しましょう。
- Google Cloud Console への一時的なアクセス権を取得します。
- 初心者レベルから上級者レベルまで 200 を超えるラボが用意されています。
- ご自分のペースで学習できるように詳細に分割されています。