menu
arrow_back

Desafios e solução de problemas da mesclagem de dados

Desafios e solução de problemas da mesclagem de dados

Horas 5 Créditos

GSP412

Laboratórios autoguiados do Google Cloud

Visão geral

O BigQuery é um banco de dados de análise NoOps, totalmente gerenciado e de baixo custo desenvolvido pelo Google. Com ele, você pode consultar muitos terabytes de dados sem ter que gerenciar uma infraestrutura nem precisar de um administrador de banco de dados. O BigQuery usa SQL e está disponível no modelo de pagamento por utilização. Com ele você pode focar na análise dos dados para encontrar informações relevantes.

A mesclagem de tabelas de dados gera insights significativos sobre o conjunto de dados. No entanto, alguns problemas comuns podem corromper os resultados quando você faz a mesclagem de dados. Este laboratório explica como evitá-las. Tipos de mesclagem:

  • Correlação: combina cada uma das linhas do primeiro conjunto de dados com uma linha do segundo, e todas as combinações são representadas na resposta.
  • Mesclagem interna: exige que as chaves-valor estejam em ambas as tabelas para que os registros sejam incluídos nos resultados. Esses registros só aparecerão na mesclagem se houver correspondências das chaves-valor em ambas as tabelas.
  • Mesclagem à esquerda: todas as linhas da tabela à esquerda aparecem nos resultados, mesmo sem correspondências à direita.
  • Mesclagem à direita: é o contrário de uma mesclagem à esquerda. Todas as linhas da tabela à direita são incluídas nos resultados, mesmo que não haja correspondências à esquerda.

Para mais informações sobre mesclagens, consulte a Página do Join.

Você usará um conjunto de dados de comércio eletrônico com milhões de registros do Google Analytics para o Google Merchandise Store carregados no BigQuery. Neste laboratório, você terá uma cópia desse conjunto de dados e poderá explorar os campos e linhas disponíveis para buscar insights.

Se você quiser informações sobre sintaxe para acompanhar e atualizar as consultas, consulte Sintaxe de consulta SQL padrão.

Pré-requisitos

Neste laboratório, você poderá:

  • Usar o BigQuery para explorar um conjunto de dados

  • Resolver problemas de linhas duplicadas em um conjunto de dados

  • Criar mesclagens de tabelas de dados

  • Entender cada tipo de mesclagem

Join Qwiklabs to read the rest of this lab...and more!

  • Get temporary access to the Google Cloud Console.
  • Over 200 labs from beginner to advanced levels.
  • Bite-sized so you can learn at your own pace.
Join to Start This Lab
Pontuação

—/100

Create a new dataset

Executar etapa

/ 25

Identify a key field in your ecommerce dataset

Executar etapa

/ 25

Pitfall: non-unique key

Executar etapa

/ 25

Join pitfall solution

Executar etapa

/ 25