—/100
Checkpoints
Create a new dataset
Identify a key field in your ecommerce dataset
Pitfall: non-unique key
Join pitfall solution
Desafios e solução de problemas da mesclagem de dados
GSP412
Visão geral
O BigQuery é um banco de dados de análise NoOps, totalmente gerenciado e de baixo custo desenvolvido pelo Google. Com ele, você pode consultar muitos terabytes de dados sem ter que gerenciar uma infraestrutura nem precisar de um administrador de banco de dados. O BigQuery usa SQL e está disponível no modelo de pagamento por utilização. Com ele você pode focar na análise dos dados para encontrar informações relevantes.
A mesclagem de tabelas de dados gera insights significativos sobre o conjunto de dados. No entanto, alguns problemas comuns podem corromper os resultados quando você faz a mesclagem de dados. Este laboratório explica como evitá-las. Tipos de mesclagem:
- Correlação: combina cada uma das linhas do primeiro conjunto de dados com uma linha do segundo, e todas as combinações são representadas na resposta.
- Mesclagem interna: exige que as chaves-valor estejam em ambas as tabelas para que os registros sejam incluídos nos resultados. Esses registros só aparecerão na mesclagem se houver correspondências das chaves-valor em ambas as tabelas.
- Mesclagem à esquerda: todas as linhas da tabela à esquerda aparecem nos resultados, mesmo sem correspondências à direita.
- Mesclagem à direita: é o contrário de uma mesclagem à esquerda. Todas as linhas da tabela à direita são incluídas nos resultados, mesmo que não haja correspondências à esquerda.
Para mais informações sobre mesclagens, consulte a Página do Join.
Você usará um conjunto de dados de comércio eletrônico com milhões de registros do Google Analytics para o Google Merchandise Store carregados no BigQuery. Neste laboratório, você terá uma cópia desse conjunto de dados e poderá explorar os campos e linhas disponíveis para buscar insights.
Se você quiser informações sobre sintaxe para acompanhar e atualizar as consultas, consulte Sintaxe de consulta SQL padrão.
Pré-requisitos
Neste laboratório, você poderá:
-
Usar o BigQuery para explorar um conjunto de dados
-
Resolver problemas de linhas duplicadas em um conjunto de dados
-
Criar mesclagens de tabelas de dados
-
Entender cada tipo de mesclagem
Participe do Qwiklabs para ler o restante deste laboratório e muito mais!
- Receber acesso temporário a Console do Google Cloud.
- Mais de 200 laboratórios, do nível iniciante ao avançado.
- Tamanho compacto para que você possa aprender no seu próprio ritmo.