menu
arrow_back

Solución de problemas y resolución de dificultades en la unión de datos

Solución de problemas y resolución de dificultades en la unión de datos

1 hora 5 créditos

GSP412

Labs de autoaprendizaje de Google Cloud

Descripción general

BigQuery es la base de datos de estadísticas de Google de bajo costo, sin operaciones (NoOps) y totalmente administrada. Con BigQuery, puede consultar muchos terabytes de datos sin tener que administrar infraestructuras y sin necesitar un administrador de base de datos. BigQuery usa SQL y puede aprovechar el modelo de prepago. BigQuery le permite enfocarse en el análisis de datos para buscar estadísticas valiosas.

Unir tablas de datos puede proporcionar estadísticas valiosas sobre su conjunto de datos. Sin embargo, al unir sus datos, existen errores comunes que podrían dañar sus resultados. Este lab se enfoca en cómo evitar estos errores. Tipos de uniones:

  • Unión cruzada: Combina cada fila del primer conjunto de datos con cada fila del segundo y cada combinación se representa en el resultado.
  • Unión interna: Requiere que los valores clave estén en ambas tablas para que los registros aparezcan en la tabla de resultados. Los registros solo aparecerán en la combinación si los valores clave coinciden en ambas tablas.
  • Unión izquierda: Cada fila de la tabla de la izquierda aparece en los resultados, sin importar si hay coincidencias en la tabla de la derecha.
  • Unión derecha: Es lo contrario a una unión izquierda. Cada fila de la tabla de la derecha aparece en los resultados, sin importar si hay coincidencias en la tabla de la izquierda.

Para obtener más información sobre uniones, consulte el artículo Página de uniones.

El conjunto de datos que utilizará es un conjunto de datos de comercio electrónico que tiene millones de registros de Google Analytics para la Tienda de productos de Google cargados en BigQuery. Con una copia de ese conjunto de datos creada para este lab, explorará los campos y las filas disponibles a fin de obtener estadísticas.

Para obtener información sobre la sintaxis, que lo ayudará a seguir y actualizar las consultas, consulte el artículo Sintaxis de consultas de SQL estándar.

Actividades

En este lab, realizará las siguientes tareas:

  • Utilizará BigQuery para explorar un conjunto de datos.

  • Solucionará problemas de filas duplicadas en un conjunto de datos.

  • Creará uniones entre tablas de datos.

  • Comprenderá cada tipo de unión.

Únase a Qwiklabs para leer este lab completo… y mucho más.

  • Obtenga acceso temporal a Google Cloud Console.
  • Más de 200 labs para principiantes y niveles avanzados.
  • El contenido se presenta de a poco para que pueda aprender a su propio ritmo.
Únase para comenzar este lab
Puntuación

—/100

Create a new dataset

Ejecutar paso

/ 25

Identify a key field in your ecommerce dataset

Ejecutar paso

/ 25

Pitfall: non-unique key

Ejecutar paso

/ 25

Join pitfall solution

Ejecutar paso

/ 25