menu
arrow_back

Ejecute una canalización de procesamiento de texto de macrodatos en Cloud Dataflow

—/100

Checkpoints

arrow_forward

Create a new Cloud Storage bucket

Run a text processing pipeline on Cloud Dataflow

Ejecute una canalización de procesamiento de texto de macrodatos en Cloud Dataflow

40 minutos 7 créditos

GSP047

Labs de autoaprendizaje de Google Cloud

Descripción general

Dataflow es un modelo de programación unificado y un servicio administrado para el desarrollo y la ejecución de una amplia variedad de patrones de procesamiento de datos, como ETL, cálculos por lote y cálculos continuos. Como Dataflow es un servicio administrado, puede designar recursos a pedido para minimizar la latencia y mantener una alta eficiencia de uso.

El modelo de Dataflow combina el procesamiento de transmisión y por lotes, de modo que los desarrolladores no tengan que hacer concesiones en términos de corrección, costo o tiempo de procesamiento. En este lab, aprenderá cómo ejecutar una canalización de Dataflow que cuenta la cantidad de veces que aparecen palabras únicas en un archivo de texto.

Que aprenderá

  • Cómo crear un proyecto de Maven con el SDK de Cloud Dataflow

  • Cómo ejecutar una canalización de ejemplo con Google Cloud Platform Console

  • Cómo borrar el depósito de Cloud Storage asociado y sus contenidos

Únase a Qwiklabs para leer este lab completo… y mucho más.

  • Obtenga acceso temporal a Google Cloud Console.
  • Más de 200 labs para principiantes y niveles avanzados.
  • El contenido se presenta de a poco para que pueda aprender a su propio ritmo.
Únase para comenzar este lab