—/100
Checkpoints
Create a new Cloud Storage bucket
/ 50
Run a text processing pipeline on Cloud Dataflow
/ 50
Ejecute una canalización de procesamiento de texto de macrodatos en Cloud Dataflow
GSP047
Descripción general
Dataflow es un modelo de programación unificado y un servicio administrado para el desarrollo y la ejecución de una amplia variedad de patrones de procesamiento de datos, como ETL, cálculos por lote y cálculos continuos. Como Dataflow es un servicio administrado, puede designar recursos a pedido para minimizar la latencia y mantener una alta eficiencia de uso.
El modelo de Dataflow combina el procesamiento de transmisión y por lotes, de modo que los desarrolladores no tengan que hacer concesiones en términos de corrección, costo o tiempo de procesamiento. En este lab, aprenderá cómo ejecutar una canalización de Dataflow que cuenta la cantidad de veces que aparecen palabras únicas en un archivo de texto.
Que aprenderá
-
Cómo crear un proyecto de Maven con el SDK de Cloud Dataflow
-
Cómo ejecutar una canalización de ejemplo con Google Cloud Platform Console
-
Cómo borrar el depósito de Cloud Storage asociado y sus contenidos
Únase a Qwiklabs para leer este lab completo… y mucho más.
- Obtenga acceso temporal a Google Cloud Console.
- Más de 200 labs para principiantes y niveles avanzados.
- El contenido se presenta de a poco para que pueda aprender a su propio ritmo.