menu
arrow_back

Ejecute una canalización de procesamiento de texto de macrodatos en Cloud Dataflow

Ejecute una canalización de procesamiento de texto de macrodatos en Cloud Dataflow

Minutos 7 Créditos

GSP047

Labs de autoaprendizaje de Google Cloud

Descripción general

Dataflow es un modelo de programación unificado y un servicio administrado para el desarrollo y la ejecución de una amplia variedad de patrones de procesamiento de datos, como ETL, cálculos por lote y cálculos continuos. Como Dataflow es un servicio administrado, puede designar recursos a pedido para minimizar la latencia y mantener una alta eficiencia de uso.

El modelo de Dataflow combina el procesamiento de transmisión y por lotes, de modo que los desarrolladores no tengan que hacer concesiones en términos de corrección, costo o tiempo de procesamiento. En este lab, aprenderá cómo ejecutar una canalización de Dataflow que cuenta la cantidad de veces que aparecen palabras únicas en un archivo de texto.

Que aprenderá

  • Cómo crear un proyecto de Maven con el SDK de Cloud Dataflow

  • Cómo ejecutar una canalización de ejemplo con Google Cloud Platform Console

  • Cómo borrar el depósito de Cloud Storage asociado y sus contenidos

Join Qwiklabs to read the rest of this lab...and more!

  • Get temporary access to the Google Cloud Console.
  • Over 200 labs from beginner to advanced levels.
  • Bite-sized so you can learn at your own pace.
Join to Start This Lab
Puntuación

—/10

Create a new Cloud Storage bucket

Ejecutar paso

/ 5

Run a text processing pipeline on Cloud Dataflow

Ejecutar paso

/ 5