Inicio de trabajos de AWS Glue DataBrew con Step Functions - AWS Step Functions

Inicio de trabajos de AWS Glue DataBrew con Step Functions

Aprenda a usar la integración de DataBrew para añadir pasos de limpieza y normalización de datos a sus flujos de trabajo de análisis y machine learning con Step Functions.

Para obtener más información sobre la integración con los servicios de AWS en Step Functions, consulte Integración de los servicios de y Cómo pasar parámetros a una API de servicio en Step Functions.

El ejemplo siguiente incluye un estado Task que inicia un trabajo de DataBrew de solicitud-respuesta.

"DataBrew StartJobRun": { "Type": "Task", "Resource": "arn:aws:states:::databrew:startJobRun", "Arguments": { "Name": "sample-proj-job-1" }, "Next": "NEXT_STATE" },

El ejemplo siguiente incluye un estado Task que comienza un trabajo de DataBrew de sincronización.

"DataBrew StartJobRun": { "Type": "Task", "Resource": "arn:aws:states:::databrew:startJobRun.sync", "Arguments": { "Name": "sample-proj-job-1" }, "Next": "NEXT_STATE" },
Los parámetros en Step Functions se expresan en PascalCase

Incluso si la API del servicio nativo está en CamelCase, por ejemplo, la acción startSyncExecution de la API, se especifican parámetros en PascalCase, como: StateMachineArn.

API de DataBrew compatibles:

Políticas de IAM para llamar a DataBrew

En estas plantillas de ejemplo, se muestra cómo AWS Step Functions genera políticas de IAM basadas en los recursos de la definición de la máquina de estado. Para obtener más información, consulte Generación de políticas de IAM para servicios integrados por Steps Functions y Descubrimiento de los patrones de integración de servicios en Step Functions.

Run a Job (.sync)
{ "Version":"2012-10-17", "Statement": [ { "Effect": "Allow", "Action": [ "databrew:startJobRun", "databrew:listJobRuns", "databrew:stopJobRun" ], "Resource": [ "arn:aws:databrew:us-east-1:123456789012:job/*" ] } ] }
Request Response
{ "Version":"2012-10-17", "Statement": [ { "Effect": "Allow", "Action": [ "databrew:startJobRun" ], "Resource": [ "arn:aws:databrew:us-east-1:123456789012:job/*" ] } ] }