AWS Data Pipeline ya no está disponible para nuevos clientes. Los clientes actuales de AWS Data Pipeline pueden seguir utilizando el servicio con normalidad. Más información
Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.
Operación de Task Runner
Task Runner es una aplicación de agente de tareas que sondea las AWS Data Pipeline tareas programadas y las ejecuta en instancias de Amazon EC2, clústeres de Amazon EMR u otros recursos computacionales, informando del estado a medida que lo hace. En función de la aplicación, puede elegir:
-
Permite AWS Data Pipeline instalar y administrar una o más aplicaciones de Task Runner por usted. Cuando se activa una canalización, se crea automáticamente el
EmrClusterobjeto predeterminadoEc2Instanceo al que hace referencia el campo RunSon de una actividad. AWS Data Pipeline se encarga de instalar Task Runner en una instancia EC2 o en el nodo principal de un clúster EMR. De acuerdo con este patrón, AWS Data Pipeline puede realizar la mayor parte de la administración de instancias o clústeres por usted. -
Ejecutar la totalidad o partes de una canalización en recursos que usted administra. Los recursos potenciales incluyen una instancia Amazon EC2 de ejecución prolongada, un clúster de Amazon EMR o un servidor físico. Puedes instalar un ejecutor de tareas (que puede ser un ejecutor de tareas o un agente de tareas personalizado creado por ti mismo) prácticamente en cualquier lugar, siempre que pueda comunicarse con el servicio AWS Data Pipeline web. En este caso, usted asume un control casi completo sobre los recursos que se utilizan y cómo se administran, y debe instalar y configurar manualmente Task Runner. Para ello, utilice los procedimientos de esta sección, tal y como se describe en Ejecución de trabajo en recursos existentes mediante Task Runner.