Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.
Añadir pasos a un clúster de Amazon EMR con AWS CLI
En los siguientes procedimientos se muestra cómo agregar pasos a un clúster recién creado y a un clúster en ejecución con la AWS CLI. En ambos ejemplos, el subcomando --steps se utiliza para agregar pasos al clúster.
Para añadir pasos durante la creación del clúster
-
Escriba el siguiente comando para crear un clúster y añadir un paso de Apache Pig. Asegúrate de
sustituirlo por el nombre de tu EC2 key pair de Amazon.myKeyaws emr create-cluster --name "Test cluster" \ --applications Name=Spark\ --use-default-roles \ --ec2-attributes KeyName=myKey\ --instance-groups InstanceGroupType=PRIMARY,InstanceCount=1,InstanceType=m5.xlargeInstanceGroupType=CORE,InstanceCount=2,InstanceType=m5.xlarge\ --steps '[{"Args":["spark-submit","--deploy-mode","cluster","--class","org.apache.spark.examples.SparkPi","/usr/lib/spark/examples/jars/spark-examples.jar","5"],"Type":"CUSTOM_JAR","ActionOnFailure":"CONTINUE","Jar":"command-runner.jar","Properties":"","Name":"Spark application"}]'nota
La lista de argumentos cambia en función del tipo de paso.
De forma predeterminada, el nivel de simultaneidad de pasos es
1. Puede establecer el nivel de simultaneidad de pasos con el parámetroStepConcurrencyLevelal crear un clúster.La salida de un identificador de clúster es similar a la siguiente.
{ "ClusterId": "j-2AXXXXXXGAPLF" }
Para añadir un paso a un clúster en ejecución
-
Escriba el siguiente comando para añadir un paso a un clúster en ejecución. Sustituya
por el ID de su propio clúster.j-2AXXXXXXGAPLFaws emr add-steps --cluster-idj-2AXXXXXXGAPLF\ --steps '[{"Args":["spark-submit","--deploy-mode","cluster","--class","org.apache.spark.examples.SparkPi","/usr/lib/spark/examples/jars/spark-examples.jar","5"],"Type":"CUSTOM_JAR","ActionOnFailure":"CONTINUE","Jar":"command-runner.jar","Properties":"","Name":"Spark application"}]'La salida es un identificador de paso similar al siguiente.
{ "StepIds": [ "s-Y9XXXXXXAPMD" ] }
Para modificarlo StepConcurrencyLevel en un clúster en ejecución
-
En un clúster en ejecución, puede modificar
StepConcurrencyLevelcon la API deModifyCluster. Por ejemplo, escriba el siguiente comando para aumentarStepConcurrencyLevela10. Sustituyapor el ID de su clúster.j-2AXXXXXXGAPLFaws emr modify-cluster --cluster-idj-2AXXXXXXGAPLF--step-concurrency-level 10 -
El resultado es similar al siguiente.
{ "StepConcurrencyLevel": 10 }
Para obtener más información sobre el uso de los comandos de Amazon EMR en AWS CLI, consulte la Referencia de AWS CLI comandos.