Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.
Ejemplos de código de inferencia en lotes
Los ejemplos de código de este capítulo muestran cómo crear un trabajo de inferencia en lotes, ver información sobre el mismo y detenerlo.
Seleccione un idioma para ver un ejemplo de código:
- Python
-
Cree un archivo JSONL denominado
abc.jsonle incluya un objeto JSON para cada registro que contenga al menos el número mínimo de registros (consulte Número mínimo de registros por trabajo de inferencia en lotes paraCuotas para Amazon Bedrock de {modelo}). En este ejemplo, utilizará el modelo Anthropic Claude 3 Haiku. En el siguiente ejemplo se muestra el primer JSON de entrada del archivo:{ "recordId": "CALL0000001", "modelInput": { "anthropic_version": "bedrock-2023-05-31", "max_tokens": 1024, "messages": [ { "role": "user", "content": [ { "type": "text", "text": "Summarize the following call transcript: ..." } ] } ] } } ... # Add records until you hit the minimumCree un bucket de S3 denominado
amzn-s3-demo-bucket-inputy cargue el archivo en él. A continuación, cree un bucket de S3 denominadoamzn-s3-demo-bucket-outputpara escribir los archivos de salida. Ejecute el siguiente fragmento de código para enviar un trabajo y obtener elJobArnde la respuesta:import boto3 bedrock = boto3.client(service_name="bedrock") inputDataConfig=({ "s3InputDataConfig": { "s3Uri": "s3://amzn-s3-demo-bucket-input/abc.jsonl" } }) outputDataConfig=({ "s3OutputDataConfig": { "s3Uri": "s3://amzn-s3-demo-bucket-output/" } }) response=bedrock.create_model_invocation_job( roleArn="arn:aws:iam::123456789012:role/MyBatchInferenceRole", modelId="anthropic.claude-3-haiku-20240307-v1:0", jobName="my-batch-job", inputDataConfig=inputDataConfig, outputDataConfig=outputDataConfig ) jobArn = response.get('jobArn')Devuelva la parte
statusdel trabajo.bedrock.get_model_invocation_job(jobIdentifier=jobArn)['status']Enumere los trabajos de inferencia por lotes que hayan
fallado.bedrock.list_model_invocation_jobs( maxResults=10, statusEquals="Failed", sortOrder="Descending" )Detenga el trabajo que inició.
bedrock.stop_model_invocation_job(jobIdentifier=jobArn)