

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

# Implantar modelos de base disponíveis ao público com a função `JumpStartModel`
<a name="jumpstart-foundation-models-use-python-sdk-model-class"></a>

Você pode implantar um algoritmo integrado ou um modelo pré-treinado em um endpoint de SageMaker IA em apenas algumas linhas de código usando o SageMaker Python SDK.

1. Primeiro, encontre o ID do modelo de sua escolha na [tabela de algoritmos integrados com modelos pré-treinados](https://sagemaker.readthedocs.io/en/stable/doc_utils/pretrainedmodels.html).

1. Usando o ID do modelo, defina seu modelo como um JumpStart modelo.

   ```
   from sagemaker.jumpstart.model import JumpStartModel
   
   model_id = "huggingface-text2text-flan-t5-xl"
   my_model = JumpStartModel(model_id=model_id)
   ```

1. Use o método `deploy` para implantar automaticamente seu modelo para inferência. Neste exemplo, usamos o modelo FLAN-T5 XL do Hugging Face.

   ```
   predictor = my_model.deploy()
   ```

1. Depois, você pode executar a inferência com o modelo implantado usando o método `predict`.

   ```
   question = "What is Southern California often abbreviated as?"
   response = predictor.predict(question)
   print(response)
   ```

**nota**  
Este exemplo usa o modelo de base FLAN-T5 XL, que é adequado para diversos casos de uso de geração de texto, incluindo respostas a perguntas, resumos, criação de chatbots e muito mais. Para obter mais informações sobre os casos de uso do modelo, consulte [Modelos de base disponíveis](jumpstart-foundation-models-latest.md).

Para obter mais informações sobre a `JumpStartModel ` classe e seus parâmetros, consulte [JumpStartModel](https://sagemaker.readthedocs.io/en/stable/api/inference/model.html#sagemaker.jumpstart.model.JumpStartModel).

## Verificar os tipos de instância padrão
<a name="jumpstart-foundation-models-use-python-sdk-model-class-instance-types"></a>

Você também pode incluir versões específicas do modelo ou tipos de instância ao implantar um modelo pré-treinado usando a função `JumpStartModel`. Todos os JumpStart modelos têm um tipo de instância padrão. Recupere o tipo de instância de implantação padrão usando o seguinte código:

```
from sagemaker import instance_types

instance_type = instance_types.retrieve_default(
    model_id=model_id,
    model_version=model_version,
    scope="inference")
print(instance_type)
```

Veja todos os tipos de instância compatíveis com um determinado JumpStart modelo com o `instance_types.retrieve()` método.

## Usar componentes de inferência para implantar vários modelos em um endpoint compartilhado
<a name="jumpstart-foundation-models-use-python-sdk-model-class-endpoint-types"></a>

Um componente de inferência é um objeto de hospedagem de SageMaker IA que você pode usar para implantar um ou mais modelos em um endpoint para aumentar a flexibilidade e a escalabilidade. Você deve alterar o `endpoint_type` para que seu JumpStart modelo seja, inference-component-based em vez do endpoint padrão baseado em modelo. 

```
predictor = my_model.deploy(
    endpoint_name = 'jumpstart-model-id-123456789012', 
    endpoint_type = EndpointType.INFERENCE_COMPONENT_BASED
)
```

Para obter mais informações sobre a criação de endpoints com componentes de inferência e a implantação de modelos de SageMaker IA, consulte. [Utilização compartilhada de recursos com vários modelos](realtime-endpoints-deploy-models.md#deployed-shared-utilization)

## Verificar os formatos válidos de inferência de entrada e saída
<a name="jumpstart-foundation-models-use-python-sdk-model-class-input-output"></a>

Para verificar os formatos válidos de entrada e saída de dados para inferência, você pode usar o método `retrieve_options()` das funções `Serializers` e `Deserializers`.

```
print(sagemaker.serializers.retrieve_options(model_id=model_id, model_version=model_version))
print(sagemaker.deserializers.retrieve_options(model_id=model_id, model_version=model_version))
```

## Verificar os cabeçalhos Accept e Content-Type compatíveis
<a name="jumpstart-foundation-models-use-python-sdk-model-class-content-types"></a>

Além disso, você pode usar o método `retrieve_options()` para verificar os cabeçalhos Accept e Content-Type compatíveis para um modelo.

```
print(sagemaker.content_types.retrieve_options(model_id=model_id, model_version=model_version))
print(sagemaker.accept_types.retrieve_options(model_id=model_id, model_version=model_version))
```

Para obter mais informações sobre utilitários, consulte [Utilitário APIs](https://sagemaker.readthedocs.io/en/stable/api/utility/index.html).