As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.
Obter instâncias prospectivas instantâneas
O Inference Recommender também pode fornecer uma lista de instâncias possíveis, ou tipos de instância que podem ser adequados para seu modelo, na página de detalhes do modelo do SageMaker AI. O recomendador de inferência executa automaticamente a análise comparativa em relação ao seu modelo para que você forneça as instâncias potenciais. Como essas são recomendações preliminares, recomendamos que você execute outros trabalhos de recomendação de instâncias para obter resultados mais precisos.
Você pode visualizar uma lista de instâncias possíveis para seu modelo de forma programática usando a API DescribeModel, o SageMaker AI Python SDK ou o console do SageMaker AI.
nota
Você não obterá instâncias possíveis para modelos que você criou no SageMaker AI antes desse recurso ser disponibilizado.
Para visualizar instâncias em potencial para seu modelo por meio do console, faça o seguinte:
-
Acesse o console do SageMaker em https://console.aws.amazon.com/sagemaker/
. -
No painel de navegação à esquerda, selecione Inferência e, em seguida, selecione Modelos.
-
Na lista de modelos, escolha seu modelo.
Na página de detalhes do seu modelo, acesse a seção Instâncias potenciais para implantar o modelo. A captura de tela a seguir mostra essa seção.
Nesta seção, você pode visualizar as possíveis instâncias otimizadas em termos de custo, throughput e latência para implantação do modelo, juntamente com informações adicionais para cada tipo de instância, como tamanho da memória, contagem de CPU e GPU e custo por hora.
Se você decidir comparar um exemplo de carga útil e executar um trabalho completo de recomendação de inferência para seu modelo, poderá iniciar um trabalho de recomendação de inferência padrão nesta página. Para iniciar um trabalho padrão por meio do console, faça o seguinte:
-
Na página de detalhes do modelo, na seção Instâncias potenciais para implantar o modelo, escolha Executar o trabalho de recomendador de inferência.
-
Na caixa de diálogo que aparece, para o bucket do S3 para análise comparativa da carga útil, insira o local do Amazon S3 onde você armazenou um exemplo de carga para seu modelo.
-
Em Tipo de conteúdo da carga útil, insira os tipos de MIME para seus dados de carga útil.
-
(Opcional) Na seção Compilação de modelo usando o SageMaker Neo, para a Configuração de entrada de dados, insira uma forma de dados no formato de dicionário.
-
Escolha Executar trabalho.
O Inference Recommender inicia o trabalho, e você pode ver o trabalho e os respectivos resultados na página da lista Recomendador de inferência no console do SageMaker AI.
Se você quiser executar um trabalho avançado e realizar testes de carga personalizados ou se quiser definir configurações e parâmetros adicionais para seu trabalho, consulte Executar um teste de carga personalizado.