As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.
Ajuste os modelos Amazon Nova com ajuste fino de reforço
Antes de fazer o ajuste fino, certifique-se de ter os pré-requisitos, pois o Amazon Bedrock precisa de permissões específicas para criar e gerenciar o processo de ajuste fino. Para obter informações abrangentes sobre segurança e permissões, consulteAcesso e segurança para modelos Amazon Nova.
Execute o ajuste fino de reforço para os modelos Amazon Nova em 5 etapas:
-
Forneça o conjunto de dados de treinamento — faça o upload de solicitações no formato necessário (por exemplo, JSONL) como conjunto de dados de treinamento de ajuste fino de reforço. Para obter mais informações, consulte Prepare dados para os modelos Amazon Nova.
-
Configurar a função de recompensa (avaliador) — Defina um avaliador para pontuar as respostas do modelo com base na exatidão, estrutura, tom ou outros objetivos. A função de recompensa pode ser executada usando o Lambda para calcular as pontuações objetivas. Você também pode escolher um modelo como juiz (via console) e avaliar as respostas com base nos critérios e princípios que você configura (o console os converte em funções Lambda automaticamente). Para obter mais informações, consulte Configurando funções de recompensa para modelos Amazon Nova.
-
Envie o trabalho de ajuste fino do reforço — Inicie o trabalho de ajuste fino do reforço especificando o modelo base, o conjunto de dados, a função de recompensa e outras configurações opcionais, como hiperparâmetros. Para obter mais informações, consulte Crie e gerencie trabalhos de ajuste fino para modelos Amazon Nova.
-
Monitore o treinamento — acompanhe o status do trabalho, as métricas de recompensa e o progresso do treinamento até a conclusão. Para obter mais informações, consulte Monitore seu trabalho de treinamento em RFT.
-
Use um modelo ajustado — após a conclusão do trabalho, implante o modelo RFT resultante com um clique para inferência sob demanda. Você também pode usar o Provisioned Throughput para cargas de trabalho de missão crítica que exigem desempenho consistente. Consulte Configurar a inferência para um modelo personalizado. Use Test in Playground para avaliar e comparar as respostas com o modelo básico.
Importante
Você pode fornecer no máximo 20 mil solicitações ao Amazon Bedrock para reforçar o ajuste fino do modelo.
Modelos Nova compatíveis
A tabela a seguir mostra os modelos do Amazon Nova que você pode personalizar com o ajuste fino do reforço:
nota
Para obter informações sobre modelos adicionais compatíveis, incluindo modelos de peso aberto, consulteAjuste modelos de peso aberto usando -compatible OpenAI APIs.
| Fornecedor | Modelo | ID do modelo | Suporte ao modelo de região única |
|---|---|---|---|
| Amazon | Nova 2 Lite | amazon.nova-2-lite-v1:0:256k | us-east-1 |