Fine-tune Modelos Amazon Nova com ajuste fino de reforço

Antes de fazer o ajuste fino, certifique-se de ter os pré-requisitos, pois o Amazon Bedrock precisa de permissões específicas para criar e gerenciar o processo de ajuste fino. Para obter informações abrangentes sobre segurança e permissões, consulteAcesso e segurança para modelos Amazon Nova.

Execute o ajuste fino de reforço para os modelos Amazon Nova em 5 etapas:

Forneça o conjunto de dados de treinamento — faça o upload de solicitações no formato necessário (por exemplo, JSONL) como conjunto de dados de treinamento de ajuste fino de reforço. Para obter mais informações, consulte Prepare dados para os modelos Amazon Nova.
Configurar a função de recompensa (avaliador) — Defina um avaliador para pontuar as respostas do modelo com base na exatidão, estrutura, tom ou outros objetivos. A função de recompensa pode ser executada usando o Lambda para calcular as pontuações objetivas. Você também pode escolher um modelo como juiz (via console) e avaliar as respostas com base nos critérios e princípios que você configura (o console os converte em funções Lambda automaticamente). Para obter mais informações, consulte Configurando funções de recompensa para modelos Amazon Nova.
Envie o trabalho de ajuste fino do reforço — Inicie o trabalho de ajuste fino do reforço especificando o modelo base, o conjunto de dados, a função de recompensa e outras configurações opcionais, como hiperparâmetros. Para obter mais informações, consulte Crie e gerencie trabalhos de ajuste fino para modelos Amazon Nova.
Monitore o treinamento — acompanhe o status do trabalho, as métricas de recompensa e o progresso do treinamento até a conclusão. Para obter mais informações, consulte Monitore seu trabalho de treinamento em RFT.
Fine-Tuned Modelo de uso — Após a conclusão do trabalho, implante o modelo RFT resultante com um clique para inferência sob demanda. Você também pode usar o Provisioned Throughput para cargas de trabalho de missão crítica que exigem desempenho consistente. Consulte Configurar a inferência para um modelo personalizado. Use Test in Playground para avaliar e comparar as respostas com o modelo básico.

Importante

Você pode fornecer no máximo 20 mil solicitações ao Amazon Bedrock para reforçar o ajuste fino do modelo.

Modelos Nova compatíveis

A tabela a seguir mostra os modelos do Amazon Nova que você pode personalizar com o ajuste fino do reforço:

nota

Para obter informações sobre modelos adicionais compatíveis, incluindo modelos de peso aberto, consulteFine-tune modelos de peso aberto usando OpenAI-APIs compatíveis.

Modelos compatíveis para ajuste fino de reforços
Fornecedor	Modelo	ID do modelo	Single-region suporte de modelo
Amazon	Nova 2 Lite	amazon.nova-2-lite-v1:0:256k	us-east-1

Atenção O Javascript está desativado ou não está disponível no seu navegador.

Para usar a documentação da AWS, o Javascript deve estar ativado. Consulte as páginas de Ajuda do navegador para obter instruções.

Convenções do documento

Ajuste fino de reforço

Acesso e segurança