Kit de ferramentas de IA responsável e moderação de conteúdo
Kit de ferramentas de IA responsável
O Nova Forge fornece um kit de ferramentas de IA responsável que inclui dados de treinamento e avaliação para alinhar os modelos às diretrizes de IA responsável do Amazon Nova durante o processo de treinamento e controles de runtime para moderar as respostas do modelo durante a inferência.
Dados de treinamento: casos e cenários que enfatizam os princípios da IA responsável, considerações de segurança e implantação responsável de tecnologia estão disponíveis para a combinação de dados a fim de alinhar modelos de forma responsável durante o pré-treinamento contínuo.
Avaliações: as avaliações que testam a capacidade do modelo de detectar e rejeitar conteúdo impróprio, prejudicial ou incorreto estão disponíveis como uma tarefa de avaliação comparativa para determinar o delta entre a performance do modelo de base e a do modelo personalizado.
Controles de runtime: por padrão, o runtime do Amazon Nova controla as respostas moderadas dos modelos durante a inferência. Para modificar esses controles de runtime, solicite as configurações de moderação de conteúdo personalizáveis do Amazon Nova entrando em contato com um gerente de conta da Amazon Web Services.
A segurança é uma responsabilidade compartilhada entre a Amazon Web Services e seus usuários. Alterar o modelo de base ou usar o pré-treinamento contínuo para melhorar a performance em um caso de uso específico pode afetar a segurança, a imparcialidade e outras propriedades do novo modelo. Um método de adaptação robusto minimiza as alterações na segurança, na imparcialidade e em outras proteções incorporadas aos modelos de base, ao mesmo tempo em que minimiza o impacto na performance do modelo em tarefas para as quais o modelo não foi personalizado. É necessário testar as aplicações de ponta a ponta em conjuntos de dados representativos de casos de uso para determinar se os resultados dos testes atendem às expectativas específicas de segurança, imparcialidade e outras propriedades, bem como à eficácia geral. Para obter mais informações, consulte o Guia de uso responsável da IA da Amazon Web Services, a Política de IA responsável da Amazon Web Services, a Política de uso aceitável da Amazon Web Services e os Termos de serviço da Amazon Web Services.
Moderação de conteúdo personalizável
As configurações de moderação de conteúdo personalizáveis (CCMS) permitem o ajuste de controles relevantes aos requisitos da empresa, mantendo controles essenciais e não configuráveis para garantir o uso responsável da IA.
Essas configurações permitem a geração de conteúdo por meio de três configurações disponíveis:
Somente segurança
Segurança, conteúdo sensível e equidade combinados
Todas as categorias combinadas
As quatro categorias de moderação de conteúdo são:
-
Segurança: abrange atividades perigosas, armas e substâncias controladas.
-
Conteúdo sensível: inclui palavrões, nudez e intimidação
-
Equidade: aborda vieses e considerações culturais
-
Segurança: envolve crimes cibernéticos, malware e conteúdo malicioso
Independentemente da configuração do CCMS, o Amazon Nova aplica controles essenciais e não configuráveis para garantir o uso responsável da IA, como controles para prevenir danos às crianças e preservar a privacidade.
Ao usar o CCMS, recomendamos usar o pré-treinamento contínuo (CPT) e começar com um ponto de verificação de alinhamento pré-RAI (somente texto pré-treinado parcial ou totalmente) em vez do ponto de verificação de produção totalmente alinhado. Esses pontos de verificação não passaram por treinamento de segurança nem foram direcionados para comportamentos específicos de RAI, permitindo que você os personalize com mais eficiência de acordo com seus requisitos de moderação de conteúdo.
dica
Ao usar o CCMS com a combinação de dados, considere ajustar a porcentagem da categoria “RAI” em sua configuração de nova_data para se alinhar aos requisitos específicos de moderação de conteúdo.
Disponibilidade
Atualmente, o CCMS está disponível para clientes aprovados usando:
Modelos do Amazon Nova Lite 1.0 e Pro 1.0
Inferência sob demanda do Amazon Bedrock
A região us-east-1 (Norte da Virgínia)
Para habilitar o CCMS para seus modelos do Forge, entre em contato com um gerente de conta da Amazon Web Services.