Personalización de modelos con Amazon AI SageMaker - Amazon SageMaker AI

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Personalización de modelos con Amazon AI SageMaker

La personalización de modelos de SageMaker IA de Amazon es una capacidad que transforma el proceso tradicionalmente complejo y lento de personalizar los modelos de IA, que ha pasado de ser un esfuerzo de meses a convertirse en un flujo de trabajo simplificado que se puede completar en cuestión de días. Esta función aborda el desafío fundamental al que se enfrentan los desarrolladores de IA, que necesitan personalizar los modelos básicos con datos patentados para crear experiencias de cliente altamente diferenciadas. En esta guía de SageMaker IA se proporciona documentación de personalización detallada, que incluye step-by-step guías y opciones de configuración avanzadas. Para obtener una breve descripción general de la personalización del modelo Nova, consulte Personalizar y ajustar con precisión SageMaker en la Guía del usuario de Amazon Nova.

Esta capacidad incluye una nueva interfaz de usuario guiada que comprende los requisitos del lenguaje natural, con un conjunto completo de técnicas avanzadas de personalización de modelos, todas ellas impulsadas por una infraestructura sin servidores que elimina la sobrecarga operativa que implica la administración de los recursos informáticos. Ya sea que esté creando aplicaciones de investigación legal, mejorando los chatbots de servicio al cliente o desarrollando agentes de IA específicos para un dominio específico, esta función acelera su transición proof-of-concept al despliegue en producción.

Las funciones de personalización de modelos impulsadas por Amazon Bedrock Evaluations pueden transmitir datos de forma segura Regiones de AWS dentro de su zona geográfica para su procesamiento. Para obtener más información, consulte la documentación de Amazon Bedrock Evaluations.

Conceptos clave

Capacitación sin servidor

Una infraestructura informática totalmente gestionada que elimina toda la complejidad de la infraestructura y le permite centrarse únicamente en el desarrollo de modelos. Esto incluye el aprovisionamiento automático de instancias de GPU (P5, P4de, P4d, G5) en función del tamaño del modelo y los requisitos de formación, recetas de formación preoptimizadas que incorporan las mejores prácticas para cada técnica de personalización, supervisión en tiempo real con métricas y registros en tiempo real accesibles a través de la interfaz de usuario, y la limpieza automática de los recursos una vez finalizada la formación para optimizar los costes.

Técnicas de personalización de modelos

Conjunto completo de métodos avanzados que incluyen el ajuste preciso supervisado (SFT), la optimización de las preferencias directas (DPO), el aprendizaje por refuerzo con recompensas verificables (RLVR) y el aprendizaje por refuerzo con comentarios de la IA (RLAIF).

Modelo personalizado

Una versión especializada de un modelo básico que se ha adaptado a un caso de uso específico entrenándolo con sus propios datos, lo que ha dado como resultado un modelo de IA que conserva las capacidades generales del modelo base original y, al mismo tiempo, añade conocimientos, terminología, estilo o comportamiento específicos del dominio y adaptados a sus necesidades.

Recursos de personalización de modelos de IA

Recursos y artefactos que se utilizan para entrenar, refinar y evaluar los modelos personalizados durante el proceso de personalización del modelo. Estos activos incluyen conjuntos de datos, que son colecciones de ejemplos de entrenamiento (pares de pronto-respuesta, texto específico del dominio o datos etiquetados) que se utilizan para ajustar un modelo básico para aprender comportamientos, conocimientos o estilos específicos, y evaluadores, que son mecanismos para evaluar y mejorar el rendimiento del modelo mediante funciones de recompensa (lógica basada en códigos que puntúa los resultados del modelo en función de criterios específicos, utilizada en el entrenamiento de RLVR y la evaluación personalizada de los puntuadores) o indicaciones de recompensa ( instrucciones en lenguaje natural que guían a un LLM para juzgar la calidad de las respuestas modelo (utilizadas en la capacitación y LLM-as-a-judge evaluación de la RLAIF).

Grupo de paquetes modelo

Un contenedor de recopilación que rastrea todos los modelos registrados de los trabajos de entrenamiento y proporciona una ubicación centralizada para las versiones de los modelos y su linaje.

Modelo registrado

El resultado creado por la SageMaker IA al ejecutar trabajos de formación sin servidor. Puede ser un modelo ajustado (trabajo exitoso), un punto de control (trabajo fallido con punto de control) o metadatos asociados (trabajo fallido sin punto de control).

Modelo registrado

Un modelo registrado que se ha marcado con fines formales de seguimiento y gobierno, lo que permite una gestión completa del linaje y el ciclo de vida.

Linaje

Capturó automáticamente las relaciones entre los trabajos de formación, los conjuntos de datos de entrada, los modelos de salida, los trabajos de evaluación y las implementaciones en SageMaker AI y Amazon Bedrock.

Uso compartido entre cuentas

La capacidad de compartir modelos, conjuntos de datos y evaluadores entre AWS cuentas mediante AWS Resource Access Manager (RAM) y, al mismo tiempo, mantener una visibilidad completa del linaje.