Implementación de modelos de JumpStart con Amazon SageMaker Studio - Amazon SageMaker AI

Implementación de modelos de JumpStart con Amazon SageMaker Studio

En los pasos siguientes se muestra cómo implementar los modelos de JumpStart con Amazon SageMaker Studio.

Requisitos previos

Compruebe que ha configurado las capacidades de inferencia en sus clústeres de Amazon SageMaker HyperPod. Para obtener más información, consulte Configuración de los clústeres de HyperPod para la implementación de modelos.

Creación de una implementación de HyperPod

  1. En Amazon SageMaker Studio, abra la página de inicio de JumpStart desde el panel de navegación izquierdo.

  2. En Todos los modelos públicos, elija el modelo que desee implementar.

    nota

    Si ha seleccionado un modelo cerrado, tendrá que aceptar el Acuerdo de licencia de usuario final (EULA).

  3. Elija SageMaker HyperPod.

  4. En la sección Configuración de la implementación, JumpStart recomendará una instancia para la implementación. Puede modificar la configuración si es necesario.

    1. Si modifica Tipo de instancia, asegúrese de que sea compatible con el clúster de HyperPod elegido. Si no hay instancias compatibles, tendrá que seleccionar un nuevo clúster de HyperPod o ponerse en contacto con el administrador para que añada instancias compatibles en el clúster.

    2. Para priorizar la implementación del modelo, instale el complemento de gobernanza de tareas, cree asignaciones de recursos de computación y configure las clasificaciones de las tareas para la política de clústeres. Una vez hecho esto, debería aparecer una opción para seleccionar una prioridad para la implementación del modelo que se puede usar como prioridad para otras implementaciones y tareas del clúster.

    3. Introduzca el espacio de nombres al que le ha dado acceso su administrador. Puede que tenga que contactar directamente con el administrador para obtener el espacio de nombres exacto. Después de proporcionar un espacio de nombres válido, se debe activar el botón Implementar para implementar el modelo.

  5. Elija Implementar y espere a que se cree el Punto de conexión.

  6. Una vez creado el Punto de conexión, seleccione Probar inferencia.

Edición de una implementación de HyperPod

  1. En Amazon SageMaker Studio, seleccione Computación y, a continuación, Clústeres de HyperPod en el panel de navegación izquierdo.

  2. En Implementaciones, elija la implementación del clúster de HyperPod que desee modificar.

  3. En el icono de puntos suspensivos verticales (⋮), seleccione Editar.

  4. En Configuración de la implementación, puede activar o desactivar Escalado automático y cambiar Número máximo de réplicas.

  5. Seleccione Guardar.

  6. El Estado cambiará a Actualización. Cuando vuelva a En servicio, los cambios se completarán y verá un mensaje que los confirma.

Eliminación de una implementación de HyperPod

  1. En Amazon SageMaker Studio, seleccione Computación y, a continuación, Clústeres de HyperPod en el panel de navegación izquierdo.

  2. En Implementaciones, elija la implementación del clúster de HyperPod que desee modificar.

  3. En el icono de puntos suspensivos verticales (⋮), elija Eliminar.

  4. En la ventana Eliminar la implementación de HyperPod, seleccione la casilla de verificación.

  5. Elija Eliminar.

  6. El Estado cambiará a Eliminando. Después de eliminar la implementación de HyperPod, verá un mensaje de confirmación.