

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

# Implemente modelos a JumpStart partir de Amazon SageMaker Studio
<a name="sagemaker-hyperpod-model-deployment-deploy-js-ui"></a>

En los siguientes pasos, se explica cómo implementar modelos JumpStart con Amazon SageMaker Studio.

## Requisitos previos
<a name="sagemaker-hyperpod-model-deployment-deploy-js-ui-prereqs"></a>

Compruebe que ha configurado las capacidades de inferencia en sus SageMaker HyperPod clústeres de Amazon. Para obtener más información, consulte [Configuración de los HyperPod clústeres para la implementación de modelos](sagemaker-hyperpod-model-deployment-setup.md). 

## Cree un despliegue HyperPod
<a name="sagemaker-hyperpod-model-deployment-deploy-js-ui-create"></a>

1. En Amazon SageMaker Studio, abre la página de **JumpStart**destino desde el panel de navegación izquierdo. 

1. En **Todos los modelos públicos**, elija el modelo que desee implementar.
**nota**  
Si ha seleccionado un modelo cerrado, tendrá que aceptar el Acuerdo de licencia de usuario final (EULA).

1. Elija **SageMaker HyperPod**.

1. En **Configuración de implementación**, JumpStart recomendará una instancia para la implementación. Puede modificar la configuración si es necesario.

   1. Si modificas el **tipo de instancia**, asegúrate de que sea compatible con el **HyperPod clúster** elegido. Si no hay instancias compatibles, tendrás que seleccionar un **HyperPod clúster** nuevo o ponerte en contacto con tu administrador para añadir instancias compatibles al clúster.

   1. Para priorizar la implementación del modelo, instale el complemento de gobernanza de tareas, cree asignaciones de recursos de computación y configure las clasificaciones de las tareas para la política de clústeres. Una vez hecho esto, debería aparecer una opción para seleccionar una prioridad para la implementación del modelo que se puede usar como prioridad para otras implementaciones y tareas del clúster. 

   1. Introduzca el espacio de nombres al que le ha dado acceso su administrador. Puede que tenga que contactar directamente con el administrador para obtener el espacio de nombres exacto. Después de proporcionar un espacio de nombres válido, se debe activar el botón **Implementar** para implementar el modelo.

   1. Si tu tipo de instancia está particionado (compatible con MIG), selecciona un tipo de **partición de GPU**.

   1. Si quieres habilitar el enrutamiento inteligente KVCache o de nivel 2 para acelerar la inferencia de LLM, actívalos. De forma predeterminada, solo la caché de nivel 1 KB está habilitada. Para obtener más información sobre el KVCache enrutamiento inteligente, consulte el [SageMaker HyperPod modelo](sagemaker-hyperpod-model-deployment.md) de implementación.

1. Elija **Implementar** y espere a que se cree el **Punto de conexión**.

1. Una vez creado el **Punto de conexión**, seleccione **Probar inferencia**.

## Edite una HyperPod implementación
<a name="sagemaker-hyperpod-model-deployment-deploy-js-ui-edit"></a>

1. En Amazon SageMaker Studio, selecciona **Compute** y, a continuación, **HyperPodclústeres** en el panel de navegación izquierdo. 

1. En **Implementaciones**, elige la implementación del HyperPod clúster que deseas modificar.

1. En el icono de puntos suspensivos verticales (⋮), seleccione **Editar**.

1. En **Configuración de la implementación**, puede activar o desactivar **Escalado automático** y cambiar **Número máximo de réplicas**.

1. Seleccione **Guardar**.

1. El **Estado** cambiará a **Actualización**. Cuando vuelva a **En servicio**, los cambios se completarán y verá un mensaje que los confirma.

## Elimine una implementación HyperPod
<a name="sagemaker-hyperpod-model-deployment-deploy-js-ui-delete"></a>

1. En Amazon SageMaker Studio, selecciona **Compute** y, a continuación, **HyperPodclústeres** en el panel de navegación izquierdo. 

1. En **Implementaciones**, elige la implementación del HyperPod clúster que deseas modificar.

1. En el icono de puntos suspensivos verticales (⋮), elija **Eliminar**.

1. En la **ventana Eliminar HyperPod despliegue**, seleccione la casilla de verificación.

1. Elija **Eliminar**.

1. El **Estado** cambiará a **Eliminando**. Una vez que se haya eliminado la HyperPod implementación, verás un mensaje que la confirma.