Configuración de la persistencia de los cuadernos en Amazon S3 - Amazon EMR

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Configuración de la persistencia de los cuadernos en Amazon S3

Puede configurar un JupyterHub clúster en Amazon EMR de forma que los cuadernos guardados por un usuario se conserven Amazon S3, fuera del almacenamiento efímero de las instancias de clúster. EC2

Para especificar la persistencia en Amazon S3, utilice la clasificación de configuración jupyter-s3-conf al crear el clúster. Para obtener más información, consulte Configuración de aplicaciones.

Además de habilitar la persistencia de Amazon S3 utilizando la propiedad s3.persistence.enabled, debe utilizar la propiedad s3.persistence.bucket para especificar el bucket en Amazon S3 donde se guardan los cuadernos. Los blocs de notas de cada usuario se guardan en una carpeta jupyter/jupyterhub-user-name del bucket especificado. El bucket ya debe existir en Amazon S3, y el rol para el perfil de EC2 instancia que especifique al crear el clúster debe tener permisos para el bucket (de forma predeterminada, el rol esEMR_EC2_DefaultRole). Para obtener más información, consulte Configuración de roles de IAM para permisos AWS de Amazon EMR para los servicios de.

Cuando se lanza un nuevo clúster con las mismas propiedades de clasificación de configuración, los usuarios pueden abrir los blocs de notas con el contenido de la ubicación donde se guardaron.

Tenga en cuenta que, si importa archivos como módulos en un cuaderno con Amazon S3 activado, los archivos se subirán a Amazon S3. Cuando importa archivos sin habilitar la persistencia de Amazon S3, se cargan en su JupyterHub contenedor.

En el siguiente ejemplo, se habilita la persistencia de Amazon S3. Los blocs de notas guardados por los usuarios se almacenan en la carpeta s3://MyJupyterBackups/jupyter/jupyterhub-user-name de cada usuario, donde jupyterhub-user-name es un nombre de usuario, como por ejemplo diego.

[ { "Classification": "jupyter-s3-conf", "Properties": { "s3.persistence.enabled": "true", "s3.persistence.bucket": "MyJupyterBackups" } } ]