Configuración de JupyterHub
Puede personalizar la configuración de JupyterHub en Amazon EMR y los cuadernos de usuarios individuales si se conecta al nodo maestro del clúster y edita los archivos de configuración. Después de cambiar los valores, reinicie el contenedor jupyterhub.
Modifique las propiedades de los siguientes archivos para configurar JupyterHub y los cuadernos de Jupyter individuales:
jupyterhub_config.py: de forma predeterminada, este archivo se guarda en el directorio de/etc/jupyter/conf/del nodo maestro. Para obtener más información, consulte la sección Aspectos básicos de configuraciónen la documentación de JupyterHub. jupyter_notebook_config.py: este archivo se guarda en el directorio/etc/jupyter/de forma predeterminada y se copia en el contenedorjupyterhubcomo la opción predeterminada. Para obtener más información, consulte Config file and command line optionsen la documentación de Jupyter Notebook.
También puede utilizar la clasificación de configuración jupyter-sparkmagic-conf al crear un clúster para personalizar Sparkmagic, que actualiza los valores del archivo config.json para Sparkmagic. Para obtener más información sobre las opciones de configuración disponibles, consulte example_config.json en GitHub
El siguiente ejemplo lanza un clúster mediante la AWS CLI, que hace referencia al archivo MyJupyterConfig.json para las opciones de clasificación de configuración de Sparkmagic.
nota
Se incluyen caracteres de continuación de línea de Linux (\) para facilitar la lectura. Se pueden eliminar o utilizar en los comandos de Linux. En Windows, elimínelos o sustitúyalos por un signo de intercalación (^).
aws emr create-cluster--use-default-roles--release-label emr-5.14.0 \ --applications Name=Jupyter --instance-typem4.xlarge--instance-count3\ --ec2-attributes KeyName=MyKey,SubnetId=subnet-1234a5b6--configurationsfile://MyJupyterConfig.json
El contenido de ejemplo de MyJupyterConfig.json es el siguiente:
[ { "Classification":"jupyter-sparkmagic-conf", "Properties": { "kernel_python_credentials" : "{\"username\":\"diego\",\"base64_password\":\"mypass\",\"url\":\"http:\/\/localhost:8998\",\"auth\":\"None\"}" } } ]
nota
Con la versión 5.21.0 y posteriores de Amazon EMR, puede anular las configuraciones de clúster y especificar las clasificaciones de configuración adicionales para cada grupo de instancias en un clúster en ejecución. Para ello, utilice la consola de Amazon EMR, la AWS Command Line Interface (AWS CLI) o el AWS SDK. Para obtener más información, consulte Suministrar una configuración para un grupo de instancias en un clúster en ejecución.