Utilizzo di sessioni interattive con codice Microsoft Visual Studio - AWS Glue

Utilizzo di sessioni interattive con codice Microsoft Visual Studio

Prerequisiti

  • Installa sessioni interattive AWS Glue e verifica che funzioni con notebook Jupyter.

  • Scarica e installa Visual Studio Code con Jupyter. Per informazioni dettagliate, consulta Notebook Jupyter in VS Code

Nozioni di base sulle sessioni interattive con VSCode
  1. Disabilita Jupyter AutoStart in VSCode.

    In Visual Studio Code, i kernel di Jupyter vengono avviati automaticamente. Questo impedisce ai magic di entrare in vigore poiché la sessione è già stata avviata. Per disabilitare Auto Start su Windows, apri File > Preferences > Extensions > Jupyter, fai clic con il pulsante destro del mouse su Jupyter, quindi scegli Extension Settings.

    Su macOS, apri Code > Settings > Extensions > Jupyter, fai clic con il pulsante destro del mouse su Jupyter, quindi scegli Extension Settings.

    Scorri verso il basso fino a visualizzare Jupyter: Disable Jupyter Auto Start. Seleziona la casella "When true, disables Jupyter from being automatically started for you. È necessario invece eseguire una cella per avviare Jupyter."

    Lo screenshot mostra la casella di controllo abilitata per l'estensione Jupyter in VS Code.
  2. Vai su File (File) > New File (Nuovo file) > Save (Salva) per salvare questo file con il nome di tua scelta come estensione .ipynb o seleziona jupyter sotto Select a language (Seleziona una lingua) e salva il file.

    La schermata mostra il file salvato con un nuovo nome.
  3. Fare doppio clic sul file. Viene visualizzata la shell di Jupyter e verrà aperto un notebook.

    La schermata mostra il notebook aperto.
  4. Su Windows, quando crei un file per la prima volta, per impostazione predefinita, non è selezionato alcun kernel. Clicca su Select Kernel (Seleziona kernel) per visualizzare un elenco di kernel disponibili. Scegliere Glue PySpark.

    Su macOS, se non vedi il kernel Glue PySpark, prova a eseguire i seguenti passaggi:

    1. Esegui una sessione locale di Jupyter per ottenere l'URL.

      Ad esempio, per avviare il notebook Jupyter, utilizza il seguente comando.

      jupyter notebook

      Quando il notebook viene eseguito per la prima volta, verrà visualizzato un URL simile a http://localhost:8888/?token=3398XXXXXXXXXXXXXXXX.

      Copiare l'URL.

    2. In VS Code, fai clic sul kernel corrente, quindi seleziona Select Another Kernel... e successivamente Existing Jupyter Server.... Incolla l'URL che hai copiato dal passaggio precedente.

      Se ricevi un messaggio di errore, consulta il wiki VS Code Jupyter.

    3. In caso di successo, questo imposterà il kernel su Glue PySpark.

    La schermata mostra il pulsante Select kernel (seleziona kernel) evidenziato.

    Seleziona il kernel Glue PySpark o Glue Spark (rispettivamente per Python e Scala).

    La schermata mostra la selezione per AWS Glue PySpark.

    Se non vedi i kernel AWS Glue PySpark e AWS Glue Spark nell'elenco a discesa, accertati di aver installato il kernel AWS Glue nel passaggio precedente o che python.defaultInterpreterPath nell'impostazione di Visual Studio Code sia corretto. Per ulteriori informazioni, consulta la descrizione dell'impostazione python.defaultInterpreterPath.

  5. Crea una sessione interattiva AWS Glue. Procedi alla creazione di una sessione nello stesso modo in cui è stato fatto nel notebook Jupyter. Specifica qualsiasi magic nella parte superiore della prima cella ed esegui un'istruzione di codice.