

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

# Impostazione dell'accesso di rete agli archivi di dati
<a name="start-connecting"></a>

Per eseguire i processi ETL (Extract, Transform and Load, estrazione, trasformazione e caricamento), AWS Glue deve poter accedere ai datastore. Se un processo non deve essere necessariamente eseguito nella tua sottorete Virtual Private Cloud (VPC) (es. trasformazione di dati da Amazon S3 ad Amazon S3) non servono ulteriori configurazioni.

Se un processo deve essere eseguito nella tua sottorete VPC, (es. trasformazione di dati da un datastore JDBC a una sottorete privata), AWS Glue imposta le [interfacce di rete elastiche](https://docs.aws.amazon.com/vpc/latest/userguide/VPC_ElasticNetworkInterfaces.html) che consentono di connettere i processi dell'utente ad altre risorse all'interno del VPC in modo sicuro. A ogni interfaccia di rete elastica è assegnato un indirizzo IP privato preso dall'intervallo di indirizzi IP nella sottorete che hai specificato. Nessun indirizzo IP pubblico assegnato. I gruppi di sicurezza specificati nella connessione AWS Glue vengono applicati a ciascuna delle interfacce di rete elastiche. Per ulteriori informazioni, consulta [Impostazione di Amazon VPC per le connessioni JDBC ai data store Amazon RDS su JDBC da AWS Glue](setup-vpc-for-glue-access.md). 

Tutti i datastore JDBC ai quali il processo accede devono essere disponibili dalla sottorete VPC. Per accedere ad Amazon S3 dal VPC, serve un [endpoint VPC](vpc-endpoints-s3.md). Se il processo deve accedere sia alle risorse VPC che alla rete Internet pubblica, il VPC deve disporre di un gateway NAT (Network Address Translation) al suo interno.

 Un processo o endpoint di sviluppo può accedere a un solo VPC (e sottorete) alla volta. Se è necessario accedere a archivi dati in diversi VPCs, sono disponibili le seguenti opzioni: 
+ Utilizza VPC in peering per accedere ai datastore. Per ulteriori informazioni su VPC in peering, consulta [Nozioni di base sul VPC in peering](https://docs.aws.amazon.com/vpc/latest/peering/vpc-peering-basics.html) 
+ Usa un bucket Amazon S3 come posizione di storage intermedia. Dividi il lavoro in due processi, con l'output Amazon S3 del processo 1 come input per il processo 2.

Per dettagli su come connettersi a un datastore Amazon Redshift utilizzando Amazon VPC, consulta la pagina [Configurazione delle connessioni Redshift](aws-glue-programming-etl-connect-redshift-home.md#aws-glue-programming-etl-connect-redshift-configure).

Per dettagli su come connettersi a un datastore Amazon RDS utilizzando Amazon VPC, consulta la pagina [Impostazione di Amazon VPC per le connessioni JDBC ai data store Amazon RDS su JDBC da AWS Glue](setup-vpc-for-glue-access.md).

Una volta impostate le regole necessarie in Amazon VPC, puoi creare una connessione in AWS Glue con le proprietà necessarie per connetterti ai datastore. Per ulteriori informazioni sulla connessione, consulta [Connessione ai dati](glue-connections.md).

**Nota**  
Assicurati di configurare l'ambiente DNS per AWS Glue. Per ulteriori informazioni, consulta [Configurazione di DNS nel VPC](set-up-vpc-dns.md). 

**Topics**
+ [Configurazione di un VPC per la connessione a PyPI per AWS Glue](setup-vpc-for-pypi.md)
+ [Configurazione di DNS nel VPC](set-up-vpc-dns.md)

# Configurazione di un VPC per la connessione a PyPI per AWS Glue
<a name="setup-vpc-for-pypi"></a>

Il Python Package Index (PyPI) è un repository di software per il linguaggio di programmazione Python. Questo argomento affronta i dettagli necessari per supportare l'utilizzo dei pacchetti pip installati (come specificato dal creatore della sessione utilizzando il flag `--additional-python-modules`).

L'utilizzo di sessioni AWS Glue interattive con un connettore comporta l'uso della rete VPC tramite la sottorete specificata per il connettore. Di conseguenza, AWS i servizi e le altre destinazioni di rete non sono disponibili a meno che non si configuri una configurazione speciale.

Le soluzioni a questo problema includono:
+ Utilizzo di un gateway Internet raggiungibile dalla sessione.
+ Configurazione e utilizzo di un bucket S3 con un PyPI/simple repository contenente la chiusura transitiva delle dipendenze di un set di pacchetti.
+ Utilizzo di un CodeArtifact repository che rispecchia PyPI e che è collegato al VPC.

## Impostazione di un gateway Internet
<a name="setup-vpc-for-pypi-internet-gateway"></a>

Gli aspetti tecnici sono descritti in dettaglio nei [casi d'uso del gateway NAT](https://docs.aws.amazon.com/vpc/latest/userguide/nat-gateway-scenarios.html), ma tieni presente questi requisiti per l'utilizzo di `--additional-python-modules`. In particolare, `--additional-python-modules` richiede l'accesso a pypi.org, che è determinato dalla configurazione del tuo VPC. Si notino i requisiti seguenti:

1. Il requisito di installare moduli python aggiuntivi tramite pip install per la sessione di un utente. Se la sessione utilizza un connettore, la configurazione potrebbe risentirne.

1. Quando viene utilizzato un connettore con `--additional-python-modules`, all'avvio della sessione la sottorete associata al connettore `PhysicalConnectionRequirements` deve fornire un percorso di rete per raggiungere pypi.org.

1. È necessario determinare se la configurazione è corretta o meno.

## Configurazione di un bucket Amazon S3 per ospitare un repository mirato PyPI/simple
<a name="setup-vpc-for-pypi-s3-bucket"></a>

Questo esempio configura un mirror PyPI in Amazon S3 per un set di pacchetti e le relative dipendenze.

Per configurare il mirror PyPI per un set di pacchetti:

```
# pip download all the dependencies
pip download -d s3pypi --only-binary :all: plotly gglplot
pip download -d s3pypi --platform manylinux_2_17_x86_64 --only-binary :all: psycopg2-binary
# create and upload the pypi/simple index and wheel files to the s3 bucket
s3pypi -b test-domain-name --put-root-index -v s3pypi/*
```

Se disponi già di un repository di artefatti esistente, esso avrà un URL di indice per l'utilizzo di pip che puoi fornire al posto dell'URL di esempio per il bucket Amazon S3 di cui sopra.

Per utilizzare l'index-url personalizzato, con alcuni pacchetti di esempio:

```
%%configure
{
    "--additional-python-modules": "psycopg2_binary==2.9.5",
    "python-modules-installer-option": "--no-cache-dir --verbose --index-url https://test-domain-name.s3.amazonaws.com/ --trusted-host test-domain-name.s3.amazonaws.com"
}
```

## Configurazione di un CodeArtifact mirror di pypi collegato al tuo VPC
<a name="setup-vpc-for-pypi-code-artifact"></a>

Per configurare un mirror:

1. Crea un repository nella stessa regione della sottorete usata dal connettore.

   Seleziona `Public upstream repositories` e scegli `pypi-store`.

1. Fornisci l'accesso al repository dal VPC per la sottorete.

1. Specifica il valore `--index-url` corretto utilizzando l'`python-modules-installer-option`. 

   ```
   %%configure
   {
       "--additional-python-modules": "psycopg2_binary==2.9.5",
       "python-modules-installer-option": "--no-cache-dir --verbose --index-url https://test-domain-name.s3.amazonaws.com/ --trusted-host test-domain-name.s3.amazonaws.com"
   }
   ```

Per ulteriori informazioni, consulta [Utilizzo CodeArtifact da un VPC](https://docs.aws.amazon.com/codeartifact/latest/ug/use-codeartifact-from-vpc.html).

# Configurazione di DNS nel VPC
<a name="set-up-vpc-dns"></a>

Domain Name System (DNS) è uno standard che consente di risolvere i nomi utilizzati su Internet nei corrispondenti indirizzi IP. Un nome host DNS assegna un nome a un computer in modo univoco ed è costituito da un nome host e un nome di dominio. I server DNS risolvono i nomi host DNS nei corrispondenti indirizzi IP.

Per configurare il DNS nel VPC, accertarsi che i nomi host DNS e la risoluzione DNS siano abilitati nel VPC. Gli attributi di rete VPC `enableDnsHostnames` e `enableDnsSupport` devono essere impostati su `true`. Per visualizzare e modificare questi attributi, vai alla console VPC all'indirizzo [https://console.aws.amazon.com/vpc/](https://console.aws.amazon.com/vpc/). 

Per ulteriori informazioni, consulta [Utilizzo del DNS con il tuo VPC](https://docs.aws.amazon.com/vpc/latest/userguide/vpc-dns.html). Inoltre, è possibile utilizzare AWS CLI e chiamare il [modify-vpc-attribute](https://docs.aws.amazon.com/cli/latest/reference/ec2/modify-vpc-attribute.html)comando per configurare gli attributi di rete VPC.

**Nota**  
Se usi Route 53, verifica che la configurazione non sostituisca gli attributi di rete DNS.