

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

# Crawling di un archivio di dati Amazon S3 utilizzando un endpoint VPC
<a name="connection-S3-VPC"></a>

Per motivi di sicurezza, audit o controllo, puoi consentire l'accesso all'archivio dati Amazon S3 o alle tabelle Catalogo dati supportate da Amazon S3 solo tramite un ambiente Amazon Virtual Private Cloud (Amazon VPC). In questo argomento viene descritto come creare e testare una connessione all'archivio dati Amazon S3 o alle tabelle Catalogo dati supportate da Amazon S3 in un endpoint VPC utilizzando il tipo di connessione `Network`.

Esegui le attività seguenti per eseguire un crawler nell'archivio dati:
+ [Prerequisiti](#connection-S3-VPC-prerequisites)
+ [Creazione della connessione ad Amazon S3](#connection-S3-VPC-create-connection)
+ [Test della connessione ad Amazon S3](#connection-S3-VPC-test-connection)
+ [Creazione di un crawler per un archivio di dati Amazon S3](#connection-S3-VPC-create-crawler)
+ [Esecuzione di un crawler](#connection-S3-VPC-run-crawler)

## Prerequisiti
<a name="connection-S3-VPC-prerequisites"></a>

Verifica di aver soddisfatto questi prerequisiti per configurare il datastore Amazon S3 affinché vi si possa accedere solo tramite un ambiente Amazon Virtual Private Cloud (Amazon VPC).
+ Un VPC configurato. Ad esempio: vpc-01685961063b0d84b. Per ulteriori informazioni, consulta le [Nozioni di base su Amazon VPC](https://docs.aws.amazon.com/vpc/latest/userguide/vpc-getting-started.html) nella *Guida per l'utente di Amazon VPC*.
+ Un endpoint Amazon S3 collegato al VPC. Ad esempio: vpc-01685961063b0d84b. Per ulteriori informazioni, consulta [Endpoint per Amazon S3](https://docs.aws.amazon.com/vpc/latest/userguide/vpc-endpoints-s3.html) nella *Guida per l'utente di Amazon VPC*.  
![Esempio di endpoint Amazon S3 collegato a un VPC.](http://docs.aws.amazon.com/it_it/glue/latest/dg/images/network_s3_vpc_s3_endpoint_attached.png)
+ Una voce route che punta all'endpoint VPC. Ad esempio vpce-0ec5da4d265227786 nella tabella di routing utilizzata dall'endpoint VPC (vpce-0ec5da4d265227786).  
![Esempio di una voce route che punta all'endpoint VPC.](http://docs.aws.amazon.com/it_it/glue/latest/dg/images/network_s3_vpc_route_entry.png)
+ Una lista di controllo degli accessi di rete collegata al VPC consente il traffico.
+ Un gruppo di sicurezza collegato al VPC consente il traffico.

## Creazione della connessione ad Amazon S3
<a name="connection-S3-VPC-create-connection"></a>

In genere, le risorse vengono create in Amazon Virtual Private Cloud (Amazon VPC) per impedirne l'accesso tramite rete internet pubblica. Per impostazione predefinita, non è AWS Glue possibile accedere alle risorse all'interno di un VPC. Per consentire l'accesso AWS Glue alle risorse all'interno del VPC, è necessario fornire ulteriori informazioni di configurazione specifiche del VPC che includono la sottorete VPC e il gruppo di sicurezza. IDs IDs Per creare una connessione `Network`, è necessario specificare le informazioni seguenti:
+ Un ID VPC
+ Una sottorete all'interno del VPC
+ Un gruppo di sicurezza

Per impostare una connessione `Network`:

1. Scegli **Add connection (Aggiungi connessione)** nel pannello di navigazione della console AWS Glue .

1. Inserisci il nome della connessione e scegli **Network (Rete)** come tipo di connessione. Scegli **Next (Successivo)**.  
![Selezione del tipo di connessione.](http://docs.aws.amazon.com/it_it/glue/latest/dg/images/network_s3_vpc_add_network_1.png)

1. Configura le informazioni su VPC, sottorete e gruppi di sicurezza.
   + VPC: scegli il nome del VPC che contiene l'archivio dati.
   + Sottorete: scegli una sottorete nel VPC.
   + Gruppi di sicurezza: scegli uno o più gruppi di protezione che consentono l'accesso all'archivio dati nel VPC.  
![Selezione del tipo di connessione.](http://docs.aws.amazon.com/it_it/glue/latest/dg/images/network_s3_vpc_add_network_2.png)

1. Seleziona **Next (Successivo)**.

1. Verifica le informazioni di connessione e scegli **Finish (Termina)**.  
![Selezione del tipo di connessione.](http://docs.aws.amazon.com/it_it/glue/latest/dg/images/network_s3_vpc_add_network_3.png)

## Test della connessione ad Amazon S3
<a name="connection-S3-VPC-test-connection"></a>

Una volta creata la connessione di `Network`, puoi testare la connettività al tuo archivio dati Amazon S3 in un endpoint VPC.

Durante il test di una connessione possono verificarsi i seguenti errori:
+ ERRORE DI CONNESSIONE A INTERNET: indica un problema di connessione a Internet
+ ERRORE DI BUCKET NON VALIDO: indica un problema con il bucket Amazon S3
+ ERRORE DI CONNESSIONE S3: indica un errore di connessione ad Amazon S3
+ ERRORE DI TIPO DI CONNESSIONE: indica che il tipo di connessione non ha il valore previsto, `NETWORK`
+ TIPO DI TEST DI CONNESSIONE NON VALIDO: indica un problema con il tipo di test della connessione di rete
+ DESTINAZIONE NON VALIDA: indica che il bucket Amazon S3 non è stato specificato correttamente

Per testare una connessione `Network`:

1. Seleziona la connessione **Network (Rete)** nella console AWS Glue .

1. Scegli **Test Connection (Connessione di prova)**.

1. Scegli il ruolo IAM creato nel passaggio precedente e specifica un bucket Amazon S3.

1. Per verificare la connessione, scegli **Test connection (Testa connessione)**. Potrebbero essere necessari alcuni istanti prima che il risultato venga visualizzato. 

![Test della connessione.](http://docs.aws.amazon.com/it_it/glue/latest/dg/images/network_s3_vpc_test_network.png)


 Se viene visualizzato un errore, controlla quanto segue:
+ I privilegi corretti vengono forniti al ruolo selezionato.
+ Viene fornito il bucket Amazon S3 corretto.
+ I gruppi di sicurezza e la lista di controllo degli accessi di rete consentono il traffico in entrata e in uscita necessario.
+ Il VPC specificato è connesso a un endpoint VPC Amazon S3.

Dopo aver testato correttamente la connessione, è possibile creare un crawler.

## Creazione di un crawler per un archivio di dati Amazon S3
<a name="connection-S3-VPC-create-crawler"></a>

Ora è possibile creare un crawler che specifichi la connessione di `Network` creata. Per ulteriori dettagli sulla creazione di un crawler, consulta [Configurazione di un crawler](define-crawler.md).

1. Inizia selezionando **Crawler nel riquadro di navigazione della console**. AWS Glue 

1. Scegli **Add crawler (Aggiungi crawler)**.

1. Specifica il nome del crawler, quindi scegli **Next (Avanti)**.

1. Quando viene richiesto di specificare l'origine dati, seleziona **S3** e specifica il prefisso del bucket Amazon S3 e la connessione creata in precedenza.  
![Test della connessione.](http://docs.aws.amazon.com/it_it/glue/latest/dg/images/network_s3_vpc_add_crawler_1.png)

1. Se necessario, aggiungi un altro archivio dati sulla stessa connessione di rete.

1. Scegli il ruolo IAM. Il ruolo IAM deve consentire l'accesso al servizio AWS Glue e al bucket Amazon S3. Per ulteriori informazioni, consulta [Configurazione di un crawler](define-crawler.md).  
![Test della connessione.](http://docs.aws.amazon.com/it_it/glue/latest/dg/images/network_s3_vpc_add_crawler_2.png)

1. Definisci la pianificazione per il crawler.

1. Scegli un database esistente nel catalogo dati oppure crea una nuova voce del database.  
![Test della connessione.](http://docs.aws.amazon.com/it_it/glue/latest/dg/images/network_s3_vpc_add_crawler_3.png)

1. Completa la configurazione rimanente.

## Creazione di un crawler per le tabelle del Catalogo dati supportate da Amazon S3
<a name="connection-S3-VPC-create-crawler-catalog-vpc"></a>

Ora è possibile creare un crawler che specifichi la connessione di `Network` creata e il tipo di fonte del Catalogo. Per ulteriori dettagli sulla creazione di un crawler, consulta [Configurazione di un crawler](define-crawler.md).

1. Inizia scegliendo **Crawler** nel riquadro di navigazione della console. AWS Glue 

1. Scegli **Add crawler (Aggiungi crawler)**.

1. Specifica il nome del crawler, quindi scegli **Next (Avanti)**.

1. Quando viene richiesto il tipo di origine crawler, scegliere **Existing catalog tables (Tabelle di catalogo esistenti)** e specificare le tabelle di catalogo esistenti da eseguire per il crawling dall'elenco delle tabelle disponibili.  
![Selezione del tipo di origine crawler.](http://docs.aws.amazon.com/it_it/glue/latest/dg/images/catalog-vpc-1.png)

1. Scegli il ruolo IAM. Il ruolo IAM deve consentire l'accesso al servizio AWS Glue e al bucket Amazon S3. Per ulteriori informazioni, consulta [Configurazione di un crawler](define-crawler.md).

1. Definisci la pianificazione per il crawler.

1. Scegli un database esistente nel catalogo dati oppure crea una nuova voce del database.

1. Completa la configurazione rimanente e rivedi i passaggi.  
![Selezione del tipo di origine crawler.](http://docs.aws.amazon.com/it_it/glue/latest/dg/images/catalog-vpc-2.png)

## Esecuzione di un crawler
<a name="connection-S3-VPC-run-crawler"></a>

Esegui il crawler.

![Gestione del crawler on demand.](http://docs.aws.amazon.com/it_it/glue/latest/dg/images/network_s3_vpc_s3_endpoint_run_crawler.png)


## Risoluzione dei problemi
<a name="connection-S3-VPC-troubleshooting"></a>

Per la risoluzione dei problemi relativi ai bucket Amazon S3 che utilizzano un gateway VPC, consulta l'argomento relativo alle [difficoltà di connessione a un bucket S3 usando un endpoint VPC gateway](https://aws.amazon.com/premiumsupport/knowledge-center/connect-s3-vpc-endpoint/).