Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.
Connessioni unificate
AWS ha recentemente introdotto una nuova funzionalità chiamata “Connessioni di SageMaker LakeHouse” o “Connessioni unificate AWS Glue”. Questa funzionalità consente di creare connessioni che possono essere utilizzate da più servizi AWS, come AWS Glue e Amazon Athena. Quando si crea un'origine dati in Amazon Athena, una sezione si riferisce agli input di connessione AWS Glue. In questo caso, Amazon Athena creerà una connessione AWS Glue, includendo tutte le proprietà specifiche di Amazon Athena nella sezione “AthenaProperties” della connessione.
D'altra parte, se si crea una connessione direttamente in AWS Glue, verrà richiesto solo di inserire proprietà specifiche per AWS Glue e Apache Spark, che verranno memorizzate nelle sezioni "ConnectionProperties" e "SparkProperties" della connessione.
Entrambi questi scenari comportano la creazione di una "connessione unificata", ma le connessioni create in Amazon Athena sono configurate solo per l'uso all'interno di Amazon Athena, mentre le connessioni create in AWS Glue sono configurate solo per l'uso all'interno di AWS Glue. Tuttavia, è possibile aggiornare queste connessioni con le proprietà mancanti (Amazon Athena o le proprietà Spark) in modo che possano essere utilizzate da entrambi i servizi. Amazon SageMaker AI Unified Studio si occupa automaticamente di questo aspetto compilando tutte le proprietà necessarie ("ConnectionProperties", "AthenaProperties" e "SparkProperties") sulla connessione AWS Glue, assicurando che la connessione possa essere utilizzata sia da AWS Glue che da Amazon Athena.
È importante notare che, sebbene vengano chiamate "connessioni unificate", le connessioni create in AWS Glue o Amazon Athena singolarmente non sono realmente unificate a meno che non siano configurate correttamente per l'uso da parte di entrambi i servizi. Solo le connessioni create tramite SageMaker Unified Studio sono veramente unificate e utilizzabili da più servizi pronti all'uso.
Inoltre, le connessioni create in AWS Glue non sono visibili in Amazon Athena perché Amazon Athena visualizza origini dati, che includono un riferimento a una connessione AWS Glue ma non sono la connessione AWS Glue stessa. Analogamente, le connessioni create in Amazon Athena non sono visibili in AWS Glue Studio perché AWS Glue Studio filtra qualsiasi connessione che non è stata configurata con le impostazioni necessarie per AWS Glue.
AWS Glue Studio crea connessioni unificate per impostazione predefinita. Nella console AWS Glue, è possibile visualizzare la versione della connessione nella tabella delle connessioni nella pagina delle connessioni, nella pagina dei dettagli delle connessioni e nella tabella delle connessioni nella pagina dei dettagli del processo.
La versione della connessione è visibile nei dettagli della connessione:
La versione della connessione è visibile anche quando si visualizzano tutte le connessioni.
Infine, la versione della connessione è visibile nella scheda Dettagli del processo per un processo.
Con le connessioni di versione 2, sono disponibili le seguenti funzionalità estese di connettività dati:
-
Individuazione del tipo di connessione: supporto per la creazione di connessioni utilizzando modelli standardizzati. AWS Glue rileva automaticamente i tipi di connessione accessibili dall'utente e gli input richiesti e opzionali per un determinato tipo di connessione.
-
Riusabilità: definizioni di connessione riutilizzabili su motori e strumenti di elaborazione dati di AWS come AWS Glue, Amazon Athena e Amazon SageMaker AI. Ora le connessioni contengono AthenaProperties, SparkProperties, PythonProperties che consentono di specificare proprietà di connessione specifiche dell'ambiente/servizio di calcolo oltre alle proprietà comuni archiviate in ConnectionProperties. Athena ora crea connessioni in AWS Glue specificando proprietà specifiche di Athena nella mappa delle proprietà di AthenaProperties.
-
Anteprima dei dati: possibilità di sfogliare i metadati e visualizzare in anteprima i dati da origini connesse.
-
Metadati dei connettori: è possibile utilizzare connessioni riutilizzabili per scoprire i metadati delle tabelle.
-
Segreti collegati al servizio: gli utenti possono fornire le credenziali di autenticazione OAuth, di base o personalizzate necessarie nella richiesta
CreateConnection. L'API CreateConnection crea un segreto legato al servizio nell'account e memorizza le credenziali.
Tipi di autenticazione di supportati
Le connessioni unificate supportano i seguenti tipi di autenticazione:
-
BASE: la maggior parte dei tipi di connessione al database e dei tipi di connessione AWS Glueesistenti supporta l'autenticazione di base, costituita da un nome utente e una password. In precedenza, la denominazione delle chiavi in SecretsManager era specifica del connettore e, ad esempio, poteva essere user, username, userName, opensearch.net.http.auth.user, ecc. È qui che le connessioni unificate standardizzavano i tipi di connessione di autenticazione di base sulle chiavi USERNAME e PASSWORD.
-
OAUTH2: la maggior parte dei tipi di connessione SaaS lanciati di recente supporta il protocollo OAuth2.
-
PERSONALIZZATA: alcuni tipi di connessione dispongono di altri meccanismi di autenticazione, come Google BigQuery, in cui gli utenti sono tenuti a fornire il codice JSON ottenuto da Google BigQuery.
Considerazioni
Quando si crea una connessione unificata per le origini dati, considerare le seguenti differenze:
-
Quando si crea una connessione unificata tramite AWS Glue Studio, le credenziali utente vengono archiviate in Gestione dei segreti AWS anziché nella connessione stessa. Ciò significa che ora i processi devono accedere a Secrets Manager.
-
Se i processi vengono eseguiti in un VPC, richiedono un endpoint VPC o un gateway NAT per accedere a Gestione dei segreti AWS e Secure Token Service (STS), il che comporta costi aggiuntivi.
-
Per alcune origini dati (Redshift, SQL Server, MySQL, Oracle, PostgreSQL), la creazione di una connessione unificata tramite AWS Glue Studio richiede l'accesso a AWS STS e Gestione dei segreti AWS. Ciò è necessario per stabilire una connessione sicura e recuperare le credenziali necessarie per accedere a queste origini dati all'interno del cloud privato virtuale (VPC).
-
La creazione di una connessione unificata tramite AWS Glue Studio richiede un ruolo IAM con autorizzazioni per accedere a Gestione dei segreti AWS e gestire le risorse VPC (se si utilizza un VPC):
secretsmanager:GetSecretValue
secretsmanager:PutSecretValue
secretsmanager:DescribeSecret
ec2:CreateNetworkInterface
ec2:DeleteNetworkInterface
ec2:DescribeNetworkInterfaces
ec2:DescribeSubnets