Integrazione dei dati di Amazon Q in AWS Glue - AWS Glue

Integrazione dei dati di Amazon Q in AWS Glue

L'integrazione dei dati di Amazon Q in AWS Glue è una nuova funzionalità di IA generativa di AWS Glue che consente ai data engineer e agli sviluppatori ETL di creare processi di integrazione dei dati utilizzando il linguaggio naturale. Gli ingegneri e gli sviluppatori possono chiedere ad Amazon Q di creare processi, risolvere problemi e rispondere a domande su AWS Glue e sull'integrazione dei dati.

Che cos'è Amazon Q?

Nota

Supporto di Amazon Bedrock: AWS implementa il rilevamento automatico degli abusi. Poiché l'integrazione dei dati di Amazon Q è basata su Amazon Bedrock, gli utenti possono sfruttare appieno i controlli implementati in Amazon Bedrock per garantire la sicurezza, la protezione e l'uso responsabile dell'intelligenza artificiale (IA).

Amazon Q è un assistente conversazionale basato sull'intelligenza artificiale (IA) generativa che permette di comprendere, creare, estendere e utilizzare al meglio le applicazioni AWS. Il modello alla base di Amazon Q è stato arricchito con contenuti AWS di alta qualità per produrre risposte più complete, utilizzabili e referenziate per accelerare la crescita su AWS. Per ulteriori informazioni, consultare Che cos'è Amazon Q?

Che cos'è l'integrazione dei dati di Amazon Q in AWS Glue?

L'integrazione dei dati di Amazon Q in AWS Glue include le funzionalità seguenti:

  • Chat: l'integrazione dei dati di Amazon Q in AWS Glue è in grado di rispondere a domande in linguaggio naturale in inglese su domini di AWS Glue e di integrazione dei dati come connettori di origine e destinazione di AWS Glue, processi ETL di AWS Glue, Catalogo dati, crawler e AWS Lake Formation e altra documentazione sulle funzionalità e best practice. L'integrazione dei dati di Amazon Q in AWS Glue risponde fornendo istruzioni dettagliate e include riferimenti sulle fonti di informazioni.

  • Generazione di codice nell'integrazione dei dati: l'integrazione dei dati di Amazon Q in AWS Glue può rispondere a domande sugli script ETL di AWS Glue e generare nuovo codice in base a una domanda in linguaggio naturale in inglese.

  • Risoluzione dei problemi: l'integrazione dei dati di Amazon Q in AWS Glue è stata creata appositamente per aiutarti a comprendere gli errori nei processi AWS Glue e fornisce istruzioni dettagliate su come individuare la causa principale dei problemi e risolverli.

Nota

L'integrazione dei dati di Amazon Q in AWS Glue non utilizza il contesto della conversazione per fornire informazioni sulle risposte future per tutta la durata della conversazione. Ogni conversazione con l'integrazione dei dati di Amazon Q in AWS Glue è indipendente dalle conversazioni passate e da quelle future.

Utilizzi l'integrazione dei dati di Amazon Q in AWS Glue?

Nel pannello Amazon Q è possibile richiedere ad Amazon Q di generare codice per uno script AWS Glue ETL o rispondere a una domanda sulle funzionalità AWS Glue o risolvere un errore. La risposta consiste in uno script ETL in PySpark con istruzioni dettagliate su come personalizzarlo, esaminarlo ed eseguirlo. Per le domande, la risposta viene generata sulla base della knowledge base sull'integrazione dei dati con un riepilogo e un URL di origine per i riferimenti.

Ad esempio, è possibile chiedere ad Amazon Q di "Fornire uno script Glue che legga da Snowflake, rinomini i campi e scriva su Redshift" e, in risposta, l'integrazione dei dati di Amazon Q in AWS Glue restituirà uno script di processo AWS Glue in grado di eseguire l'operazione richiesta. Puoi esaminare il codice generato per assicurarti che soddisfi l'intento richiesto. In tal caso, è possibile implementarlo come processo AWS Glue in produzione. È possibile risolvere i problemi relativi ai processi chiedendo all'integrazione di spiegare gli errori e di proporre soluzioni. Amazon Q può rispondere a domande su AWS Glue o sulle best practice di integrazione dei dati.

Un esempio di utilizzo dell'integrazione dei dati di Amazon Q in AWS Glue.

Di seguito sono riportati alcuni esempi di domande che dimostrano come l'integrazione dei dati di Amazon Q in AWS Glue può aiutarti a crescere su AWS Glue:

Generazione di codice ETL AWS Glue:

  • Scrivi uno script AWS Glue che legga JSON da S3, che trasformi i campi utilizzando l'applicazione della mappatura e che scriva su Amazon Redshift

  • Come posso scrivere uno script AWS Glue per leggere da DynamoDB, applicare la trasformazione DropNullFields e scrivere su S3 come Parquet?

  • Forniscimi uno script AWS Glue che legga da MySQL, che rilasci alcuni campi in base alla logica aziendale e che scriva su Snowflake

  • Scrivi un processo AWS Glue per leggere da DynamoDB e scrivere su S3 come JSON

  • Aiutami a sviluppare uno script AWS Glue per il Catalogo dati AWS Glue su S3

  • Scrivi un processo AWS Glue per leggere JSON da S3, rimuovere i valori nulli e scrivere su Redshift

Spiegazioni delle funzionalità di AWS Glue:

  • Come posso utilizzare Qualità dei dati di AWS Glue?

  • Come utilizzare i segnalibri di processo di AWS Glue?

  • Come posso abilitare il dimensionamento automatico di AWS Glue?

  • Qual è la differenza tra frame dinamici AWS Glue e frame di dati Spark?

  • Quali sono i diversi tipi di connessioni supportati da AWS Glue?

Risoluzione dei problemi di AWS Glue:

  • Come risolvere gli errori di memoria esaurita (OOM) nei processi AWS Glue?

  • Quali sono alcuni messaggi di errore che potresti visualizzare durante la configurazione di Qualità dei dati di AWS Glue e come puoi risolverli?

  • Come posso correggere un processo AWS Glue che riporta l'errore di accesso negato ad Amazon S3?

  • Come posso risolvere i problemi relativi alla distribuzione dei dati sui processi AWS Glue?

Best practice per interagire con l'integrazione dei dati di Amazon Q

Di seguito sono riportate le best practice per interagire con l'integrazione dei dati di Amazon Q:

  • Quando si interagisce con l'integrazione dei dati di Amazon Q, occorre porre domande specifiche, applicare l'iterazione in caso di richieste complesse e verificare l'accuratezza delle risposte.

  • Quando si forniscono prompt di integrazione dei dati in linguaggio naturale, bisogna essere il più specifico possibile per aiutare l'assistente a capire esattamente di cosa si ha bisogno. Invece di chiedere “estrarre dati da S3”, fornire maggiori dettagli come “scrivere uno script AWS Glue che estragga i file JSON da S3”.

  • Esaminare lo script generato prima di eseguirlo per verificarne l'accuratezza. Se lo script generato contiene errori o non corrisponde al tuo intento, fornire all'assistente le istruzioni per correggerlo.

  • La tecnologia di IA generativa è nuova e nelle risposte possono esserci errori, a volte chiamati allucinazioni. Testa e rivedi tutto il codice per individuare errori e vulnerabilità prima di utilizzarlo nell'ambiente o nel carico di lavoro.

Integrazione dei dati di Amazon Q in AWS Glue per il miglioramento del servizio

Per aiutare l'integrazione dei dati di Amazon Q in AWS Glue a fornire le informazioni più pertinenti sui servizi AWS, possiamo utilizzare determinati contenuti di Amazon Q, come le domande poste ad Amazon Q e le relative risposte, per migliorare il servizio.

Per informazioni sui contenuti che utilizziamo e su come disattivarli, consultare Miglioramento del servizio di Amazon Q Developer nella Guida per l'utente di Amazon Q Developer.

Considerazioni

Considera i seguenti elementi prima di utilizzare l'integrazione dei dati di Amazon Q in AWS Glue:

  • Attualmente, la generazione del codice funziona solo con il kernel di PySpark. Il codice generato è per i processi AWS Glue basati su Python Spark.

  • Per informazioni sulle combinazioni supportate di capacità di generazione di codice dell'integrazione dei dati di Amazon Q in AWS Glue, consultare Capacità di generazione di codice supportate.