Utilizzare Machine Learning (ML) con Amazon Athena - Amazon Athena

Utilizzare Machine Learning (ML) con Amazon Athena

Machine Learning (ML) con Amazon Athena ti consente di usare Athena per scrivere istruzioni SQL che eseguono l'inferenza Machine Learning (ML) mediante Amazon SageMaker AI. Questa caratteristica semplifica l'accesso ai modelli ML per l'analisi dei dati, eliminando la necessità di utilizzare metodi di programmazione complessi per eseguire l'inferenza.

Per usare ML con Athena, si definisce un ML con la funzione Athena con la clausola USING EXTERNAL FUNCTION. La funzione punta all'endpoint del modello SageMaker AI che desideri utilizzare e specifica i nomi di variabile e i tipi di dati da passare al modello. Le clausole successive nella query fanno riferimento alla funzione per passare valori al modello. Il modello esegue l'inferenza in base ai valori passati dalla query e quindi restituisce i risultati dell'inferenza. Per maggiori informazioni su SageMaker AI e sul funzionamento degli endpoint di SageMaker AI, consulta la Guida per gli sviluppatori di Amazon SageMaker AI.

Per un esempio che utilizza ML con l'inferenza Athena e SageMaker AI per rilevare un valore anomalo in un set di risultati, vedere l'articolo del blog Big Data AWS Rilevamento di valori anomali richiamando la funzione di inferenza Amazon Athena Machine Learning.

Considerazioni e limitazioni

  • Regioni disponibili: la funzionalità Athena ML è disponibile nelle Regioni AWS in cui è supportata la versione 2 (o successive) del motore Athena.

  • L'endpoint del modello SageMaker AI deve accettare e restituire text/csv: per ulteriori informazioni sui formati di dati, consulta Formati di dati comuni per l'inferenza nella Guida per sviluppatori di Amazon SageMaker AI.

  • Athena non invia intestazioni CSV: se l'endpoint SageMaker AI è text/csv, il gestore di input non deve presumere che la prima riga dell'input sia un'intestazione CSV. Poiché Athena non invia intestazioni CSV, l'output restituito ad Athena conterrà una riga in meno di quella prevista da Athena e causerà un errore.

  • Scalabilità degli endpoint SageMaker AI — Assicurarsi che l'endpoint del modello SageMaker AI referenziato sia sufficientemente scalato per le chiamate Athena all'endpoint. Per ulteriori informazioni, consulta Scalabilità automatica dei modelli SageMaker AI nella Guida per sviluppatori di Amazon SageMaker AI e CreateEndpointConfig nella Referenza dell'API Amazon SageMaker AI.

  • Autorizzazioni IAM — Per eseguire una query che specifica un ML con la funzione Athena, l'entità principale IAM che esegue la query deve poter eseguire l'azione sagemaker:InvokeEndpoint per l'endpoint del modello SageMaker AI di riferimento. Per ulteriori informazioni, consulta Autorizzazione per l'accesso per ML con Athena.

  • ML con funzioni Athena non può essere usato direttamente nelle clausole GROUP BY