Salva i risultati della query SQL in un panda DataFrame - Amazon SageMaker AI

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Salva i risultati della query SQL in un panda DataFrame

Puoi memorizzare i risultati della tua query SQL in un panda. DataFrame Il modo più semplice per inviare i risultati della query a DataFrame è utilizzare il menu a discesa Funzionalità dell'editor SQL dell'estensione JupyterLab SQL query-result e scegliere l'opzione Pandas dataframe.

In alternativa, puoi aggiungere il parametro alla tua stringa di connessione. --output '{"format": "DATAFRAME", "dataframe_name": "dataframe_name"}'

Ad esempio, la seguente query estrae i dettagli dei clienti con il saldo più elevato dalla Customer tabella del TPCH_SF1 database di Snowflake, utilizzando entrambi pandas e SQL:

  • In questo esempio, estraiamo tutti i dati dalla tabella dei clienti e li salviamo in un file denominato. DataFrame all_customer_data

    %%sm_sql --output '{"format": "DATAFRAME", "dataframe_name": "all_customer_data"}' --metastore-id snowflake-connection-name --metastore-type GLUE_CONNECTION SELECT * FROM SNOWFLAKE_SAMPLE_DATA.TPCH_SF1.CUSTOMER
    Saved results to all_customer_data
  • Successivamente, estraiamo i dettagli del saldo massimo del conto da DataFrame.

    all_customer_data.loc[all_customer_data['C_ACCTBAL'].idxmax()].values
    array([61453, 'Customer#000061453', 'RxNgWcyl5RZD4qOYnyT3', 15, '25-819-925-1077', Decimal('9999.99'), 'BUILDING','es. carefully regular requests among the blithely pending requests boost slyly alo'], dtype=object)