

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

# Gunakan Machine Learning (ML) dengan Amazon Athena
<a name="querying-mlmodel"></a>

Machine Learning (ML) dengan Amazon Athena memungkinkan Anda menggunakan Athena untuk menulis pernyataan SQL yang menjalankan inferensi Machine Learning (ML) menggunakan Amazon AI. SageMaker Fitur ini menyederhanakan akses ke model ML untuk analisis data, menghilangkan kebutuhan untuk menggunakan metode pemrograman yang kompleks untuk menjalankan inferensi.

Untuk menggunakan ML dengan Athena, Anda mendefinisikan sebuah ML dengan fungsi Athena dengan klausa `USING EXTERNAL FUNCTION`. Fungsi menunjuk ke titik akhir model SageMaker AI yang ingin Anda gunakan dan menentukan nama variabel dan tipe data untuk diteruskan ke model. Klausa berikutnya dalam kueri mereferensikan fungsi untuk meneruskan nilai ke model. Model ini menjalankan inferensi berdasarkan nilai-nilai yang diteruskan oleh kueri, kemudian mengembalikan hasil inferensi. Untuk informasi selengkapnya tentang SageMaker AI dan cara kerja titik akhir SageMaker AI, lihat [Panduan Pengembang Amazon SageMaker AI](https://docs.aws.amazon.com/sagemaker/latest/dg/).

Untuk contoh yang menggunakan ML dengan Athena dan inferensi SageMaker AI untuk mendeteksi nilai anomali dalam kumpulan hasil, lihat artikel Blog AWS Big Data [Mendeteksi nilai anomali dengan menjalankan](https://aws.amazon.com/blogs/big-data/detecting-anomalous-values-by-invoking-the-amazon-athena-machine-learning-inference-function/) fungsi inferensi pembelajaran mesin Amazon Athena.

## Pertimbangan dan batasan
<a name="considerations-and-limitations"></a>
+ **Wilayah yang Tersedia** — Fitur Athena ML tersedia di mana mesin Wilayah AWS Athena versi 2 atau yang lebih baru didukung.
+ **SageMaker Titik akhir model AI harus menerima dan mengembalikan `text/csv`** — Untuk informasi selengkapnya tentang format data, lihat [Format data umum untuk inferensi](https://docs.aws.amazon.com/sagemaker/latest/dg/cdf-inference.html) di Panduan *Pengembang Amazon SageMaker AI*.
+ **Athena tidak mengirim header CSV** - Jika titik akhir SageMaker AI Anda`text/csv`, penangan input Anda tidak boleh berasumsi bahwa baris pertama input adalah header CSV. Karena Athena tidak mengirim header CSV, output yang dikembalikan ke Athena akan berisi satu baris lebih sedikit dari yang diharapkan Athena dan menyebabkan kesalahan. 
+ **SageMaker Penskalaan titik akhir AI** — Pastikan titik akhir model SageMaker AI yang direferensikan cukup ditingkatkan untuk panggilan Athena ke titik akhir. Untuk informasi selengkapnya, lihat [Menskalakan model SageMaker AI secara otomatis](https://docs.aws.amazon.com/sagemaker/latest/dg/endpoint-auto-scaling.html) di *Panduan Pengembang Amazon SageMaker AI* dan [CreateEndpointConfig](https://docs.aws.amazon.com/sagemaker/latest/dg/API_CreateEndpointConfig.html)di *Referensi API Amazon SageMaker AI*.
+ **Izin IAM** — Untuk menjalankan kueri yang menentukan HTML dengan fungsi Athena, prinsipal IAM yang menjalankan kueri harus diizinkan untuk melakukan `sagemaker:InvokeEndpoint` tindakan untuk titik akhir model AI yang direferensikan. SageMaker Untuk informasi selengkapnya, lihat [Izinkan akses untuk ML dengan Athena](machine-learning-iam-access.md).
+ **ML dengan fungsi Athena tidak dapat digunakan dalam klausa secara langsung `GROUP BY`**

**Topics**
+ [Pertimbangan dan batasan](#considerations-and-limitations)
+ [Gunakan ML dengan sintaks Athena](ml-syntax.md)
+ [Lihat contoh penggunaan pelanggan](ml-videos.md)

# Gunakan ML dengan sintaks Athena
<a name="ml-syntax"></a>

Klausa `USING EXTERNAL FUNCTION` menentukan ML dengan fungsi Athena atau beberapa fungsi yang dapat dijadikan referensi oleh pernyataan `SELECT` berikutnya dalam kueri. Anda menentukan nama fungsi, nama variabel, dan tipe data untuk variabel dan nilai kembali.

## Sinopsis
<a name="ml-synopsis"></a>

Sintaks berikut menunjukkan klausa `USING EXTERNAL FUNCTION` yang menentukan sebuah ML dengan fungsi Athena.

```
USING EXTERNAL FUNCTION ml_function_name (variable1 data_type[, variable2 data_type][,...])
RETURNS data_type 
SAGEMAKER 'sagemaker_endpoint'
SELECT ml_function_name()
```

## Parameter
<a name="udf-parameters"></a>

**MENGGUNAKAN FUNGSI EKSTERNAL *ml\$1function\$1name* (*variable1**data\$1type*[, *variable2**data\$1type*] [,...])**  
*ml\$1function\$1name*mendefinisikan nama fungsi, yang dapat digunakan dalam klausa query berikutnya. Masing-masing *variable data\$1type* menentukan variabel bernama dan tipe data yang sesuai yang diterima model SageMaker AI sebagai input. Tipe data yang ditentukan harus berupa tipe data Athena yang didukung.

**PENGEMBALIAN *data\$1type***  
*data\$1type*menentukan tipe data SQL yang *ml\$1function\$1name* kembali ke kueri sebagai output dari model SageMaker AI.

**PEMBUAT SAGEMAKER '*sagemaker\$1endpoint***  
*sagemaker\$1endpoint*menentukan titik akhir model SageMaker AI.

**PILIH [...] *ml\$1function\$1name*(*expression*) [...]**  
Kueri SELECT yang meneruskan nilai ke variabel fungsi dan model SageMaker AI untuk mengembalikan hasil. *ml\$1function\$1name*menentukan fungsi didefinisikan sebelumnya dalam query, diikuti oleh *expression* yang dievaluasi untuk lulus nilai. Nilai-nilai yang diteruskan dan dihasilkan harus cocok dengan tipe data yang sesuai yang ditentukan untuk fungsi dalam klausa `USING EXTERNAL FUNCTION`.

## Contoh
<a name="ml-examples"></a>

Contoh berikut menunjukkan kueri menggunakan ML dengan Athena.

**Example**  

```
USING EXTERNAL FUNCTION predict_customer_registration(age INTEGER) 
    RETURNS DOUBLE
    SAGEMAKER 'xgboost-2019-09-20-04-49-29-303' 
SELECT predict_customer_registration(age) AS probability_of_enrolling, customer_id 
     FROM "sampledb"."ml_test_dataset" 
     WHERE predict_customer_registration(age) < 0.5;
```

# Lihat contoh penggunaan pelanggan
<a name="ml-videos"></a>

Video berikut, yang menggunakan versi Pratinjau Machine Learning (ML) dengan Amazon Athena, menampilkan cara-cara di mana Anda dapat menggunakan AI SageMaker dengan Athena.

## Memprediksi churn pelanggan
<a name="ml-videos-predict-churn"></a>

Video berikut menunjukkan cara menggabungkan Athena dengan kemampuan pembelajaran mesin Amazon SageMaker AI untuk memprediksi churn pelanggan.

[![AWS Videos](http://img.youtube.com/vi/https://www.youtube.com/embed/CUHbSpekRVg/0.jpg)](http://www.youtube.com/watch?v=https://www.youtube.com/embed/CUHbSpekRVg)


## Mendeteksi botnet
<a name="ml-videos-detect-botnets"></a>

Video berikut menunjukkan bagaimana satu perusahaan menggunakan Amazon Athena dan Amazon SageMaker AI untuk mendeteksi botnet.

[![AWS Videos](http://img.youtube.com/vi/https://www.youtube.com/embed/0dUv-jCt2aw/0.jpg)](http://www.youtube.com/watch?v=https://www.youtube.com/embed/0dUv-jCt2aw)
