Kami tidak lagi memperbarui layanan Amazon Machine Learning atau menerima pengguna baru untuk itu. Dokumentasi ini tersedia untuk pengguna yang sudah ada, tetapi kami tidak lagi memperbaruinya. Untuk informasi selengkapnya, lihat Apa itu Amazon Machine Learning.
Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.
Parameter yang Diperlukan untuk Create Datasource Wizard
Agar Amazon ML dapat terhubung ke database Amazon Redshift dan membaca data atas nama Anda, Anda harus memberikan yang berikut:
-
Pergeseran Merah Amazon
ClusterIdentifier
-
Nama basis data Amazon Redshift
-
Kredensi basis data Amazon Redshift (nama pengguna dan kata sandi)
-
Peran Amazon Amazon Redshift AWS Identity and Access Management (IAM) Amazon ML
-
Kueri SQL Amazon Redshift
-
(Opsional) Lokasi skema Amazon Amazon
-
Lokasi pementasan Amazon S3 (tempat Amazon ML menempatkan data sebelum membuat sumber data)
Selain itu, Anda perlu memastikan bahwa pengguna IAM atau peran yang membuat sumber data Amazon Redshift (baik melalui konsol atau dengan menggunakan CreateDatasourceFromRedshift
tindakan) memiliki izin. iam:PassRole
- Pergeseran Merah Amazon
ClusterIdentifier
-
Gunakan parameter peka huruf besar/kecil ini untuk mengaktifkan Amazon ML menemukan dan terhubung ke klaster Anda. Anda dapat memperoleh pengenal cluster (nama) dari konsol Amazon Redshift. Untuk informasi selengkapnya tentang cluster, lihat Amazon Redshift Clusters.
- Nama Basis Data Amazon Redshift
-
Gunakan parameter ini untuk memberi tahu Amazon ML database mana di klaster Amazon Redshift yang berisi data yang ingin Anda gunakan sebagai sumber data Anda.
- Kredensil Basis Data Amazon Redshift
-
Gunakan parameter ini untuk menentukan nama pengguna dan kata sandi pengguna database Amazon Redshift yang konteksnya kueri keamanan akan dijalankan.
catatan
Amazon ML memerlukan nama pengguna dan kata sandi Amazon Redshift untuk terhubung ke database Amazon Redshift Anda. Setelah membongkar data ke Amazon S3, Amazon ML tidak pernah menggunakan kembali kata sandi Anda, juga tidak menyimpannya.
- Peran Pergeseran Merah Amazon ML Amazon
-
Gunakan parameter ini untuk menentukan nama peran IAM yang harus digunakan Amazon ML. untuk mengonfigurasi grup keamanan klaster Amazon Redshift dan kebijakan bucket untuk lokasi pementasan Amazon S3.
Jika Anda tidak memiliki peran IAM yang dapat mengakses Amazon Redshift, Amazon ML dapat membuat peran untuk Anda. Saat Amazon ML membuat peran, Amazon akan membuat dan melampirkan kebijakan yang dikelola pelanggan ke peran IAM. Kebijakan yang dibuat Amazon ML memberikan izin Amazon untuk mengakses hanya klaster yang Anda tentukan.
Jika Anda sudah memiliki peran IAM untuk mengakses Amazon Redshift, Anda dapat mengetik ARN peran tersebut, atau memilih peran dari daftar drop-down. Peran IAM dengan akses Amazon Redshift tercantum di bagian atas drop-down.
Peran IAM harus memiliki konten berikut:
{ "Version": "2012-10-17", "Statement": [ { "Effect": "Allow", "Principal": { "Service": "machinelearning.amazonaws.com" }, "Action": "sts:AssumeRole", "Condition": { "StringEquals": { "aws:SourceAccount": "
123456789012
" }, "ArnLike": { "aws:SourceArn": "arn:aws:machinelearning:us-east-1:123456789012
:datasource/*" } } }] }Untuk informasi selengkapnya tentang Kebijakan yang Dikelola Pelanggan, lihat Kebijakan yang Dikelola Pelanggan di Panduan Pengguna IAM.
- Kueri SQL Amazon Redshift
-
Gunakan parameter ini untuk menentukan kueri SQL SELECT yang dijalankan Amazon ML di database Amazon Redshift Anda untuk memilih data Anda. Amazon ML menggunakan tindakan Amazon Redshift UNLOAD untuk menyalin hasil kueri Anda dengan aman ke lokasi Amazon S3.
catatan
Amazon ML bekerja paling baik saat catatan input berada dalam urutan acak (diacak). Anda dapat dengan mudah mengacak hasil kueri Amazon Redshift SQL Anda dengan menggunakan fungsi Amazon Redshift random (). Misalnya, katakanlah ini adalah kueri asli:
"SELECT col1, col2, … FROM training_table"
Anda dapat menyematkan pengocokan acak dengan memperbarui kueri seperti ini:
"SELECT col1, col2, … FROM training_table ORDER BY random()"
- Lokasi Skema (Opsional)
-
Gunakan parameter ini untuk menentukan jalur Amazon S3 ke skema Anda untuk data Amazon Redshift yang akan diekspor Amazon ML.
Jika Anda tidak menyediakan skema untuk sumber data Anda, konsol Amazon ML akan secara otomatis membuat skema Amazon ML berdasarkan skema data kueri Amazon Redshift SQL. Skema Amazon ML memiliki tipe data yang lebih sedikit daripada skema Amazon Redshift, jadi ini bukan konversi. one-to-one Konsol Amazon ML mengonversi tipe data Amazon Redshift ke tipe data Amazon ML menggunakan skema konversi berikut.
Jenis Data Amazon Redshift Alias Amazon Redshift Tipe Data Amazon ML SMALLINT INT2 NUMERIC INTEGER INT, INT4 NUMERIC BIGINT INT8 NUMERIC DECIMAL NUMERIC NUMERIC REAL FLOAT4 NUMERIC DOUBLE PRECISION FLOAT8, MENGAPUNG NUMERIC BOOLEAN BOOL BINARY CHAR KARAKTER, NCHAR, BPCHAR KATEGORIS VARCHAR KARAKTER BERVARIASI, NVARCHAR, TEKS TEXT DATE TEXT TIMESTAMP STEMPEL WAKTU TANPA ZONA WAKTU TEXT Untuk dikonversi ke tipe
Binary
data Amazon, nilai Amazon Redshift Booleans dalam data Anda harus didukung nilai Amazon ML Binary. Jika tipe data Boolean Anda memiliki nilai yang tidak didukung, Amazon ML mengonversinya ke tipe data yang paling spesifik. Misalnya, jika Amazon Redshift Boolean memiliki nilai0
, dan1
,2
Amazon ML mengonversi Boolean menjadi tipe data.Numeric
Untuk informasi selengkapnya tentang nilai biner yang didukung, lihatMenggunakan AttributeType Field.Jika Amazon ML tidak dapat mengetahui tipe data, maka defaultnya.
Text
Setelah Amazon ML mengonversi skema, Anda dapat meninjau dan mengoreksi tipe data Amazon ML yang ditetapkan di wizard Create Datasource, dan merevisi skema sebelum Amazon ML membuat sumber data.
- Lokasi Pementasan Amazon S3
-
Gunakan parameter ini untuk menentukan nama lokasi pementasan Amazon S3 tempat Amazon ML menyimpan hasil kueri Amazon Redshift SQL. Setelah membuat sumber data, Amazon ML menggunakan data di lokasi pementasan alih-alih kembali ke Amazon Redshift.
catatan
Karena Amazon ML mengasumsikan peran IAM yang ditentukan oleh peran Amazon Amazon Redshift Amazon, Amazon ML memiliki izin untuk mengakses objek apa pun di lokasi pementasan Amazon S3 yang ditentukan. Karena itu, kami menyarankan Anda hanya menyimpan file yang tidak berisi informasi sensitif di lokasi pementasan Amazon S3. Misalnya, jika bucket root Anda
s3://mybucket/
, kami sarankan Anda membuat lokasi untuk menyimpan hanya file yang ingin diakses Amazon ML, sepertis3://mybucket/AmazonMLInput/
.