

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

# DynamicFrameReader kelas
<a name="aws-glue-api-crawler-pyspark-extensions-dynamic-frame-reader"></a>

##  — metode —
<a name="aws-glue-api-crawler-pyspark-extensions-dynamic-frame-reader-_methods"></a>
+ [\_\_init\_\_](#aws-glue-api-crawler-pyspark-extensions-dynamic-frame-reader-__init__)
+ [from\_rdd](#aws-glue-api-crawler-pyspark-extensions-dynamic-frame-reader-from_rdd)
+ [from\_options](#aws-glue-api-crawler-pyspark-extensions-dynamic-frame-reader-from_options)
+ [from\_catalog](#aws-glue-api-crawler-pyspark-extensions-dynamic-frame-reader-from_catalog)

## \_\_init\_\_
<a name="aws-glue-api-crawler-pyspark-extensions-dynamic-frame-reader-__init__"></a>

**`__init__(glue_context)`**
+ `glue_context` — [GlueContext kelas](aws-glue-api-crawler-pyspark-extensions-glue-context.md) yang akan digunakan.

## from\_rdd
<a name="aws-glue-api-crawler-pyspark-extensions-dynamic-frame-reader-from_rdd"></a>

**`from_rdd(data, name, schema=None, sampleRatio=None)`**

Membaca sebuah `DynamicFrame` dari Resilient Distributed Dataset (RDD).
+ `data` — Set data tempat untuk membaca.
+ `name` — Nama tempat untuk membaca.
+ `schema` — Skema yang akan dibaca (opsional).
+ `sampleRatio` — Rasio sampel (opsional).

## from\_options
<a name="aws-glue-api-crawler-pyspark-extensions-dynamic-frame-reader-from_options"></a>

**`from_options(connection_type, connection_options={}, format=None, format_options={}, transformation_ctx="")`**

Membaca sebuah `DynamicFrame` menggunakan koneksi dan format yang ditentukan.
+ `connection_type` — Jenis koneksi. Nilai yang valid meliputi `s3``mysql`,`postgresql`,,`redshift`,`sqlserver`,`oracle`,`dynamodb`, dan`snowflake`.
+ `connection_options` — Pilihan koneksi, seperti path dan tabel basis data (opsional). Untuk informasi selengkapnya, lihat [Jenis dan opsi koneksi untuk ETL di AWS Glue for Spark](https://docs.aws.amazon.com/glue/latest/dg/aws-glue-programming-etl-connect.html). Untuk sebuah `connection_type` dari `s3`, path Amazon S3 didefinisikan dalam sebuah array.

  ```
  connection_options = {"paths": [ "{{s3://amzn-s3-demo-bucket/object_a}}", "{{s3://amzn-s3-demo-bucket/object_b}}"]}
  ```

  Untuk koneksi JDBC, beberapa properti harus didefinisikan. Perhatikan bahwa nama basis data harus menjadi bagian dari URL. Secara opsional dapat disertakan dalam opsi koneksi.
**Awas**  
Menyimpan kata sandi dalam skrip Anda tidak disarankan. Pertimbangkan `boto3` untuk menggunakan untuk mengambilnya dari AWS Secrets Manager atau Katalog Data AWS Glue.

  ```
  connection_options = {"url": "{{jdbc-url/database}}", "user": "{{username}}", "password": {{passwordVariable}},"dbtable": "{{table-name}}", "redshiftTmpDir": "{{s3-tempdir-path}}"} 
  ```

  Untuk koneksi JDBC yang melakukan pembacaan paralel, Anda dapat mengatur opsi hashfield. Contoh:

  ```
  connection_options = {"url": "{{jdbc-url/database}}", "user": "{{username}}", "password": {{passwordVariable}},"dbtable": "{{table-name}}", "redshiftTmpDir": "{{s3-tempdir-path}}" , "hashfield": "{{month}}"} 
  ```

  Untuk informasi selengkapnya, lihat [Membaca dari tabel JDBC secara paralel](run-jdbc-parallel-read-job.md). 
+ `format` — Format spesifikasi (opsional). Ini digunakan untuk Amazon Simple Storage Service (Amazon S3) atau koneksi AWS Glue yang mendukung berbagai format. Lihat [Opsi format data untuk input dan output untuk Spark AWS Glue](aws-glue-programming-etl-format.md) untuk format yang didukung.
+ `format_options` — Pilihan format untuk format yang ditentukan. Lihat [Opsi format data untuk input dan output untuk Spark AWS Glue](aws-glue-programming-etl-format.md) untuk format yang didukung.
+ `transformation_ctx` — Konteks transformasi yang akan digunakan (opsional).
+ `push_down_predicate` — Memfilter partisi tanpa harus mencantumkan dan membaca semua file dalam set data Anda. Untuk informasi selengkapnya, lihat [Pra-Pemfilteran Menggunakan Predikat Pushdown](https://docs.aws.amazon.com/glue/latest/dg/aws-glue-programming-etl-partitions.html#aws-glue-programming-etl-partitions-pushdowns).

## from\_catalog
<a name="aws-glue-api-crawler-pyspark-extensions-dynamic-frame-reader-from_catalog"></a>

**`from_catalog(database, table_name, redshift_tmp_dir="", transformation_ctx="", push_down_predicate="", additional_options={})`**

Membaca sebuah `DynamicFrame` menggunakan namespace katalog tertentu dan nama tabel.
+ `database` — Basis data tempat untuk membaca.
+ `table_name` — Nama tempat untuk dibaca.
+ `redshift_tmp_dir` — Sebuah direktori sementara Amazon Redshift yang akan digunakan (opsional, jika bukan pembacaan data dari Redshift).
+ `transformation_ctx` — Konteks transformasi yang akan digunakan (opsional).
+ `push_down_predicate` — Memfilter partisi tanpa harus mencantumkan dan membaca semua file dalam set data Anda. Untuk informasi selengkapnya, lihat [Pra-penyaringan menggunakan predikat pushdown](aws-glue-programming-etl-partitions.md#aws-glue-programming-etl-partitions-pushdowns).
+ `additional_options`— Opsi tambahan yang disediakan untukAWS Glue. 
  + Untuk menggunakan koneksi JDBC yang melakukan pembacaan paralel, Anda dapat mengatur pilihan `hashfield`, `hashexpression`, atau `hashpartitions`. Contoh:

    ```
    additional_options = {"hashfield": "{{month}}"} 
    ```

    Untuk informasi selengkapnya, lihat [Membaca dari tabel JDBC secara paralel](run-jdbc-parallel-read-job.md). 
  + Untuk meneruskan ekspresi katalog untuk memfilter berdasarkan kolom indeks, Anda dapat melihat `catalogPartitionPredicate` opsi.

    `catalogPartitionPredicate`— Anda dapat meneruskan ekspresi katalog untuk memfilter berdasarkan kolom indeks. Ini mendorong penyaringan ke sisi server. Untuk informasi selengkapnya, lihat [Indeks AWS Glue Partisi](https://docs.aws.amazon.com/glue/latest/dg/partition-indexes.html). Perhatikan itu `push_down_predicate` dan `catalogPartitionPredicate` gunakan sintaks yang berbeda. Yang pertama menggunakan sintaks standar Spark SQL dan yang kemudian menggunakan parser JSQL.

    Lihat informasi yang lebih lengkap di [Mengelola partisi untuk output ETL di AWS Glue](aws-glue-programming-etl-partitions.md). 