

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

# Masukan untuk analisis kustom asinkron
<a name="idp-inputs-async"></a>

Anda dapat memasukkan beberapa dokumen ke pekerjaan analisis asinkron kustom. Topik berikut menjelaskan jenis dokumen masukan yang dapat Anda gunakan. Ukuran file maksimum bervariasi tergantung pada jenis dokumen input. 

**Topics**
+ [Dokumen teks biasa](#idp-inputs-async-text)
+ [Semi-structured dokumen](#idp-inputs-async-semi)
+ [File gambar dan file PDF yang dipindai](#idp-inputs-async-ocr)
+ [File JSON keluaran Amazon Textract](#idp-inputs-async-textract)

## Dokumen teks biasa
<a name="idp-inputs-async-text"></a>

Berikan semua dokumen input teks biasa sebagai teks. UTF-8-formatted Tabel berikut mencantumkan ukuran file maksimum dan pedoman lainnya. 

**catatan**  
Batasan ini berlaku ketika **semua** file input adalah teks biasa.


| Deskripsi | Quota/Guideline | 
| --- | --- | 
| Ukuran file maksimum untuk satu dokumen per format file (Klasifikasi khusus) | 1 byte—10 MB | 
| Ukuran dokumen (Pengenalan entitas khusus) | 1 byte—1 MB | 
| Jumlah maksimum file, satu dokumen per file | 1.000.000 | 
| Jumlah baris maksimum, satu dokumen per baris (untuk semua file dalam permintaan) | 1.000.000 | 
| Ukuran korpus dokumen (semua dokumen dalam plaintext digabungkan) | 1 byte—5 GB | 

## Semi-structured dokumen
<a name="idp-inputs-async-semi"></a>

Semi-structured dokumen termasuk dokumen PDF asli dan dokumen Word. 

Tabel berikut mencantumkan ukuran file maksimum dan pedoman lainnya.


| Deskripsi | Quota/Guideline | 
| --- | --- | 
| Ukuran dokumen (PDF) | 1 byte—50 MB | 
| Ukuran dokumen (Docx) | 1 byte—5 MB | 
| Jumlah maksimum file | 500 | 
| Jumlah halaman maksimum untuk file PDF atau Docx | 100 | 
| Ukuran korpus dokumen setelah ekstraksi teks (plaintext, semua file digabungkan) | 1 byte—5 GB | 

Secara default, analisis kustom menggunakan parser Amazon Comprehend untuk mengekstrak teks dari file Word dan file PDF digital. Untuk file PDF, Anda dapat mengganti default ini dan menggunakan Amazon Ttract untuk mengekstrak teks. Lihat [Mengatur opsi ekstraksi teks](idp-set-textract-options.md).

## File gambar dan file PDF yang dipindai
<a name="idp-inputs-async-ocr"></a>

Analisis kustom mendukung gambar JPEG, PNG, dan TIFF.

Tabel berikut mencantumkan ukuran file maksimum untuk gambar. File PDF yang dipindai tunduk pada ukuran maksimum yang sama dengan file PDF asli.


| Deskripsi | Quota/Guideline | 
| --- | --- | 
| Ukuran gambar (JPG atau PNG) | 1 byte—10 MB | 
| Ukuran gambar (TIFF) | 1 byte—10 MB. Maksimal satu halaman. | 

Untuk informasi tambahan tentang gambar, lihat[Praktik terbaik untuk gambar](idp-images-bp.md).

Secara default, Amazon Comprehend menggunakan operasi Amazon `DetectDocumentText` Textract API untuk mengekstrak teks dari file gambar dan file PDF yang dipindai. Anda dapat mengganti default ini untuk menggunakan operasi `AnalyzeDocument` API sebagai gantinya. Lihat [Mengatur opsi ekstraksi teks](idp-set-textract-options.md).

## File JSON keluaran Amazon Textract
<a name="idp-inputs-async-textract"></a>

Untuk pengenalan entitas kustom, tetapi bukan klasifikasi kustom, Anda dapat menyediakan file keluaran dari operasi Amazon Textract `AnalyzeDocument` API sebagai input ke pekerjaan analisis. 