Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.
GetDocumentTextDetection
Mendapat hasil untuk operasi asinkron Amazon Texact yang mendeteksi teks dalam dokumen. Amazon Textract dapat mendeteksi baris teks dan kata-kata yang membentuk baris teks.
Anda memulai deteksi teks asinkron dengan meneleponStartDocumentTextDetection, yang mengembalikan pengenal pekerjaan (JobId). Ketika operasi deteksi teks selesai, Amazon Textract menerbitkan status penyelesaian ke topik Amazon Simple Notification Service (Amazon SNS) yang terdaftar dalam panggilan awal.StartDocumentTextDetection. Untuk mendapatkan hasil operasi deteksi teks, periksa terlebih dahulu bahwa nilai status yang diterbitkan ke topik Amazon SNS adalahSUCCEEDED. Jika ya, hubungiGetDocumentTextDetection, dan lulus pengenal pekerjaan (JobId) dari panggilan awal keStartDocumentTextDetection.
GetDocumentTextDetectionmengembalikan arrayBlockbenda.
Setiap halaman dokumen memiliki sebagai terkaitBlockjenis HALAMAN. Setiap HALAMANBlockobjek adalah induk dari LINEBlockobjek yang mewakili baris teks terdeteksi pada halaman. GARISBlockobjek adalah orang tua untuk setiap kata yang membentuk baris. Kata-kata diwakili olehBlockobjek tipe WORD.
Gunakan parameter MaxResults untuk membatasi jumlah blok yang dikembalikan. Jika hasil yang didapatkan lebih banyak daripada yang ditentukan dalam MaxResults, nilai NextToken dalam respons operasi berisi token pemberian nomor halaman untuk mendapatkan serangkaian hasil berikutnya. Untuk mendapatkan halaman hasil berikutnya, hubungiGetDocumentTextDetection, dan mengisiNextTokenparameter permintaan dengan nilai token yang dikembalikan dari panggilan sebelumnya keGetDocumentTextDetection.
Untuk informasi selengkapnya, lihatPendeteksi Teks.
Sintaksis Permintaan
{
"JobId": "string",
"MaxResults": number,
"NextToken": "string"
}
Parameter Permintaan
Permintaan menerima data berikut dalam format JSON.
- JobId
-
Pengidentifikasi unik untuk tugas deteksi teks.
JobIddikembalikan dariStartDocumentTextDetection. SEBUAHJobIdNilai hanya berlaku selama 7 hari.Jenis: String
Batasan Panjang: Panjang minimum 1. Panjang maksimum adalah 64.
Pola:
^[a-zA-Z0-9-_]+$Diperlukan: Ya
- MaxResults
-
Jumlah hasil maksimum untuk mengembalikan per panggilan yang diberi nomor halaman. Nilai terbesar yang dapat Anda tentukan adalah 1.000. Jika Anda menentukan nilai yang lebih besar dari 1.000, maksimum hasil dikembalikan adalah 1.000. Nilai default adalah 1,000.
Jenis: Bulat
Rentang yang Valid: Nilai minimum 1.
Diperlukan: Tidak
- NextToken
-
Jika respons sebelumnya tidak lengkap (karena ada lebih banyak blok untuk diambil), Amazon Textract mengembalikan token pemberian nomor halaman sebagai responsnya. Anda dapat menggunakan token pemberian nomor halaman ini untuk mengambil set blok berikutnya.
Jenis: String
Batasan Panjang: Panjang minimum 1. Panjang maksimum 255.
Pola:
.*\S.*Diperlukan: Tidak
Sintaksis Respons
{
"Blocks": [
{
"BlockType": "string",
"ColumnIndex": number,
"ColumnSpan": number,
"Confidence": number,
"EntityTypes": [ "string" ],
"Geometry": {
"BoundingBox": {
"Height": number,
"Left": number,
"Top": number,
"Width": number
},
"Polygon": [
{
"X": number,
"Y": number
}
]
},
"Id": "string",
"Page": number,
"Relationships": [
{
"Ids": [ "string" ],
"Type": "string"
}
],
"RowIndex": number,
"RowSpan": number,
"SelectionStatus": "string",
"Text": "string",
"TextType": "string"
}
],
"DetectDocumentTextModelVersion": "string",
"DocumentMetadata": {
"Pages": number
},
"JobStatus": "string",
"NextToken": "string",
"StatusMessage": "string",
"Warnings": [
{
"ErrorCode": "string",
"Pages": [ number ]
}
]
}
Elemen Respons
Jika tindakan berhasil, layanan mengirimkan kembali respons HTTP 200.
Layanan mengembalikan data berikut dalam format JSON.
- Blocks
-
Hasil operasi deteksi teks.
Jenis: ArrayBlockobjek
- DetectDocumentTextModelVersion
-
Jenis: String
- DocumentMetadata
-
Informasi tentang dokumen yang diproses Amazon Textract Texact.
DocumentMetadatadikembalikan di setiap halaman respons yang diberi nomor halaman dari operasi video Amazon Textract.Tipe: Objek DocumentMetadata
- JobStatus
-
Status terkini tugas deteksi teks.
Jenis: Rangkaian
Nilai Valid:
IN_PROGRESS | SUCCEEDED | FAILED | PARTIAL_SUCCESS - NextToken
-
Jika respons terpotong, Amazon Textract mengembalikan token ini. Anda dapat menggunakan token ini dalam permintaan berikutnya untuk mengambil set hasil deteksi teks berikutnya.
Jenis: String
Batasan Panjang: Panjang minimum 1. Panjang maksimum 255.
Pola:
.*\S.* - StatusMessage
-
Pengembalian jika pekerjaan deteksi tidak dapat diselesaikan. Berisi penjelasan tentang kesalahan apa yang terjadi.
Jenis: String
- Warnings
-
Daftar peringatan yang terjadi selama operasi deteksi teks untuk dokumen.
Jenis: ArrayWarningobjek
Kesalahan
- AccessDeniedException
-
Anda tidak berwenang untuk melakukan tindakan. Gunakan Amazon Resource Name (ARN) dari pengguna resmi atau IAM role untuk melakukan operasi.
Kode Status HTTP: 400
- InternalServerError
-
Amazon Textract Texact mengalami masalah layanan. Coba lagi panggilan Anda.
Kode Status HTTP: 500
- InvalidJobIdException
-
Pengenal pekerjaan yang tidak valid diteruskan keGetDocumentAnalysisatau untukGetDocumentAnalysis.
Kode Status HTTP: 400
- InvalidKMSKeyException
-
Menunjukkan bahwa Anda tidak memiliki izin mendekripsi dengan kunci KMS yang dimasukkan, atau kunci KMS dimasukkan secara tidak benar.
Kode Status HTTP: 400
- InvalidParameterException
-
Parameter input melanggar batasan. Misalnya, dalam operasi sinkron,
InvalidParameterExceptionpengecualian terjadi ketika salah satuS3ObjectatauBytesnilai-nilai yang disediakan dalamDocumentparameter permintaan. Validasi parameter Anda sebelum memanggil operasi API lagi.Kode Status HTTP: 400
- InvalidS3ObjectException
-
Amazon Textract tidak dapat mengakses objek S3 yang ditentukan dalam permintaan. untuk informasi selengkapnya,Konfigurasi Akses ke Amazon S3Untuk informasi pemecahan masalah, lihatPemecahan Masalah Amazon S3
Kode Status HTTP: 400
- ProvisionedThroughputExceededException
-
Jumlah permintaan melebihi batas throughput Anda. Jika Anda ingin meningkatkan batas ini, hubungi Amazon Textract.
Kode Status HTTP: 400
- ThrottlingException
-
Amazon Textract Texact untuk sementara tidak dapat memproses permintaan. Coba lagi panggilan Anda.
Kode Status HTTP: 500
Lihat Juga
Untuk informasi selengkapnya tentang penggunaan API di salah satu spesifik bahasaAWSSDK, lihat yang berikut ini: