Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.
Menggunakan kosakata khusus
Setelah kosakata kustom Anda dibuat, Anda dapat memasukkannya ke dalam permintaan transkripsi Anda; lihat bagian berikut untuk contoh.
Bahasa kosakata kustom yang Anda sertakan dalam permintaan Anda harus cocok dengan kode bahasa yang Anda tentukan untuk media Anda. Jika bahasa tidak cocok, kosakata khusus Anda tidak diterapkan pada transkripsi Anda dan tidak ada peringatan atau kesalahan.
Menggunakan kosakata khusus dalam transkripsi batch
Untuk menggunakan kosakata khusus dengan transkripsi batch, lihat contoh berikut ini:
-
Masuk ke Konsol Manajemen AWS
. -
Di panel navigasi, pilih Pekerjaan transkripsi, lalu pilih Buat pekerjaan (kanan atas). Ini membuka halaman Tentukan detail pekerjaan.
Beri nama pekerjaan Anda dan tentukan media masukan Anda. Secara opsional sertakan bidang lain, lalu pilih Berikutnya.
-
Di bagian bawah halaman Configure job, di panel Customization, aktifkan kosakata kustom.
-
Pilih kosakata kustom Anda dari menu dropdown.
Pilih Buat pekerjaan untuk menjalankan pekerjaan transkripsi Anda.
Contoh ini menggunakan perintah dan parameter start-transcription-jobSettings VocabularyName Untuk informasi selengkapnya, lihat StartTranscriptionJob dan Settings.
aws transcribe start-transcription-job \ --regionus-west-2\ --transcription-job-namemy-first-transcription-job\ --media MediaFileUri=s3://amzn-s3-demo-bucket/my-input-files/my-media-file.flac\ --output-bucket-nameamzn-s3-demo-bucket\ --output-keymy-output-files/ \ --language-codeen-US\ --settings VocabularyName=my-first-vocabulary
Berikut contoh lain menggunakan perintah start-transcription-job
aws transcribe start-transcription-job \ --regionus-west-2\ --cli-input-json file://my-first-vocabulary-job.json
File my-first-vocabulary-job.json berisi badan permintaan berikut.
{ "TranscriptionJobName": "my-first-transcription-job", "Media": { "MediaFileUri": "s3://amzn-s3-demo-bucket/my-input-files/my-media-file.flac" }, "OutputBucketName": "amzn-s3-demo-bucket", "OutputKey": "my-output-files/", "LanguageCode": "en-US", "Settings": { "VocabularyName": "my-first-vocabulary" } }
Contoh ini menggunakan AWS SDK untuk Python (Boto3) untuk menyertakan kosakata khusus menggunakan Settings argumen untuk metode start_transcription_jobStartTranscriptionJob dan Settings.
Untuk contoh tambahan yang menggunakan AWS SDK, termasuk contoh khusus fitur, skenario, dan lintas layanan, lihat bagian ini. Contoh kode untuk Amazon Transcribe menggunakan AWS SDK
from __future__ import print_function import time import boto3 transcribe = boto3.client('transcribe', 'us-west-2') job_name = "my-first-transcription-job" job_uri = "s3://amzn-s3-demo-bucket/my-input-files/my-media-file.flac" transcribe.start_transcription_job( TranscriptionJobName = job_name, Media = { 'MediaFileUri': job_uri }, OutputBucketName = 'amzn-s3-demo-bucket', OutputKey = 'my-output-files/', LanguageCode = 'en-US', Settings = { 'VocabularyName': 'my-first-vocabulary' } ) while True: status = transcribe.get_transcription_job(TranscriptionJobName = job_name) if status['TranscriptionJob']['TranscriptionJobStatus'] in ['COMPLETED', 'FAILED']: break print("Not ready yet...") time.sleep(5) print(status)
Menggunakan kosakata khusus dalam transkripsi streaming
Untuk menggunakan kosakata khusus dengan transkripsi streaming, lihat contoh berikut ini:
-
Masuk ke Konsol Manajemen AWS
. -
Di panel navigasi, pilih Real-time transkripsi. Gulir ke bawah ke Kustomisasi dan perluas bidang ini jika diminimalkan.
-
Aktifkan kosakata kustom dan pilih kosakata kustom dari menu tarik-turun.
Sertakan pengaturan lain yang ingin Anda terapkan ke streaming Anda.
-
Anda sekarang siap untuk mentranskripsikan aliran Anda. Pilih Mulai streaming dan mulai berbicara. Untuk mengakhiri dikte Anda, pilih Hentikan streaming.
Contoh ini membuat HTTP/2 permintaan yang menyertakan kosakata kustom Anda. Untuk informasi lebih lanjut tentang menggunakan HTTP/2 streaming dengan Amazon Transcribe, lihatMenyiapkan HTTP/2 aliran. Untuk detail selengkapnya tentang parameter dan header khusus untuk Amazon Transcribe, lihat StartStreamTranscription.
POST /stream-transcription HTTP/2 host: transcribestreaming.us-west-2.amazonaws.com X-Amz-Target: com.amazonaws.transcribe.Transcribe.StartStreamTranscriptionContent-Type: application/vnd.amazon.eventstream X-Amz-Content-Sha256:stringX-Amz-Date:20220208T235959Z Authorization: AWS4-HMAC-SHA256 Credential=access-key/20220208/us-west-2/transcribe/aws4_request, SignedHeaders=content-type;host;x-amz-content-sha256;x-amz-date;x-amz-target;x-amz-security-token, Signature=stringx-amzn-transcribe-language-code:en-USx-amzn-transcribe-media-encoding:flacx-amzn-transcribe-sample-rate:16000x-amzn-transcribe-vocabulary-name:my-first-vocabularytransfer-encoding: chunked
Definisi parameter dapat ditemukan di Referensi API; parameter yang umum untuk semua operasi AWS API tercantum di bagian Parameter Umum.
Contoh ini membuat URL presigned yang menerapkan kosakata kustom Anda ke stream. WebSocket Jeda baris telah ditambahkan untuk keterbacaan. Untuk informasi selengkapnya tentang penggunaan WebSocket stream dengan Amazon Transcribe, lihatMenyiapkan WebSocket aliran. Untuk detail lebih lanjut tentang parameter, lihat StartStreamTranscription.
GET wss://transcribestreaming.us-west-2.amazonaws.com:8443/stream-transcription-websocket? &X-Amz-Algorithm=AWS4-HMAC-SHA256 &X-Amz-Credential=AKIAIOSFODNN7EXAMPLE%2F20220208%2Fus-west-2%2Ftranscribe%2Faws4_request &X-Amz-Date=20220208T235959Z &X-Amz-Expires=300&X-Amz-Security-Token=security-token&X-Amz-Signature=string&X-Amz-SignedHeaders=content-type%3Bhost%3Bx-amz-date &language-code=en-US&media-encoding=flac&sample-rate=16000&vocabulary-name=my-first-vocabulary
Definisi parameter dapat ditemukan di Referensi API; parameter yang umum untuk semua operasi AWS API tercantum di bagian Parameter Umum.