Membuat file teks untuk kosakata khusus medis Anda - Amazon Transcribe

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Membuat file teks untuk kosakata khusus medis Anda

Untuk membuat kosakata khusus, Anda membuat file teks yang dalam format UTF-8. Dalam file ini, Anda membuat tabel empat kolom, dengan setiap kolom menentukan bidang. Setiap bidang memberi tahu Amazon Transcribe Medis bagaimana istilah khusus domain diucapkan atau bagaimana menampilkan istilah-istilah ini dalam transkripsi Anda. Anda menyimpan file teks yang berisi bidang ini dalam Amazon S3 ember.

Memahami cara memformat file teks Anda

Untuk membuat kosakata khusus medis, Anda memasukkan nama kolom sebagai baris header. Anda memasukkan nilai untuk setiap kolom di bawah baris header.

Berikut ini adalah nama-nama dari empat kolom tabel:

  • Phrase- kolom diperlukan, nilai yang diperlukan

  • IPA- kolom diperlukan, nilai bisa opsional

  • SoundsLike- kolom diperlukan, nilai bisa opsional

  • DisplayAs- kolom diperlukan, nilai bisa opsional

Saat Anda membuat kosakata khusus, pastikan Anda:

  • Pisahkan setiap kolom dengan satu karakter Tab. Amazon Transcribe melempar pesan kesalahan jika Anda mencoba memisahkan kolom dengan spasi atau beberapa karakter Tab.

  • Pastikan tidak ada spasi tambahan atau spasi putih setelah setiap nilai dalam kolom.

Pastikan nilai yang Anda masukkan untuk setiap kolom:

Memasukkan nilai untuk kolom tabel

Informasi berikut menunjukkan cara menentukan nilai untuk empat kolom tabel:

  • Phrase— Kata atau frasa yang harus dikenali. Anda harus memasukkan nilai di kolom ini.

    Jika entri adalah frasa, pisahkan kata-kata dengan tanda hubung (-). Misalnya, masukkan cerebral autosomal dominant arteriopathy with subcortical infarcts and leukoencephalopathy sebagaicerebral-autosomal-dominant-arteriopathy-with-subcortical-infarcts-and-leukoencephalopathy.

    Masukkan akronim atau kata lain yang hurufnya harus diucapkan satu per satu sebagai huruf tunggal diikuti oleh titik-titik, seperti D.N.A. atau. S.T.E.M.I. Untuk memasukkan bentuk jamak akronim, seperti "STEMIs,” pisahkan “s” dari akronim dengan tanda hubung: "S.T.E.M.I-s" Anda dapat menggunakan huruf besar atau kecil untuk akronim.

    PhraseKolom diperlukan. Anda dapat menggunakan salah satu karakter yang diizinkan untuk bahasa input. Untuk karakter yang diizinkan, lihatSet karakter untuk Amazon Transcribe Medis. Jika Anda tidak menentukan DisplayAs kolom, Amazon Transcribe Medis menggunakan isi Phrase kolom dalam file output.

  • IPA(kolom diperlukan, nilai bisa opsional) - Untuk menentukan pengucapan kata atau frasa, Anda dapat menyertakan karakter dalam Alfabet Fonetik Internasional (IPA) di kolom ini. IPAKolom tidak dapat berisi spasi depan atau belakang, dan Anda harus menggunakan satu spasi untuk memisahkan setiap fonem dalam input. Misalnya, dalam bahasa Inggris Anda akan memasukkan frasa acute-respiratory-distress-syndrome sebagaiə k j u t ɹ ɛ s p ɪ ɹ ə t ɔ ɹ i d ɪ s t ɹ ɛ s s ɪ n d ɹ oʊ m. Anda akan memasukkan frasa A.L.L. sebagaieɪ ɛ l ɛ l.

    Bahkan jika Anda tidak menentukan isi IPA kolom, Anda harus menyertakan IPA kolom kosong. Jika Anda menyertakan nilai dalam IPA kolom, Anda tidak dapat memberikan nilai untuk SoundsLike kolom.

    Untuk daftar karakter IPA yang diizinkan untuk bahasa tertentu, lihatSet karakter untuk Amazon Transcribe Medis. Bahasa Inggris AS adalah satu-satunya bahasa yang tersedia di bidang Amazon Transcribe medis.

  • SoundsLike(kolom diperlukan, nilai bisa opsional) - Anda dapat memecah kata atau frasa menjadi segmen yang lebih kecil dan memberikan pengucapan untuk setiap segmen menggunakan ortografi standar bahasa untuk meniru cara kata itu terdengar. Misalnya, Anda dapat memberikan petunjuk pengucapan untuk frasa cerebral-autosomal-dominant-arteriopathy-with-subcortical-infarcts-and-leukoencephalopathy seperti ini:sir-e-brul-aut-o-som-ul-dah-mi-nant-ar-ter-ri-o-pa-thy-with-sub-cor-ti-cul-in-farcts-and-lewk-o-en-ce-phul-ah-pu-thy. Petunjuk untuk frasa tersebut atrioventricular-nodal-reentrant-tachycardia akan terlihat seperti ini:ay-tree-o-ven-trick-u-lar-node-al-re-entr-ant-tack-ih-card-ia. Anda memisahkan setiap bagian dari petunjuk dengan tanda hubung (-).

    Bahkan jika Anda tidak memberikan nilai untuk SoundsLike kolom, Anda harus menyertakan SoundsLike kolom kosong. Jika Anda menyertakan nilai dalam SoundsLike kolom, Anda tidak dapat memberikan nilai untuk IPA kolom.

    Anda dapat menggunakan salah satu karakter yang diizinkan untuk bahasa input. Untuk daftar karakter yang diizinkan, lihatSet karakter untuk Amazon Transcribe Medis.

  • DisplayAs(kolom diperlukan, nilai bisa opsional) - Mendefinisikan bagaimana kata atau frase terlihat ketika itu output. Misalnya, jika kata atau frasa itucerebral-autosomal-dominant-arteriopathy-with-subcortical-infarcts-and-leukoencephalopathy, Anda dapat menentukan formulir tampilan sebagaicerebral autosomal dominant arteriopathy with subcortical infarcts and leukoencephalopathy, sehingga tanda hubung tidak ada. Anda juga dapat menentukan DisplayAs CADASIL seolah-olah Anda ingin menampilkan akronim alih-alih istilah lengkap dalam output.

    Jika Anda tidak menentukan DisplayAs kolom, Amazon Transcribe Medis menggunakan Phrase kolom dari file input dalam output.

    Anda dapat menggunakan karakter UTF-8 apa pun di kolom. DisplayAs

Anda dapat menyertakan spasi hanya untuk nilai-nilai dalam IPA dan DisplayAs kolom.

Untuk membuat file teks kosakata kustom Anda, letakkan setiap kata atau frasa dalam file teks Anda pada baris terpisah. Pisahkan kolom dengan karakter Tab. Sertakan spasi hanya untuk nilai di DisplayAs kolom IPA dan. Simpan file dengan ekstensi .txt dalam Amazon S3 ember di tempat yang sama di Wilayah AWS mana Anda menggunakan Amazon Transcribe Medical untuk membuat kosakata khusus Anda.

Jika Anda mengedit file teks Anda di Windows, pastikan file Anda dalam LF format dan tidak dalam CRLF format. Jika tidak, Anda tidak akan dapat membuat kosakata khusus Anda. Beberapa editor teks memungkinkan Anda mengubah format dengan perintah Find and Replace.

Contoh berikut menunjukkan teks yang dapat Anda gunakan untuk membuat kosakata khusus. Untuk membuat kosakata kustom dari contoh-contoh ini, salin contoh ke editor teks, ganti [TAB] dengan karakter Tab, dan unggah file teks yang disimpan ke. Amazon S3

Phrase[TAB]IPA[TAB]SoundsLike[TAB]DisplayAs acute-respiratory-distress-syndrome[TAB][TAB][TAB]acute respiratory distress syndrome A.L.L.[TAB]eɪ ɛ l ɛ l[TAB][TAB]ALL atrioventricular-nodal-reentrant-tachycardia[TAB][TAB]ay-tree-o-ven-trick-u-lar-node-al-re-entr-ant-tack-ih-card-ia[TAB]

Anda dapat memasukkan kolom dalam urutan apa pun. Contoh berikut menunjukkan struktur valid lainnya untuk file input kosakata kustom.

Phrase[TAB]SoundsLike[TAB]IPA[TAB]DisplayAs acute-respiratory-distress-syndrome[TAB][TAB][TAB]acute respiratory distress syndrome A.L.L.[TAB][TAB]eɪ ɛ l ɛ l[TAB]ALL atrioventricular-nodal-reentrant-tachycardia[TAB]ay-tree-o-ven-trick-u-lar-node-al-re-entr-ant-tack-ih-card-ia[TAB][TAB]
DisplayAs[TAB]SoundsLike[TAB]IPA[TAB]Phrase acute respiratory distress syndrome[TAB][TAB][TAB]acute-respiratory-distress-syndrome ALL[TAB][TAB]eɪ ɛ l ɛ l[TAB]A.L.L. [TAB]ay-tree-o-ven-trick-u-lar-node-al-re-entr-ant-tack-ih-card-ia[TAB][TAB]atrioventricular-nodal-reentrant-tachycardia

Untuk kemudahan membaca, tabel berikut menunjukkan contoh sebelumnya dengan lebih jelas dalam format html. Mereka dimaksudkan hanya untuk menggambarkan contoh-contoh.

Frase IPA SoundsLike DisplayAs
acute-respiratory-distress-syndrome sindrom gangguan pernapasan akut
A.L.L. el ɛl SEMUA
atrioventricular-nodal-reentrant-tachycardia ay-tree-o-ven-trick-u-lar-node-al-re-entr-ant-tack-ih-card-ia
Frase SoundsLike IPA DisplayAs
acute-respiratory-distress-syndrome sindrom gangguan pernapasan akut
atrioventricular-nodal-reentrant-tachycardia ay-tree-o-ven-trick-u-lar-node-al-re-entr-ant-tack-ih-card-ia
A.L.L. el ɛl SEMUA
DisplayAs SoundsLike IPA Frase
sindrom gangguan pernapasan akut acute-respiratory-distress-syndrome
SEMUA el ɛl A.L.L.
ay-tree-o-ven-trick-u-lar-node-al-re-entr-ant-tack-ih-card-ia atrioventricular-nodal-reentrant-tachycardia