

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

# Wawasan
<a name="concepts-insights"></a>

Amazon Comprehend dapat menganalisis dokumen atau kumpulan dokumen untuk mengumpulkan wawasan tentang hal itu. Beberapa wawasan yang dikembangkan Amazon Comprehend tentang dokumen meliputi:
+ [Entitas](how-entities.md)Amazon Comprehend mengembalikan daftar entitas, seperti orang, tempat, dan lokasi, yang diidentifikasi dalam dokumen. 
+ [Peristiwa](how-events.md)— Amazon Comprehend mendeteksi jenis peristiwa tertentu dan detail terkait. 
+ [Frasa kunci](how-key-phrases.md)— Amazon Comprehend mengekstrak kata kunci yang muncul dalam dokumen. Misalnya, dokumen tentang permainan bola basket mungkin mengembalikan nama tim, nama tempat, dan skor akhir. 
+ [Informasi Identifikasi Pribadi (PII)](pii.md)Amazon Comprehend menganalisis dokumen untuk mendeteksi data pribadi yang mengidentifikasi seseorang, seperti alamat, nomor rekening bank, atau nomor telepon. 
+ [Bahasa yang dominan](how-languages.md)— Amazon Comprehend mengidentifikasi bahasa dominan dalam dokumen. Amazon Comprehend dapat mengidentifikasi 100 bahasa.
+ [Sentimen](how-sentiment.md) — Amazon Comprehend menentukan sentimen dominan suatu dokumen. Sentimen bisa positif, netral, negatif, atau campuran. 
+ [Sentimen Bertarget](how-targeted-sentiment.md) — Amazon Comprehend menentukan sentimen entitas tertentu yang disebutkan dalam dokumen. Sentimen dari setiap penyebutan bisa positif, netral, negatif, atau campuran. 
+ [Analisis sintaks](how-syntax.md)— Amazon Comprehend mem-parsing setiap kata dalam dokumen Anda dan menentukan bagian pidato untuk kata tersebut. Misalnya, dalam kalimat “Hujan hari ini di Seattle,” “itu” diidentifikasi sebagai kata ganti, “hujan” diidentifikasi sebagai kata kerja, dan “Seattle” diidentifikasi sebagai kata benda yang tepat. 

# Entitas
<a name="how-entities"></a>

*Entitas* adalah referensi tekstual untuk nama unik dari objek dunia nyata seperti orang, tempat, dan barang komersial, dan referensi yang tepat untuk ukuran seperti tanggal dan kuantitas.

Misalnya, dalam teks “John pindah ke 1313 Mockingbird Lane pada tahun 2012,” “John” mungkin diakui sebagai`PERSON`, “1313 Mockingbird Lane” mungkin diakui sebagai`LOCATION`, dan “2012" mungkin diakui sebagai a. `DATE`

Setiap entitas juga memiliki skor yang menunjukkan tingkat kepercayaan yang dimiliki Amazon Comprehend bahwa ia mendeteksi jenis entitas dengan benar. Anda dapat menyaring entitas dengan skor lebih rendah untuk mengurangi risiko menggunakan deteksi yang salah.

Tabel berikut mencantumkan jenis entitas. 


| Tipe | Deskripsi | 
| --- | --- | 
|  KOMERSIAL\$1ITEM  | Produk bermerek | 
|  DATE  | Tanggal lengkap (misalnya, 11/25/2017), hari (Selasa), bulan (Mei), atau waktu (8:30 pagi) | 
|  ACARA  | Acara, seperti festival, konser, pemilihan, dll. | 
|  LOKASI  | Lokasi tertentu, seperti negara, kota, danau, bangunan, dll. | 
|  ORGANISASI  | Organisasi besar, seperti pemerintah, perusahaan, agama, tim olahraga, dll. | 
|  LAINNYA  | Entitas yang tidak cocok dengan salah satu kategori entitas lainnya | 
|  PRIBADI  | Individu, kelompok orang, nama panggilan, karakter fiksi | 
|  KUANTITAS  | Jumlah terkuantifikasi, seperti mata uang, persentase, angka, byte, dll. | 
|  JUDUL  | Nama resmi yang diberikan untuk setiap kreasi atau karya kreatif, seperti film, buku, lagu, dll. | 

Operasi entitas deteksi dapat dilakukan menggunakan salah satu bahasa utama yang didukung oleh Amazon Comprehend. Ini hanya mencakup deteksi entitas yang telah ditentukan (non-kustom). Semua dokumen harus dalam bahasa yang sama.

Anda dapat menggunakan salah satu operasi API berikut untuk mendeteksi entitas dalam dokumen atau kumpulan dokumen.
+ [DetectEntities](https://docs.aws.amazon.com/comprehend/latest/APIReference/API_DetectEntities.html)
+  [BatchDetectEntities](https://docs.aws.amazon.com/comprehend/latest/APIReference/API_BatchDetectEntities.html)
+  [StartEntitiesDetectionJob](https://docs.aws.amazon.com/comprehend/latest/APIReference/API_StartEntitiesDetectionJob.html)

Operasi mengembalikan daftar objek [API Entity](https://docs.aws.amazon.com/comprehend/latest/APIReference/API_Entity.html), satu untuk setiap entitas dalam dokumen. `BatchDetectEntities`Operasi mengembalikan daftar `Entity` objek, satu daftar untuk setiap dokumen dalam batch. `StartEntitiesDetectionJob`Operasi memulai pekerjaan asinkron yang menghasilkan file yang berisi daftar `Entity` objek untuk setiap dokumen dalam pekerjaan.

Contoh berikut adalah respon dari `DetectEntities` operasi.

```
{
    "Entities": [
        {
            "Text": "today",
            "Score": 0.97,
            "Type": "DATE",
            "BeginOffset": 14,
            "EndOffset": 19
        },
        {
            "Text": "Seattle",
            "Score": 0.95,
            "Type": "LOCATION",
            "BeginOffset": 23,
            "EndOffset": 30
        }
    ],
    "LanguageCode": "en"
}
```

# Peristiwa
<a name="how-events"></a>

**catatan**  
Amazon Comprehend pemodelan topik, deteksi peristiwa, dan fitur klasifikasi keselamatan yang cepat tidak akan lagi tersedia untuk pelanggan baru, efektif 30 April 2026. Jika Anda ingin menggunakan fitur ini dengan akun baru, harap lakukan sebelum tanggal ini. Tidak ada tindakan yang diperlukan untuk akun yang telah menggunakan fitur ini dalam 12 bulan terakhir. Untuk informasi selengkapnya, lihat [Amazon Comprehend perubahan ketersediaan fitur](comprehend-availability-change.md).

Gunakan *deteksi peristiwa* untuk menganalisis dokumen teks untuk jenis peristiwa tertentu dan entitas terkait. Amazon Comprehend mendukung deteksi peristiwa di seluruh koleksi besar dokumen menggunakan pekerjaan analisis asinkron. Untuk informasi selengkapnya tentang peristiwa, termasuk contoh pekerjaan analisis acara, lihat [Mengumumkan peluncuran Amazon Comprehend](https://aws.amazon.com/blogs/machine-learning/announcing-the-launch-of-amazon-comprehend-events/) Events

## Entitas
<a name="how-events-entities"></a>

Dari teks input, Amazon Comprehend mengekstrak daftar entitas yang terkait dengan peristiwa yang terdeteksi. *Entitas* dapat menjadi objek dunia nyata, seperti orang, tempat, atau lokasi; entitas juga bisa menjadi konsep, seperti pengukuran, tanggal, atau kuantitas. Setiap kemunculan suatu entitas diidentifikasi dengan *penyebutan*, yang merupakan referensi tekstual ke entitas dalam teks input. Untuk setiap entitas unik, semua sebutan dikelompokkan ke dalam daftar. Daftar ini memberikan rincian untuk setiap lokasi dalam teks input tempat entitas terjadi. Amazon Comprehend hanya mendeteksi entitas yang terkait dengan jenis peristiwa yang didukung.

Setiap entitas yang terkait dengan jenis acara yang didukung akan menampilkan rincian terkait berikut:
+ **Sebutan**: Detail untuk setiap kemunculan entitas yang sama dalam teks input.
  + **BeginOffset**: Offset karakter dalam teks input yang menunjukkan di mana penyebutan dimulai (karakter pertama berada di posisi 0). 
  + **EndOffset**: Sebuah karakter offset dalam teks input yang menunjukkan di mana penyebutan berakhir.
  + **Skor**: Tingkat kepercayaan yang dimiliki Amazon Comprehend dalam keakuratan jenis entitas.
  + **GroupScore**: Tingkat kepercayaan dari Amazon Comprehend bahwa penyebutan dikelompokkan dengan benar dengan sebutan lain dari entitas yang sama.
  + **Teks**: Teks entitas.
  + **Jenis**: Tipe entitas. Untuk semua jenis entitas yang didukung, lihat[Jenis entitas](#events-entity-types).

## Peristiwa
<a name="how-events-output"></a>

Amazon Comprehend mengembalikan daftar peristiwa (jenis peristiwa yang didukung) yang dideteksi dalam teks input. Setiap acara kembali dengan rincian terkait berikut:
+ **Jenis**: Jenis acara. Untuk semua jenis acara yang didukung, lihat[Tipe peristiwa](#events-types).
+ **Argumen**: Daftar argumen yang terkait dengan peristiwa yang terdeteksi. *Argumen* terdiri dari entitas yang terkait dengan peristiwa yang terdeteksi. Peran argumen menggambarkan hubungan, seperti *siapa yang* melakukan *apa*, *di mana* dan *kapan*.
  + **EntityIndex**: Nilai indeks yang mengidentifikasi entitas dari daftar entitas yang Amazon Comprehend kembalikan untuk analisis ini.
  + **Peran**: Jenis argumen, yang menjelaskan bagaimana entitas untuk argumen ini terkait dengan peristiwa. Untuk semua tipe argumen yang didukung, lihat[Jenis argumen](#events-argument-types).
  + **Skor**: Tingkat kepercayaan yang dimiliki Amazon Comprehend dalam keakuratan deteksi peran.
+ **Pemicu**: Daftar pemicu untuk peristiwa yang terdeteksi. *Pemicu* adalah satu kata atau frasa yang menunjukkan terjadinya peristiwa tersebut.
  + **BeginOffset**: Offset karakter dalam teks input yang menunjukkan di mana pemicu dimulai (karakter pertama berada di posisi 0).
  + **EndOffset**: Sebuah karakter offset dalam teks input yang menunjukkan di mana pemicu berakhir.
  + **Skor**: Tingkat kepercayaan yang dimiliki Amazon Comprehend dalam keakuratan deteksi.
  + **Teks**: Teks pemicu.
  + **GroupScore**: Tingkat kepercayaan dari Amazon Comprehend bahwa pemicunya dikelompokkan dengan benar dengan pemicu lain untuk acara yang sama.
  + **Jenis**: Jenis peristiwa yang ditunjukkan oleh pemicu ini.

## Mendeteksi format hasil acara
<a name="how-events-results"></a>

Ketika pekerjaan deteksi peristiwa Anda selesai, Amazon Comprehend menulis hasil analisis ke lokasi keluaran Amazon S3 yang Anda tentukan saat memulai pekerjaan.

Untuk setiap peristiwa yang terdeteksi, output memberikan detail dalam format berikut:

```
{
   "Entities": [
     {
       "Mentions": [
         {
           "BeginOffset": number,
           "EndOffset": number,
           "Score": number,
           "GroupScore": number,
           "Text": "string",
           "Type": "string"
         }, ...
       ]    
     }, ...
   ],
   "Events": [
     {
       "Type": "string",
       "Arguments": [
         {                   
           "EntityIndex": number,   
           "Role": "string",
           "Score": number
         }, ...
       ],
       "Triggers": [
         {
           "BeginOffset": number,
           "EndOffset": number,
           "Score": number,
           "Text": "string",
           "GroupScore": number,
           "Type": "string"
         }, ...
       ]
     }, ...
   ]
 }
```

## Tipe yang didukung untuk entitas, peristiwa, dan argumen
<a name="events-reference-types"></a>

### Jenis entitas
<a name="events-entity-types"></a>


| Tipe | Deskripsi | 
| --- | --- | 
| DATE | Referensi apa pun ke tanggal atau waktu, baik spesifik maupun umum. | 
| FASILITAS | Bangunan, bandara, jalan raya, jembatan, dan struktur buatan manusia permanen lainnya dan perbaikan real estat. | 
| LOKASI | Lokasi fisik seperti jalan, kota, negara bagian, negara, badan air, atau koordinat geografis. | 
| NILAI MONETER | Nilai sesuatu di AS atau mata uang lainnya. Nilainya bisa spesifik atau perkiraan. | 
| ORGANISASI | Perusahaan dan kelompok orang lain yang ditentukan oleh struktur organisasi yang mapan. | 
| PRIBADI | Nama atau nama panggilan individu atau karakter fiksi. | 
| PERSON\$1TITLE | Setiap gelar yang menggambarkan seseorang, yang biasanya merupakan kategori pekerjaan (seperti CEO) atau kehormatan (seperti Mr.). | 
| KUANTITAS | Angka atau nilai dan satuan pengukuran. | 
| STOCK\$1CODE | Simbol ticker saham, seperti AMZN, International Securities Identification Number (ISIN), Committee on Uniform Securities Identification Procedures (CUSIP), atau Stock Exchange Daily Official List (SEDOL). | 

### Tipe peristiwa
<a name="events-types"></a>


| Tipe | Deskripsi | 
| --- | --- | 
| KEBANGKRUTAN | Proses hukum yang melibatkan seseorang atau perusahaan yang tidak dapat membayar hutang yang belum dibayar. | 
| PEKERJAAN | Terjadi ketika seorang karyawan dipekerjakan, dipecat, pensiun, atau mengubah status pekerjaan.  | 
| KORPORASI\$1AKUISISI | Terjadi ketika sebuah perusahaan memperoleh kepemilikan sebagian besar atau seluruh saham perusahaan lain atau aset fisik untuk mendapatkan kendali atas perusahaan itu. | 
| INVESTMENT\$1GENERAL | Terjadi ketika seseorang atau perusahaan membeli aset dengan prospek menghasilkan pendapatan atau apresiasi masa depan. | 
| PERUSAHAAN\$1MERGER | Terjadi ketika dua atau lebih perusahaan bersatu untuk membuat badan hukum baru.  | 
| IPO | Penawaran umum perdana (IPO) saham perusahaan swasta kepada publik dalam penerbitan saham baru. | 
| RIGHTS\$1ISSUE | Sekelompok hak yang ditawarkan kepada pemegang saham yang ada untuk membeli saham tambahan, yang dikenal sebagai waran berlangganan, sebanding dengan kepemilikan mereka yang ada. | 
| PENAWARAN SEKUNDER | Tawaran sekuritas oleh pemegang saham perusahaan.  | 
| SHELF\$1OFFERING | Ketentuan Securities and Exchange Commission (SEC) yang memungkinkan penerbit untuk mendaftarkan masalah keamanan baru dan menjual bagian dari masalah selama periode waktu tertentu tanpa mendaftarkan kembali sekuritas atau menimbulkan penalti. Juga dikenal sebagai registrasi rak. | 
| TENDER\$1OFFERING | Tawaran untuk membeli sebagian atau semua saham pemegang saham di perusahaan. | 
| STOCK\$1SPLIT | Terjadi ketika dewan direksi perusahaan meningkatkan jumlah saham yang beredar dengan menerbitkan lebih banyak saham kepada pemegang saham saat ini. Acara ini juga berlaku untuk reverse stock split. | 

### Jenis argumen
<a name="events-argument-types"></a>


**Jenis argumen untuk KEBANGKRUTAN**  

| Jenis Argumen | Deskripsi | 
| --- | --- | 
| FILER | Orang atau perusahaan yang mengajukan kebangkrutan.  | 
| DATE | Tanggal atau waktu kebangkrutan. | 
| TEMPAT | Lokasi atau fasilitas di mana (atau terdekat dengan tempat) kebangkrutan terjadi. | 


**Jenis argumen untuk KETENAGAKERJAAN**  

| Tipe | Deskripsi | 
| --- | --- | 
| KARYAWAN | Orang yang dipekerjakan oleh perusahaan. | 
| KARYAWAN\$1TITLE | Judul karyawan. | 
| MAJIKAN | Orang atau perusahaan yang mempekerjakan karyawan. | 
| START\$1DATE | Tanggal mulai atau waktu kerja. | 
| TANGGAL AKHIR | Tanggal akhir atau waktu kerja. | 


**Jenis argumen untuk CORPORATE\$1ACQUICTION, INVESTMENT\$1GENERAL**  

| Tipe | Deskripsi | 
| --- | --- | 
| JUMLAH | Nilai moneter yang terkait dengan transaksi. | 
| BERINVESTASI | Orang atau perusahaan yang terkait dengan investasi. | 
| INVESTOR | Orang atau perusahaan yang berinvestasi dalam aset tersebut. | 
| DATE | Tanggal atau waktu akuisisi atau investasi. | 
| TEMPAT | Lokasi di mana (atau terdekat dengan tempat) akuisisi atau investasi berlangsung. | 


**Jenis argumen untuk CORPORATE\$1MERGER**  

| Tipe | Deskripsi | 
| --- | --- | 
| DATE | Tanggal atau waktu merger. | 
| NEW\$1PERUSAHAAN | Badan hukum baru yang dihasilkan dari merger. | 
| PESERTA | Perusahaan yang terlibat dalam merger. | 


**Jenis argumen untuk IPO, RIGHTS\$1ISSUE, SECONDARY\$1OFFERING, SHELF\$1OFFERING, TENDER\$1OFFERING**  

| Tipe | Deskripsi | 
| --- | --- | 
| TANGGAL KEDALUWARSA\$1 | Tanggal kedaluwarsa atau waktu penawaran. | 
| INVESTOR | Orang atau perusahaan yang berinvestasi dalam aset tersebut. | 
| PENERIMA | Orang atau perusahaan yang menerima penawaran. | 
| MENAWARKAN\$1AMOUNT | Nilai moneter yang terkait dengan penawaran. | 
| PENAWARAN\$1DATE | Tanggal atau waktu penawaran. | 
| PEMBERI PENAWARAN | Orang atau perusahaan yang memulai penawaran. | 
| OFFEROR\$1TOTAL\$1VALUE | Total nilai moneter yang terkait dengan penawaran. | 
| RECORD\$1DATE | Catatan tanggal atau waktu penawaran. | 
| AGEN PENJUAL | Orang atau perusahaan yang memfasilitasi penjualan penawaran.  | 
| SHARE\$1PRICE | Nilai moneter yang terkait dengan harga saham. | 
| SHARE\$1QUANTITY | Jumlah saham yang terkait dengan penawaran. | 
| PENJAMIN EMISI | Perusahaan yang terkait dengan penjaminan penawaran. | 


**Jenis argumen untuk STOCK\$1SPLIT**  

| Tipe | Deskripsi | 
| --- | --- | 
| PERUSAHAAN | Perusahaan menerbitkan saham dari stock split. | 
| DATE | Tanggal atau waktu stock split. | 
| RASIO SPLIT\$1 | Rasio peningkatan jumlah saham baru yang beredar terhadap jumlah saham saat ini sebelum stock split.  | 

# Frasa kunci
<a name="how-key-phrases"></a>

*Frasa kunci* adalah string yang berisi frase kata benda yang menggambarkan hal tertentu. Biasanya terdiri dari kata benda dan pengubah yang membedakannya. Misalnya, “hari” adalah kata benda; “hari yang indah” adalah frasa kata benda yang mencakup artikel (“a”) dan kata sifat (“indah”). Setiap frase kunci mencakup skor yang menunjukkan tingkat kepercayaan yang dimiliki Amazon Comprehend bahwa string adalah frasa kata benda. Anda dapat menggunakan skor untuk menentukan apakah deteksi memiliki kepercayaan diri yang cukup tinggi untuk aplikasi Anda.

Operasi deteksi kata kunci dapat dilakukan menggunakan salah satu bahasa utama yang didukung oleh Amazon Comprehend. Semua dokumen harus dalam bahasa yang sama.

Anda dapat menggunakan salah satu operasi berikut untuk mendeteksi frasa kunci dalam dokumen atau kumpulan dokumen.
+ [DetectKeyPhrases](https://docs.aws.amazon.com/comprehend/latest/APIReference/API_DetectKeyPhrases.html)
+  [BatchDetectKeyPhrases](https://docs.aws.amazon.com/comprehend/latest/APIReference/API_BatchDetectKeyPhrases.html)
+  [StartKeyPhrasesDetectionJob](https://docs.aws.amazon.com/comprehend/latest/APIReference/API_StartKeyPhrasesDetectionJob.html)

Operasi mengembalikan daftar [KeyPhrase](https://docs.aws.amazon.com/comprehend/latest/APIReference/API_KeyPhrase.html)objek, satu untuk setiap frase kunci dalam dokumen. `BatchDetectKeyPhrases`Operasi mengembalikan daftar `KeyPhrase` objek, satu untuk setiap dokumen dalam batch. `StartKeyPhrasesDetectionJob`Operasi memulai pekerjaan asinkron yang menghasilkan file yang berisi daftar `KeyPhrase` objek untuk setiap dokumen dalam pekerjaan.

Contoh berikut adalah respon dari `DetectKeyPhrases` operasi.

```
{
    "LanguageCode": "en",
    "KeyPhrases": [
        {
            "Text": "today",
            "Score": 0.89,
            "BeginOffset": 14,
            "EndOffset": 19
        },
        {
            "Text": "Seattle",
            "Score": 0.91,
            "BeginOffset": 23,
            "EndOffset": 30
        }
    ]
}
```

# Bahasa yang dominan
<a name="how-languages"></a>

Anda dapat menggunakan Amazon Comprehend untuk memeriksa teks untuk menentukan bahasa dominan. Amazon Comprehend mengidentifikasi bahasa menggunakan pengidentifikasi dari RFC 5646 — jika ada pengidentifikasi ISO 639-1 2 huruf, dengan subtag regional jika perlu, ia menggunakannya. Jika tidak, ia menggunakan kode 3 huruf ISO 639-2. 

Untuk informasi selengkapnya tentang RFC 5646, lihat [Tag untuk mengidentifikasi bahasa di situs web](https://tools.ietf.org/html/rfc5646) *IETF Tools*.

Tanggapan tersebut mencakup skor yang menunjukkan tingkat kepercayaan yang dimiliki Amazon Comprehend bahwa bahasa tertentu adalah bahasa dominan dalam dokumen. Setiap skor tidak tergantung pada skor lainnya. Skor tidak menunjukkan bahwa bahasa membentuk persentase tertentu dari dokumen.

Jika dokumen panjang (seperti buku) berisi beberapa bahasa, Anda dapat memecah dokumen panjang menjadi potongan-potongan kecil dan menjalankan `DetectDominantLanguage` operasi pada masing-masing bagian. Anda kemudian dapat menggabungkan hasil untuk menentukan persentase setiap bahasa dalam dokumen yang lebih panjang.

Amazon Comprehend deteksi bahasa memiliki batasan sebagai berikut:
+ Itu tidak mendukung deteksi bahasa fonetik. Misalnya, ia tidak mendeteksi “arigato” sebagai bahasa Jepang atau “nihao” sebagai bahasa Mandarin.
+ Ini mungkin memiliki perbedaan yang membedakan pasangan bahasa dekat, seperti Indonesia dan Melayu; atau Bosnia, Kroasia, dan Serbia.
+ Untuk hasil terbaik, berikan setidaknya 20 karakter teks input.

Amazon Comprehend mendeteksi bahasa-bahasa berikut.


| Kode | Bahasa | 
| --- | --- | 
| af | Afrikaans | 
| am | Amharik | 
| ar | Arab | 
| as | orang Assam | 
| az | Orang Azerbaijan | 
| ba | Bashkir | 
| be | Belarusia | 
| bn | Bengali | 
| bs | Orang Bosnia | 
| bg | Bulgaria | 
| ca | bahasa katala | 
| ceb | Cebuano | 
| cs | Bahasa Ceko | 
| cv | Chuvash | 
| cy | Welsh | 
| da | Orang Denmark | 
| de | Bahasa Jerman | 
| el | Yunani | 
| en | Bahasa Inggris | 
| eo | Esperanto | 
| et | Estonia | 
| eu | Basque | 
| fa | Persia | 
| fi | orang Finlandia | 
| fr | Prancis | 
| gd | Gaelik Skotlandia | 
| ga | orang Irlandia | 
| gl | Galicia | 
| gu | Gujarat | 
| ht | Haiti | 
| he | Ibrani | 
| ha | Hausa | 
| hi | bahasa Hindi | 
| hr | orang Kroasia | 
| hu | Bahasa Hungaria | 
| hy | Orang Armenia | 
| ilo | Iloko | 
| id | orang Indonesia | 
| is | Islandia | 
| it | Bahasa Italia | 
| jv | Orang Jawa | 
| ja | Bahasa Jepang | 
| kn | Kannada | 
| ka | Orang Georgia | 
| kk | Kazakh | 
| km | Khmer Tengah | 
| ky | Kirghiz | 
| ko | Bahasa Korea | 
| ku | bahasa Kurdi | 
| lo | Lao | 
| la | bahasa Latin | 
| lv | Latvia | 
| lt | Lituania | 
| lb | Luksemburg | 
| ml | Malayalam | 
| mt | Malta | 
| mr | Marathi | 
| mk | Makedonia | 
| mg | Malagasi | 
| mn | Mongolia | 
| ms | Melayu | 
| my | Burma | 
| ne | Nepal | 
| new | Newari | 
| nl | Bahasa Belanda | 
| no | Norwegia | 
| or | Oriya | 
| om | Oromo | 
| pa | Punjabi | 
| pl | Polandia | 
| pt | Bahasa Portugis | 
| ps | Pushto | 
| qu | Quechua | 
| ro | Rumania | 
| ru | Bahasa Rusia | 
| sa | Sansekerta | 
| si | Sinhala | 
| sk | Orang Slovakia | 
| sl | Bahasa Slovenia | 
| sd | Sindhi | 
| so | Somalia | 
| es | Bahasa Spanyol | 
| sq | bahasa Albania | 
| sr | Serbia | 
| su | Sunda | 
| sw | Swahili | 
| sv | Bahasa Swedia | 
| ta | Tamil | 
| tt | Tatar | 
| te | Telugu | 
| tg | Tajik | 
| tl | Tagalog | 
| th | Thai | 
| tk | Turkmenistan | 
| tr | Turki | 
| ug | Uighur | 
| uk | orang Ukraina | 
| ur | Urdu | 
| uz | Uzbekistan | 
| vi | Vietnam | 
| yi | Bahasa Yiddish | 
| yo | Yoruba | 
| zh | Mandarin (Sederhana) | 
| zh-TW | Mandarin (Tradisional) | 

Anda dapat menggunakan salah satu operasi berikut untuk mendeteksi bahasa dominan dalam dokumen atau kumpulan dokumen.
+  [DetectDominantLanguage](https://docs.aws.amazon.com/comprehend/latest/APIReference/API_DetectDominantLanguage.html)
+  [BatchDetectDominantLanguage](https://docs.aws.amazon.com/comprehend/latest/APIReference/API_BatchDetectDominantLanguage.html)
+  [StartDominantLanguageDetectionJob](https://docs.aws.amazon.com/comprehend/latest/APIReference/API_StartDominantLanguageDetectionJob.html)

`DetectDominantLanguage`Operasi mengembalikan [DominantLanguage](https://docs.aws.amazon.com/comprehend/latest/APIReference/API_DominantLanguage.html)objek. `BatchDetectDominantLanguage`Operasi mengembalikan daftar `DominantLanguage` objek, satu untuk setiap dokumen dalam batch. `StartDominantLanguageDetectionJob`Operasi memulai pekerjaan asinkron yang menghasilkan file yang berisi daftar `DominantLanguage` objek, satu untuk setiap dokumen dalam pekerjaan.

Contoh berikut adalah respon dari `DetectDominantLanguage` operasi.

```
{
    "Languages": [
        {
            "LanguageCode": "en",
            "Score": 0.9793661236763
        }
    ]
}
```

# Sentimen
<a name="how-sentiment"></a>

Gunakan Amazon Comprehend untuk menentukan sentimen konten dalam dokumen teks yang disandikan UTF-8. Misalnya, Anda dapat menggunakan analisis sentimen untuk menentukan sentimen komentar pada posting blog untuk menentukan apakah pembaca Anda menyukai posting tersebut.

Anda dapat menentukan sentimen untuk dokumen dalam salah satu bahasa utama yang didukung oleh Amazon Comprehend. Semua dokumen dalam satu pekerjaan harus dalam bahasa yang sama.

Penentuan sentimen mengembalikan nilai-nilai berikut:
+ **Positif** — Teks mengekspresikan sentimen positif secara keseluruhan.
+ **Negatif** — Teks mengekspresikan sentimen negatif secara keseluruhan.
+ **Campuran** — Teks mengekspresikan sentimen positif dan negatif.
+ **Netral** — Teks tidak mengungkapkan sentimen positif atau negatif.

Anda dapat menggunakan salah satu operasi API berikut untuk mendeteksi sentimen dokumen atau sekumpulan dokumen.
+ [DetectSentiment](https://docs.aws.amazon.com/comprehend/latest/APIReference/API_DetectSentiment.html)
+  [BatchDetectSentiment](https://docs.aws.amazon.com/comprehend/latest/APIReference/API_BatchDetectSentiment.html)
+  [StartSentimentDetectionJob](https://docs.aws.amazon.com/comprehend/latest/APIReference/API_StartSentimentDetectionJob.html)

Operasi mengembalikan sentimen yang paling mungkin untuk teks dan skor untuk masing-masing sentimen. Skor mewakili kemungkinan bahwa sentimen terdeteksi dengan benar. Misalnya, dalam contoh di bawah ini kemungkinan 95 persen teks tersebut memiliki `Positive` sentimen. Ada kemungkinan kurang dari 1 persen bahwa teks memiliki `Negative` sentimen. Anda dapat menggunakan `SentimentScore` untuk menentukan apakah keakuratan deteksi memenuhi kebutuhan aplikasi Anda.

`DetectSentiment`Operasi mengembalikan objek yang berisi sentimen terdeteksi dan [SentimentScore](https://docs.aws.amazon.com/comprehend/latest/APIReference/API_SentimentScore.html)objek. `BatchDetectSentiment`Operasi mengembalikan daftar sentimen dan `SentimentScore` objek, satu untuk setiap dokumen dalam batch. `StartSentimentDetectionJob`Operasi memulai pekerjaan asinkron yang menghasilkan file yang berisi daftar sentimen dan `SentimentScore` objek, satu untuk setiap dokumen dalam pekerjaan.

Contoh berikut adalah respon dari `DetectSentiment` operasi.

```
{
"SentimentScore": {
        "Mixed": 0.030585512690246105,
        "Positive": 0.94992071056365967,
        "Neutral": 0.0141543131828308,
        "Negative": 0.00893945890665054
    },
    "Sentiment": "POSITIVE",
    "LanguageCode": "en"
}
```

# Sentimen yang ditargetkan
<a name="how-targeted-sentiment"></a>

*Sentimen yang ditargetkan* memberikan pemahaman terperinci tentang sentimen yang terkait dengan entitas tertentu (seperti merek atau produk) dalam dokumen masukan Anda. 

Perbedaan antara sentimen dan [sentimen](how-sentiment.md) yang ditargetkan adalah tingkat granularitas dalam data output. Analisis sentimen menentukan sentimen dominan untuk setiap dokumen masukan, tetapi tidak menyediakan data untuk analisis lebih lanjut. Analisis sentimen yang ditargetkan menentukan sentimen tingkat entitas untuk entitas tertentu di setiap dokumen input. Anda dapat menganalisis data output untuk menentukan produk dan layanan tertentu yang mendapatkan umpan balik positif atau negatif.

Misalnya, dalam serangkaian ulasan restoran, pelanggan memberikan ulasan berikut: “Taco itu enak dan stafnya ramah.” Analisis ulasan ini menghasilkan hasil sebagai berikut: 
+ **Analisis sentimen** menentukan apakah sentimen keseluruhan dari setiap ulasan restoran positif, negatif, netral, atau campuran. Dalam contoh ini, sentimen keseluruhan positif. 
+ **Analisis sentimen yang ditargetkan** menentukan sentimen untuk entitas dan atribut restoran yang disebutkan pelanggan dalam ulasan. Dalam contoh ini, pelanggan membuat komentar positif tentang “taco” dan “staf”. 

Sentimen yang ditargetkan memberikan output berikut untuk setiap pekerjaan analisis:
+ Identitas entitas yang disebutkan dalam dokumen.
+ Klasifikasi jenis entitas untuk setiap entitas yang disebutkan.
+ Sentimen dan skor sentimen untuk setiap entitas disebutkan.
+ Kelompok penyebutan (kelompok referensi bersama) yang sesuai dengan satu entitas.

Anda dapat menggunakan [konsol](get-started-console.md) atau [API](using-api-targeted-sentiment.md) untuk menjalankan analisis sentimen yang ditargetkan. Konsol dan API mendukung analisis real-time dan analisis asinkron untuk sentimen yang ditargetkan.

 Amazon Comprehend mendukung sentimen yang ditargetkan untuk dokumen dalam bahasa Inggris. 

Untuk informasi tambahan tentang sentimen yang ditargetkan, termasuk tutorial, lihat [Ekstrak sentimen granular dalam teks dengan Amazon Comprehend Targeted Sentiment di](https://aws.amazon.com/blogs/machine-learning/extract-granular-sentiment-in-text-with-amazon-comprehend-targeted-sentiment/) blog pembelajaran mesin. AWS 

**Topics**
+ [

## Jenis entitas
](#how-targeted-sentiment-entities)
+ [

## Kelompok referensi bersama
](#how-targeted-sentiment-values)
+ [

## Organisasi file keluaran
](#how-targeted-sentiment-output)
+ [

## Analisis waktu nyata menggunakan konsol
](#how-targeted-sentiment-console)
+ [

## Contoh output sentimen yang ditargetkan
](#how-targeted-sentiment-example)

## Jenis entitas
<a name="how-targeted-sentiment-entities"></a>

Sentimen yang ditargetkan mengidentifikasi jenis entitas berikut. Ini menetapkan jenis entitas OTHER jika entitas tidak termasuk dalam kategori lain. Setiap entitas yang disebutkan dalam file output mencakup jenis entitas, seperti`"Type": "PERSON"`.


**Definisi tipe entitas**  

| Jenis Entitas | Definisi | 
| --- | --- | 
| PRIBADI | Contohnya termasuk individu, kelompok orang, nama panggilan, karakter fiksi, dan nama hewan. | 
| LOKASI | Lokasi geografis seperti negara, kota, negara bagian, alamat, formasi geologi, badan air, landmark alam, dan lokasi astronomi. | 
| ORGANISASI | Contohnya termasuk pemerintah, perusahaan, tim olahraga, dan agama. | 
| FASILITAS | Bangunan, bandara, jalan raya, jembatan, dan struktur buatan manusia permanen lainnya dan perbaikan real estat. | 
| MEREK | Organisasi, kelompok, atau produsen barang komersial tertentu atau lini produk. | 
| BARANG\$1KOMERSIAL | Setiap barang non-generik yang dapat dibeli atau diperoleh, termasuk kendaraan, dan produk besar yang hanya memiliki satu barang yang diproduksi. | 
| FILM | Sebuah film atau acara televisi. Entitas bisa berupa nama lengkap, nama panggilan, atau subtitle. | 
| MUSIK | Sebuah lagu, penuh atau sebagian. Juga, koleksi kreasi musik individu, seperti album atau antologi. | 
| BUKU | Sebuah buku, diterbitkan secara profesional atau diterbitkan sendiri. | 
| PERANGKAT LUNAK | Produk perangkat lunak yang dirilis secara resmi. | 
| GIM | Sebuah permainan, seperti video game, permainan papan, permainan umum, atau olahraga. | 
| PERSONAL\$1TITLE | Gelar dan kehormatan resmi seperti Presiden, PhD, atau Dr. | 
| ACARA | Contohnya termasuk festival, konser, pemilihan, perang, konferensi, dan acara promosi. | 
| DATE | Setiap referensi ke tanggal atau waktu, apakah spesifik atau umum, apakah absolut atau relatif. | 
| KUANTITAS | Semua pengukuran bersama dengan unitnya (mata uang, persen, angka, byte, dll.). | 
| TAMBAHAN | Atribut, karakteristik, atau sifat suatu entitas, seperti “kualitas” suatu produk, “harga” telepon, atau “kecepatan” CPU. | 
| LAINNYA | Entitas yang tidak termasuk dalam kategori lainnya. | 

## Kelompok referensi bersama
<a name="how-targeted-sentiment-values"></a>

Sentimen yang ditargetkan mengidentifikasi kelompok referensi bersama di setiap dokumen masukan. Kelompok referensi bersama adalah sekelompok penyebutan dalam dokumen yang sesuai dengan satu entitas dunia nyata.

**Example**  
Dalam contoh ulasan pelanggan berikut, “spa” adalah entitas, yang memiliki tipe entitas`FACILITY`. Entitas memiliki dua sebutan tambahan sebagai kata ganti (“it”).   

![\[Kelompok referensi bersama sentimen yang ditargetkan.\]](http://docs.aws.amazon.com/id_id/comprehend/latest/dg/images/gs-console-targeted-sentiment4.png)


## Organisasi file keluaran
<a name="how-targeted-sentiment-output"></a>

Pekerjaan analisis sentimen yang ditargetkan membuat file keluaran teks JSON. File berisi satu objek JSON untuk setiap dokumen masukan. Setiap objek JSON berisi bidang-bidang berikut:
+ **Entitas** — Array entitas yang ditemukan dalam dokumen. 
+ **File** — Nama file dari dokumen input.
+ **Baris** - Jika file input adalah satu dokumen per baris, **Entitas** berisi nomor baris dokumen dalam file.

**catatan**  
Jika sentimen yang ditargetkan tidak mengidentifikasi entitas apa pun dalam teks input, ia mengembalikan array kosong sebagai hasil Entitas.

Contoh berikut menunjukkan **Entitas** untuk file input dengan tiga baris input. Format input adalah **ONE\$1DOC\$1PER\$1LINE, sehingga setiap baris** input adalah dokumen.

```
{ "Entities":[
    {entityA},
    {entityB},
    {entityC}
    ],
  "File": "TargetSentimentInputDocs.txt",
  "Line": 0
}
{ "Entities": [
    {entityD},
    {entityE}
  ],
  "File": "TargetSentimentInputDocs.txt",
  "Line": 1
}
{ "Entities": [
    {entityF},
    {entityG}
    ],
  "File": "TargetSentimentInputDocs.txt",
  "Line": 2
}
```



Entitas dalam larik **Entitas** mencakup pengelompokan logis (disebut grup referensi bersama) dari entitas yang disebutkan terdeteksi dalam dokumen. Setiap entitas memiliki struktur keseluruhan sebagai berikut:

```
{"DescriptiveMentionIndex": [0],
  "Mentions": [
     {mentionD},
     {mentionE}
    ]
}
```

Entitas berisi bidang-bidang ini:
+ **Sebutan** — Array penyebutan entitas dalam dokumen. Array mewakili grup referensi bersama. Lihat [Kelompok referensi bersama](#how-targeted-sentiment-values) sebagai contoh. Urutan penyebutan dalam array Mentions adalah urutan lokasi mereka (offset) dalam dokumen. Setiap penyebutan mencakup skor sentimen dan skor kelompok untuk penyebutan itu. Skor kelompok menunjukkan tingkat kepercayaan bahwa penyebutan ini milik entitas yang sama.
+ **DescriptiveMentionIndex**— Satu atau lebih indeks ke dalam array Mentions yang memberikan nama terbaik untuk grup entitas. Misalnya, entitas dapat memiliki tiga sebutan dengan nilai **Teks** “ABC Hotel,” “ABC Hotel,” dan “it.” Nama terbaik adalah “ABC Hotel,” yang memiliki DescriptiveMentionIndex nilai [0,1]. 

Setiap penyebutan mencakup bidang-bidang berikut
+ **BeginOffset**— Offset ke dalam teks dokumen tempat penyebutan dimulai.
+ **EndOffset**— Offset ke dalam teks dokumen tempat penyebutan berakhir.
+ **GroupScore**— Keyakinan bahwa semua entitas yang disebutkan dalam grup berhubungan dengan entitas yang sama.
+ **Teks** — Teks dalam dokumen yang mengidentifikasi entitas.
+ **Jenis** — Jenis entitas. [Amazon Comprehend mendukung berbagai jenis entitas.](#how-targeted-sentiment-entities)
+ **Skor** — Model keyakinan bahwa entitas relevan. Rentang nilai adalah nol hingga satu, di mana seseorang adalah kepercayaan tertinggi.
+ **MentionSentiment**— Berisi sentimen dan skor sentimen untuk disebutkan.
+ **Sentimen** — Sentimen penyebutan. Nilai meliputi: POSITIF, NETRAL, NEGATIF, dan CAMPURAN. 
+ **SentimentScore**— Memberikan kepercayaan model untuk setiap sentimen yang mungkin. Rentang nilai adalah nol hingga satu, di mana seseorang adalah kepercayaan tertinggi.

Nilai **Sentimen** memiliki arti sebagai berikut:
+ **Positif** — Entitas menyebutkan sentimen positif.
+ **Negatif** — Entitas menyebutkan sentimen negatif.
+ **Campuran** — Entitas menyebutkan sentimen positif dan negatif.
+ **Netral** — Penyebutan entitas tidak mengungkapkan sentimen positif atau negatif.

Dalam contoh berikut, entitas hanya memiliki satu penyebutan dalam dokumen input, jadi nol (penyebutan pertama dalam array Mentions). DescriptiveMentionIndex Entitas yang diidentifikasi adalah ORANG dengan nama “I.” Skor sentimen netral.

```
{"Entities":[
  {
    "DescriptiveMentionIndex": [0],
    "Mentions": [
      {
       "BeginOffset": 0,
       "EndOffset": 1,
       "Score": 0.999997,
       "GroupScore": 1,
       "Text": "I",
       "Type": "PERSON",
       "MentionSentiment": {
         "Sentiment": "NEUTRAL",
         "SentimentScore": {
           "Mixed": 0,
           "Negative": 0,
           "Neutral": 1,
           "Positive": 0
         }
       }
     }
   ]
  }
 ],
 "File": "Input.txt",
 "Line": 0
}
```

## Analisis waktu nyata menggunakan konsol
<a name="how-targeted-sentiment-console"></a>

Anda dapat menggunakan konsol Amazon Comprehend untuk berjalan secara real-time. [Sentimen yang ditargetkan](realtime-console-analysis.md#realtime-analysis-console-targeted-sentiment) Gunakan teks sampel atau tempel teks Anda sendiri ke dalam kotak teks input, lalu pilih **Analisis**.

Di panel **Insights**, konsol menampilkan tiga tampilan analisis sentimen yang ditargetkan:
+ **Teks yang dianalisis** - Menampilkan teks yang dianalisis dan menggarisbawahi setiap entitas. Warna garis bawah menunjukkan nilai sentimen (positif, netral, negatif, atau campuran) yang diberikan analisis ke entitas. Konsol menampilkan pemetaan warna di sudut kanan atas kotak teks yang dianalisis. Jika Anda mengarahkan kursor ke entitas, konsol akan menampilkan panel popup yang berisi nilai analisis (tipe entitas, skor sentimen) untuk entitas.
+ **Hasil** - Menampilkan tabel yang berisi baris untuk setiap penyebutan entitas yang diidentifikasi dalam teks. Untuk setiap entitas, tabel menunjukkan skor [entitas](#how-targeted-sentiment-entities) dan entitas. Baris ini juga mencakup sentimen utama dan skor untuk setiap nilai sentimen. Jika ada beberapa sebutan dari entitas yang sama, yang dikenal sebagai a[Kelompok referensi bersama](#how-targeted-sentiment-values), tabel menampilkan penyebutan ini sebagai kumpulan baris yang dapat dilipat yang terkait dengan entitas utama. 

  Jika Anda mengarahkan kursor ke baris entitas dalam tabel **Hasil**, konsol akan menyoroti penyebutan entitas di panel **teks Dianalisis**.
+ **Integrasi aplikasi** - Menampilkan nilai parameter permintaan API dan struktur objek JSON yang dikembalikan dalam respons API. Untuk deskripsi bidang dalam objek JSON, lihat[Organisasi file keluaran](#how-targeted-sentiment-output).

### Contoh analisis real-time konsol
<a name="targeted-sentiment-example"></a>

Contoh ini menggunakan teks berikut sebagai input, yang merupakan teks input default yang disediakan konsol.

```
Hello Zhang Wei, I am John. Your AnyCompany Financial Services, LLC credit card account 1111-0000-1111-0008 has a minimum payment 
  of $24.53 that is due by July 31st. Based on your autopay settings, we will withdraw your payment on the due date from your 
  bank account number XXXXXX1111 with the routing number XXXXX0000. 
  Customer feedback for Sunshine Spa, 123 Main St, Anywhere. Send comments to Alice at sunspa@mail.com. 
  I enjoyed visiting the spa. It was very comfortable but it was also very expensive. The amenities were ok but the service made 
  the spa a great experience.
```

Panel **teks Dianalisis** menunjukkan output berikut untuk contoh ini. Arahkan mouse Anda ke teks `Zhang Wei` untuk melihat panel popup untuk entitas ini.

![\[Sentimen yang ditargetkan menganalisis teks.\]](http://docs.aws.amazon.com/id_id/comprehend/latest/dg/images/gs-console-targeted-sentiment2.png)


Tabel **Hasil** memberikan detail tambahan tentang setiap entitas, termasuk skor entitas, sentimen utama, dan skor untuk setiap sentimen. 

![\[Tabel hasil sentimen yang ditargetkan.\]](http://docs.aws.amazon.com/id_id/comprehend/latest/dg/images/gs-console-targeted-sentiment3.png)


Dalam contoh kami, analisis sentimen yang ditargetkan mengakui bahwa setiap penyebutan **Anda** dalam teks input adalah referensi ke entitas orang **Zhang** Wei. Konsol menampilkan penyebutan ini sebagai satu set baris yang dapat dilipat yang terkait dengan entitas utama.

![\[Tabel hasil sentimen yang ditargetkan.\]](http://docs.aws.amazon.com/id_id/comprehend/latest/dg/images/gs-console-targeted-sentiment5.png)


Panel **integrasi Aplikasi** menampilkan objek JSON yang dihasilkan DetectTargetedSentiment API. Lihat bagian berikut untuk contoh lengkapnya.

## Contoh output sentimen yang ditargetkan
<a name="how-targeted-sentiment-example"></a>

Contoh berikut menunjukkan file output dari pekerjaan analisis sentimen yang ditargetkan. File input terdiri dari tiga dokumen sederhana:

```
The burger was very flavorful and the burger bun was excellent. However, customer service was slow.
My burger was good, and it was warm. The burger had plenty of toppings.
The burger was cooked perfectly but it was cold. The service was OK.
```

Analisis sentimen yang ditargetkan dari file input ini menghasilkan output berikut.

```
  {"Entities":[
    {
      "DescriptiveMentionIndex": [
        0
      ],
      "Mentions": [
        {
          "BeginOffset": 4,
          "EndOffset": 10,
          "Score": 0.999991,
          "GroupScore": 1,
          "Text": "burger",
          "Type": "OTHER",
          "MentionSentiment": {
            "Sentiment": "POSITIVE",
            "SentimentScore": {
              "Mixed": 0,
              "Negative": 0,
              "Neutral": 0,
              "Positive": 1
            }
          }
        }
      ]
    },
    {
      "DescriptiveMentionIndex": [
        0
      ],
      "Mentions": [
        {
          "BeginOffset": 38,
          "EndOffset": 44,
          "Score": 1,
          "GroupScore": 1,
          "Text": "burger",
          "Type": "OTHER",
          "MentionSentiment": {
            "Sentiment": "NEUTRAL",
            "SentimentScore": {
              "Mixed": 0.000005,
              "Negative": 0.000005,
              "Neutral": 0.999591,
              "Positive": 0.000398
            }
          }
        }
      ]
    },
    {
      "DescriptiveMentionIndex": [
        0
      ],
      "Mentions": [
        {
          "BeginOffset": 45,
          "EndOffset": 48,
          "Score": 0.961575,
          "GroupScore": 1,
          "Text": "bun",
          "Type": "OTHER",
          "MentionSentiment": {
            "Sentiment": "POSITIVE",
            "SentimentScore": {
              "Mixed": 0.000327,
              "Negative": 0.000286,
              "Neutral": 0.050269,
              "Positive": 0.949118
            }
          }
        }
      ]
    },
    {
      "DescriptiveMentionIndex": [
        0
      ],
      "Mentions": [
        {
          "BeginOffset": 73,
          "EndOffset": 89,
          "Score": 0.999988,
          "GroupScore": 1,
          "Text": "customer service",
          "Type": "ATTRIBUTE",
          "MentionSentiment": {
            "Sentiment": "NEGATIVE",
            "SentimentScore": {
              "Mixed": 0.000001,
              "Negative": 0.999976,
              "Neutral": 0.000017,
              "Positive": 0.000006
            }
          }
        }
      ]
    }
  ],
  "File": "TargetSentimentInputDocs.txt",
  "Line": 0
}
{
  "Entities": [
    {
      "DescriptiveMentionIndex": [
        0
      ],
      "Mentions": [
        {
          "BeginOffset": 0,
          "EndOffset": 2,
          "Score": 0.99995,
          "GroupScore": 1,
          "Text": "My",
          "Type": "PERSON",
          "MentionSentiment": {
            "Sentiment": "NEUTRAL",
            "SentimentScore": {
              "Mixed": 0,
              "Negative": 0,
              "Neutral": 1,
              "Positive": 0
            }
          }
        }
      ]
    },
    {
      "DescriptiveMentionIndex": [
        0,
        2
      ],
      "Mentions": [
        {
          "BeginOffset": 3,
          "EndOffset": 9,
          "Score": 0.999999,
          "GroupScore": 1,
          "Text": "burger",
          "Type": "OTHER",
          "MentionSentiment": {
            "Sentiment": "POSITIVE",
            "SentimentScore": {
              "Mixed": 0.000002,
              "Negative": 0.000001,
              "Neutral": 0.000003,
              "Positive": 0.999994
            }
          }
        },
        {
          "BeginOffset": 24,
          "EndOffset": 26,
          "Score": 0.999756,
          "GroupScore": 0.999314,
          "Text": "it",
          "Type": "OTHER",
          "MentionSentiment": {
            "Sentiment": "POSITIVE",
            "SentimentScore": {
              "Mixed": 0,
              "Negative": 0.000003,
              "Neutral": 0.000006,
              "Positive": 0.999991
            }
          }
        },
        {
          "BeginOffset": 41,
          "EndOffset": 47,
          "Score": 1,
          "GroupScore": 0.531342,
          "Text": "burger",
          "Type": "OTHER",
          "MentionSentiment": {
            "Sentiment": "POSITIVE",
            "SentimentScore": {
              "Mixed": 0.000215,
              "Negative": 0.000094,
              "Neutral": 0.00008,
              "Positive": 0.999611
            }
          }
        }
      ]
    },
    {
      "DescriptiveMentionIndex": [
        0
      ],
      "Mentions": [
        {
          "BeginOffset": 52,
          "EndOffset": 58,
          "Score": 0.965462,
          "GroupScore": 1,
          "Text": "plenty",
          "Type": "QUANTITY",
          "MentionSentiment": {
            "Sentiment": "NEUTRAL",
            "SentimentScore": {
              "Mixed": 0,
              "Negative": 0,
              "Neutral": 1,
              "Positive": 0
            }
          }
        }
      ]
    },
    {
      "DescriptiveMentionIndex": [
        0
      ],
      "Mentions": [
        {
          "BeginOffset": 62,
          "EndOffset": 70,
          "Score": 0.998353,
          "GroupScore": 1,
          "Text": "toppings",
          "Type": "OTHER",
          "MentionSentiment": {
            "Sentiment": "NEUTRAL",
            "SentimentScore": {
              "Mixed": 0,
              "Negative": 0,
              "Neutral": 0.999964,
              "Positive": 0.000036
            }
          }
        }
      ]
    }
  ],
  "File": "TargetSentimentInputDocs.txt",
  "Line": 1
}
{
  "Entities": [
    {
      "DescriptiveMentionIndex": [
        0
      ],
      "Mentions": [
        {
          "BeginOffset": 4,
          "EndOffset": 10,
          "Score": 1,
          "GroupScore": 1,
          "Text": "burger",
          "Type": "OTHER",
          "MentionSentiment": {
            "Sentiment": "POSITIVE",
            "SentimentScore": {
              "Mixed": 0.001515,
              "Negative": 0.000822,
              "Neutral": 0.000243,
              "Positive": 0.99742
            }
          }
        },
        {
          "BeginOffset": 36,
          "EndOffset": 38,
          "Score": 0.999843,
          "GroupScore": 0.999661,
          "Text": "it",
          "Type": "OTHER",
          "MentionSentiment": {
            "Sentiment": "NEGATIVE",
            "SentimentScore": {
              "Mixed": 0,
              "Negative": 0.999996,
              "Neutral": 0.000004,
              "Positive": 0
            }
          }
        }
      ]
    },
    {
      "DescriptiveMentionIndex": [
        0
      ],
      "Mentions": [
        {
          "BeginOffset": 53,
          "EndOffset": 60,
          "Score": 1,
          "GroupScore": 1,
          "Text": "service",
          "Type": "ATTRIBUTE",
          "MentionSentiment": {
            "Sentiment": "NEUTRAL",
            "SentimentScore": {
              "Mixed": 0.000033,
              "Negative": 0.000089,
              "Neutral": 0.993325,
              "Positive": 0.006553
            }
          }
        }
      ]
    }
  ],
  "File": "TargetSentimentInputDocs.txt",
  "Line": 2
}
  }
```

# Analisis sintaks
<a name="how-syntax"></a>

Gunakan analisis sintaksis untuk mengurai kata-kata dari dokumen dan mengembalikan bagian ucapan, atau fungsi sintaksis, untuk setiap kata dalam dokumen. Anda dapat mengidentifikasi kata benda, kata kerja, kata sifat dan sebagainya dalam dokumen Anda. Gunakan informasi ini untuk mendapatkan pemahaman yang lebih kaya tentang isi dokumen Anda, dan untuk memahami hubungan kata-kata dalam dokumen.

Misalnya, Anda dapat mencari kata benda dalam dokumen dan kemudian mencari kata kerja yang terkait dengan kata benda tersebut. Dalam kalimat seperti “Nenek saya memindahkan sofa” Anda dapat melihat kata benda, “nenek” dan “sofa,” dan kata kerja, “pindah.” Anda dapat menggunakan informasi ini untuk membangun aplikasi untuk menganalisis teks untuk kombinasi kata yang Anda minati.

Untuk memulai analisis, Amazon Comprehend mem-parsing teks sumber untuk menemukan kata-kata individual dalam teks. Setelah teks diuraikan, setiap kata diberi bagian pidato yang dibutuhkan dalam teks sumber.

Amazon Comprehend dapat mengidentifikasi bagian-bagian pidato berikut. 


| Token | Bagian dari pidato | 
| --- | --- | 
| ADJ | Adjektiva Kata-kata yang biasanya memodifikasi kata benda. | 
| ADP | Adposisi Kepala frase preposisional atau postposisional. | 
| ADV | Kata keterangan Kata-kata yang biasanya memodifikasi kata kerja. Mereka juga dapat memodifikasi kata sifat dan kata keterangan lainnya. | 
| AUX | Bantu Kata-kata fungsi yang menyertai kata kerja frase kata kerja. | 
| CCONJ | Koordinasi konjungsi Konjungsi koordinasi menghubungkan kata, frasa, atau klausa dalam sebuah kalimat tanpa menundukkan satu sama lain. | 
| CONJ | Konjungsi Konjungsi menghubungkan kata, frasa, atau klausa dalam sebuah kalimat. | 
| DET | Penentu Artikel dan kata lain yang menentukan frasa kata benda tertentu. | 
| INTJ | Kata seru Kata-kata yang digunakan sebagai seruan atau bagian dari seruan. | 
| KATA BENDA | Kata benda Kata-kata yang menentukan seseorang, tempat, benda, binatang, atau ide. | 
| JUMLAH | Angka Kata-kata, biasanya penentu, kata sifat, atau kata ganti, yang mengekspresikan angka. | 
| O | Lainnya Kata-kata yang tidak dapat ditetapkan sebagai bagian dari kategori pidato. | 
| SEBAGIAN | Partikel Fungsi kata yang terkait dengan kata atau frasa lain untuk memberi makna.  | 
| PRON | Kata ganti Kata-kata yang menggantikan kata benda atau frasa kata benda. | 
| PROPN | Kata benda yang tepatKata benda yang merupakan nama individu, tempat, atau objek tertentu. | 
| MENUSUK | Tanda baca Karakter non-abjad yang membatasi teks. | 
| SCONJ | Konjungsi subordinasi Konjungsi yang menggabungkan klausa dependen ke sebuah kalimat. Contoh konjungsi subordinasi adalah “karena”. | 
| SYM | SimbolEntitas seperti kata seperti tanda dolar (\$1) atau simbol matematika. | 
| KATA KERJA | Kata KerjaKata-kata yang menandakan peristiwa dan tindakan. | 

Untuk informasi selengkapnya tentang bagian-bagian pidato, lihat [Tag Universal POS di situs](http://universaldependencies.org/u/pos/) web *Universal Dependencies*.

Operasi mengembalikan token yang mengidentifikasi kata dan bagian ucapan yang diwakili kata dalam teks. Setiap token mewakili kata dalam teks sumber. Ini memberikan lokasi kata dalam sumbernya, bagian ucapan yang diambil kata dalam teks, keyakinan bahwa Amazon Comprehend memiliki bahwa bagian pidato diidentifikasi dengan benar, dan kata yang diuraikan dari teks sumber.

Berikut ini adalah struktur daftar token sintaks. Satu token sintaks dihasilkan untuk setiap kata dalam dokumen. 

```
{
   "SyntaxTokens": [ 
      { 
         "BeginOffset": number,
         "EndOffset": number,
         "PartOfSpeech": { 
            "Score": number,
            "Tag": "string"
         },
         "Text": "string",
         "TokenId": number
      }
   ]
}
```

Setiap token memberikan informasi berikut:
+ `BeginOffset`dan `EndOffset` —Menyediakan lokasi kata dalam teks input. 
+ `PartOfSpeech`—Menyediakan dua informasi, `Tag` yang mengidentifikasi bagian pidato dan yang mewakili keyakinan `Score` yang dimiliki Amazon Comprehend Syntax bahwa bagian pidato diidentifikasi dengan benar.
+ `Text`—Menyediakan kata yang diidentifikasi.
+ `TokenId`—Menyediakan pengenal untuk token. Identifier adalah posisi token dalam daftar token.