

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

# Pemikiran yang diperluas di Amazon Nova 2
Pemikiran yang Diperpanjang

Amazon Nova 2 Lite memperkenalkan kemampuan **berpikir yang diperluas** yang memungkinkan model untuk terlibat dalam penalaran yang lebih dalam untuk masalah yang kompleks. Fitur opsional ini memberi Anda kendali atas kapan dan bagaimana model mengalokasikan sumber daya komputasi tambahan untuk memikirkan tugas-tugas yang menantang.

## Bagaimana Extended Thinking Bekerja


 Amazon Nova 2 memperkenalkan pemikiran yang diperluas sebagai **kemampuan hibrida**. Anda memiliki kontrol penuh:
+ **Extended thinking OFF (default)**: Amazon Nova 2 beroperasi dengan penalaran laten yang efisien, optimal untuk tugas sehari-hari dan aplikasi volume tinggi.
+ **Pemikiran yang diperluas ON**: Amazon Nova 2 terlibat dalam eksplisit, step-by-step penalaran terbaik untuk masalah kompleks yang membutuhkan analisis mendalam.

### Upaya penalaran


Berikut ini menunjukkan berbagai tingkat upaya penalaran.

#### Upaya Rendah (MaxReasoningEffort: "rendah”)


**Terbaik untuk:** Tugas dengan kompleksitas tambahan yang membutuhkan pemikiran terstruktur. Misalnya, Anda dapat menggunakan ini untuk tinjauan kode dan saran peningkatan di mana model perlu mempertimbangkan dengan cermat kualitas kode yang ada, tugas analisis yang memerlukan pertimbangan yang cermat dari berbagai faktor, atau skenario pemecahan masalah yang mendapat manfaat dari pendekatan metodis. Upaya rendah sangat ideal untuk tugas gabungan di mana penalaran dasar meningkatkan akurasi tanpa memerlukan perencanaan multi-langkah yang mendalam.

#### Upaya sedang (maxReasoningEffort: “sedang”)


**Terbaik untuk:** Tugas multi-langkah dan alur kerja pengkodean. Misalnya, Anda dapat menggunakan ini untuk pengembangan perangkat lunak dan debugging di mana model perlu memahami struktur kode yang ada sebelum menerapkan perubahan, pembuatan kode yang memerlukan koordinasi di beberapa file atau komponen, perhitungan multi-langkah dengan saling ketergantungan, atau merencanakan tugas dengan beberapa kendala. Upaya sedang optimal untuk alur kerja agen yang mengoordinasikan beberapa alat dan memerlukan model untuk mempertahankan konteks di beberapa operasi berurutan.

#### Upaya Tinggi (MaxReasoningEffort: “tinggi”)


**Terbaik untuk:** Penalaran STEM dan pemecahan masalah tingkat lanjut. Misalnya, Anda dapat menggunakan ini untuk masalah matematika tingkat lanjut dan bukti yang memerlukan step-by-step verifikasi ketat, analisis ilmiah dan tugas penelitian yang menuntut penyelidikan mendalam, desain sistem yang kompleks dengan pertimbangan arsitektur di berbagai dimensi, atau skenario pengambilan keputusan kritis dengan implikasi signifikan. Upaya tinggi memberikan akurasi maksimum untuk tugas-tugas yang membutuhkan penalaran canggih, evaluasi alternatif yang cermat, dan validasi kesimpulan yang menyeluruh.

### Mulai cepat: Mengaktifkan Berpikir Diperpanjang


Pemikiran yang diperluas dikendalikan melalui `reasoningConfig` parameter.

```
import boto3

bedrock = boto3.client('bedrock-runtime', region_name='us-east-1')

response = bedrock.converse(
    modelId='us.amazon.nova-2-lite-v1:0',
    system=[{"text": "You are a highly capable personal assistant"}],
    messages=[{
        "role": "user",
        "content": [{"text": "Provide a meal plan for a gluten free family of 4."}]
    }],
    inferenceConfig={
        "temperature": 0.7,
        "topP": 0.9,
        "maxTokens": 10000
    },
    additionalModelRequestFields={
        "reasoningConfig": {
            "type": "enabled",
            "maxReasoningEffort": "low"
        }
    }
)

content_list = response["output"]["message"]["content"]

for item in content_list:
    if "reasoningContent" in item:
        reasoning_text = item["reasoningContent"]["reasoningText"]["text"]
        print("=== REASONING ===")
        print(reasoning_text)
        print()
    elif "text" in item:
        print("=== ANSWER ===")
        print(item["text"])
```

Parameter Penalaran:
+ `type: enabled`atau `disabled` (default:`disabled`)
+ `maxReasoningEffort`:`low`,`medium`, atau `high`

**catatan**  
Temperatur, TopP dan TopK tidak dapat digunakan dengan `maxReasoningEffort` set ke. `high` Menggunakan parameter ini bersama-sama menyebabkan kesalahan.

Untuk contoh lengkap kode yang menggunakan pemikiran yang diperluas, lihat[Pustaka kode](code-library.md).

### Struktur Respon


Saat Anda mengaktifkan pemikiran yang diperluas, respons menyertakan `reasoningContent` blok yang diikuti oleh blok `text` konten:

```
{
    "output": {
        "message": {
            "role": "assistant",
            "content": [
                {
                    "reasoningContent": {
                        "reasoningText": {
                            "text": "[REDACTED]"
                        }
                    }
                },
                {
                    "text": "Based on the premises, we can conclude..."
                }
            ]
        }
    },
    "stopReason": "end_turn"
}
```

**catatan**  
Dengan Amazon Nova 2, konten penalaran ditampilkan sebagai`[REDACTED]`. Anda masih dikenakan biaya untuk penalaran token karena mereka berkontribusi pada peningkatan kualitas output. Kami menyertakan bidang ini dalam struktur respons sekarang untuk mempertahankan opsi mengekspos konten penalaran di masa depan. Kami secara aktif bekerja dengan pelanggan untuk menentukan pendekatan terbaik untuk memunculkan proses penalaran model. Konten penalaran ditampilkan sebagai. `[REDACTED]` Anda masih dikenakan biaya untuk token penalaran karena mereka berkontribusi pada peningkatan kualitas respons.

## Opsi konfigurasi


Amazon Nova 2 memperkenalkan `reasoningConfig` parameter baru yang dapat Anda tambahkan ke struktur permintaan converse yang ada untuk mengaktifkan penalaran:

```
additionalModelRequestFields={
    "reasoningConfig": {
        "type": "enabled",  # or "disabled" (default)
        "maxReasoningEffort": "high"  # "low", "medium", or "high"
    }
}
```

**Parameter:**
+ **type:** Beralih antara `"enabled"` dan `"disabled"` (default adalah) `"disabled"`
+ **`maxReasoningEffort`:** Saat diaktifkan, kendalikan kedalaman penalaran
+ **“rendah"”: Tugas** yang cukup kompleks
+ **“medium"”:** Masalah kompleks yang membutuhkan analisis substansif
+ **“tinggi"”:** Alasan paling menyeluruh untuk tugas yang sangat kompleks

**catatan**  
 saat menggunakan`"high"`, temp, TopP, dan maxToken harus tidak disetel. Dalam mode ini, model melakukan analisis yang lebih dalam untuk menemukan solusi terbaik. Pemrosesan yang lebih menyeluruh ini dapat menghasilkan output yang melebihi 65k token. Jumlah pastinya tergantung pada kompleksitas permintaan Anda, tetapi untuk beberapa masalah kami telah melihatnya naik menjadi 128K token. Ini memastikan Anda mendapatkan penalaran yang lengkap dan berkualitas tinggi daripada hasil yang terpotong. 

## Model yang didukung


Pemikiran yang diperluas saat ini tersedia di: Amazon Nova 2 Lite (us.amazon.nova-2-lite-v 1:0)

## Pemikiran yang diperluas dengan penggunaan alat


Pemikiran yang diperluas bekerja dengan mulus dengan pemanggilan alat, memungkinkan Amazon Nova untuk bernalar tentang alat mana yang akan digunakan dan bagaimana menafsirkan hasilnya.

## Memahami Token Penalaran dan Harga


### Jenis token


Token pemikiran yang diperluas ditagih sebagai token keluaran:
+ **Token masukan**: Konten permintaan asli Anda (harga input standar) 
+ **Token keluaran**: Ini termasuk token penalaran dan konten respons akhir yang terlihat (harga keluaran standar) 

### Kerusakan penggunaan


Ketiga jenis token disertakan dalam metrik penggunaan dan penagihan Anda. Token penalaran dihargai sama dengan token keluaran dan akan muncul sebagai “REDACTED” dalam respons model”.

```
  {
  "usage": {
    "inputTokens": 45,
    "outputTokens": 1240,
    "totalTokens": 1285
  }
}
```

## Pertanyaan yang Sering Diajukan


Mengapa Amazon Nova 2 Lite menampilkan “[REDACTED]” untuk konten penalaran alih-alih menampilkan proses berpikir model?  
 Fokus utama kami untuk peluncuran ini adalah memastikan Nova 2 memberikan kecerdasan terbaik di kelasnya untuk tugas Anda, dan Anda akan melihat ini tercermin dalam akurasi yang ditingkatkan.  
 Kami menyadari bahwa visibilitas ke dalam proses penalaran sangat berharga, dan kami telah mendengar minat pelanggan yang kuat untuk memahami bagaimana model berpikir melalui masalah.  
 Kami sedang mencari cara untuk membuatnya segera tersedia.  
**Anda masih ditagih untuk token penalaran**, karena mereka mewakili pekerjaan aktual yang meningkatkan kualitas output Anda   
yang akan ditangkap `outputTokens` bersama dengan token jawaban. 

Bagaimana saya tahu jika pemikiran yang diperluas berhasil jika penalaran disunting?  
Anda dapat mengonfirmasi bahwa pemikiran yang diperluas berfungsi dengan memeriksa output untuk `reasoningContent` blok dalam respons (ini hanya muncul saat penalaran diaktifkan)