

# Amazon Nova Sonic システムプロンプトのベストプラクティス
<a name="prompting-speech-best-practices"></a>

**注記**  
このドキュメントは Amazon Nova バージョン 1 を対象としています。Amazon Nova 2 Speech-to-Speech プロンプトエンジニアリングガイドについては、「[音声会話プロンプト](https://docs.aws.amazon.com/nova/latest/nova2-userguide/sonic-system-prompts.html)」(Voice conversation prompt) を参照してください。

Amazon Nova Sonic のシステムプロンプトを作成する際、音声ベースのやり取りはテキストベースのインタラクションとは異なることを理解する必要があります。[Amazon Nova の理解モデルのプロンプトに関するベストプラクティス](https://docs.aws.amazon.com/nova/latest/userguide/prompting.html)の多くは Amazon Nova Sonic に適用されますが、口頭による会話の固有のダイナミクスに適応する必要があります。例えば、ユーザーの入力されたレスポンスは、信頼性の高い入力のソースです。ただし、対応する音声のやり取りはコンテキストで制限され、会話を進める前に詳細を尋ねるために相互的なインタラクションが必要になる場合があります。さらに、長い形式の出力に対応するプロンプトは、正しい回答を見つけるためにリスニングにかかる時間により、ユーザーにとって不快な体験をもたらす可能性があります。

[Amazon Nova のプロンプトガイダンス](https://docs.aws.amazon.com/nova/latest/userguide/prompting.html)で説明されているように、*プロンプトエンジニアリング*は入力を最適化してモデルの出力品質を向上させます。Amazon Nova Sonic の場合、これらの原則は会話型音声パターンにカスタマイズする必要があります。

システムプロンプトを記述する際、次の詳細を考慮してください。

**明確性と精度**  
テキストで明確な指示は、音声コンテキスト用に再フォーマットが必要な場合があります。誤動作を防ぐため、プロンプトが理解の確認を求めてからツールでアクションを実行してください。


| Task | Traditional prompt | Speech-optimized prompt | 
| --- |--- |--- |
| まず、ユーザーの ID 情報および予約番号を確認します。 | `Verify the user's identity by requesting their username, email address, and reservation number. Validate that the reservation number follows the format XXX-YYYYY.` | `When asking for verification, request one piece of information at a time. First ask for their name, then wait for their response and confirm it. Next, ask for their email and repeat it back for verification. Finally, ask for their booking code, listening for the three parts separated by dashes (XXX-YYYYY). After collecting the booking code, read it back character by character to confirm accuracy before proceeding.` | 

**会話フロー**  
正式な指示構造よりも自然な対話フローを優先します。


| Task | Traditional prompt | Speech-optimized prompt | 
| --- |--- |--- |
| Wi-Fi の接続問題のトラブルシューティング | `Provide step-by-step instructions for troubleshooting Wi-Fi connectivity issues. Include diagnostic steps, common error codes, and resolutions for each potential problem.` | `Guide the customer through Wi-Fi troubleshooting as a conversation. Start by asking what they've already tried, then suggest one simple step at a time. After each step, pause to check if it is clear before moving on to the next solution. Use everyday language instead of technical terms.` | 

**メモリ制約**  
会話によるインタラクションには、テキストとは異なるメモリダイナミクスがあることに注意してください。例えば、音声で伝える場合、リスナーが以前のテキスト内容に「戻って参照」することは容易ではありません。


| Task | Traditional prompt | Speech-optimized prompt | 
| --- |--- |--- |
| 返品ポリシーを説明する | `Reference sections 1.3, 2.7, and 4.2 from the attached document when answering the user's questions about regulatory compliance. Include specific paragraph numbers in your citations.` | `When explaining our return policy, focus on one key point at a time. First cover the 30-day window, then shipping requirements, and finally condition standards. Summarize all three points together at the end to reinforce the main requirements without overwhelming the customer.` | 

**Topics**
+ [音声固有のプロンプト手法](prompting-speech-voice-language.md)
+ [音声フレンドリなコンテンツ手法](prompting-speech-bp-speech.md)
+ [システムロールの適応](prompting-speech-bp-sysrole.md)
+ [音声の思考連鎖](prompting-speech-bp-reasoning.md)
+ [外部ツールの統合](prompting-speech-bp-tools.md)
+ [避けるプロンプト手法](prompting-speech-bp-avoid.md)

# 音声固有のプロンプト手法
<a name="prompting-speech-voice-language"></a>

**注記**  
このドキュメントは Amazon Nova バージョン 1 を対象としています。Amazon Nova 2 Speech-to-Speech プロンプトエンジニアリングガイドについては、「[音声会話プロンプト](https://docs.aws.amazon.com/nova/latest/nova2-userguide/sonic-system-prompts.html)」(Voice conversation prompt) を参照してください。

同じ言語内でも、特定の地域に合わせてモデルを調整することで、レスポンスや言葉の選択を強化できます。したがって、使用する音声の地域に自然で固有の言語を特徴付けるように、システムプロンプトに指示を含めることをお勧めします。

使用可能な音声およびロケールは次のとおりです。


| Language | 女性の音声 ID | 男性の音声 ID | 
| --- |--- |--- |
| 英語 (米国) | Tiffany | Matthew | 
| 英語 (英国) | Amy |  | 
| French | Ambre | Florian | 
| Italian | Beatrice | Lorenzo | 
| German | Greta | Lennart | 
| Spanish | Lupe | Carlos | 

------
#### [ British English ]

イギリス英語の使用を指定するには、プロンプトに次の行を追加します。

`Use British English as your language for your responses.`

**イギリス英語が選択された完全なプロンプトの例**  
`You are a friend. The user and you will engage in a spoken dialog exchanging the transcripts of a natural real-time conversation. Keep your responses short, generally two or three sentences for chatty scenarios. Avoid formatted lists or numbering and keep your output as a spoken transcript to be acted out. Use British English as your language for your responses.`

**音声 ID を指定する方法**  
インタラクションに特定の音声を選択するには、設定に `voiceId` パラメータを含めます。例えば、イギリス英語の `amy` という声を使用するには、次の `audioOutputConfiguration` を使用します。

```
"audioOutputConfiguration": {
    "mediaType": "audio/lpcm",
    "sampleRateHertz": 24000,
    "sampleSizeBits": 16,
    "channelCount": 1,
    "voiceId": "amy",
    "encoding": "base64",
    "audioType": "SPEECH"
}
```

------
#### [ Spanish ]

スペイン語をレスポンス言語として指定するには、次の行をプロンプトに追加します。

`Please respond exclusively in Spanish. If you have a question or suggestion, ask it in Spanish. I want to ensure that our communication remains in Spanish.`

**スペイン語が選択された完全なプロンプトの例**  
`You are a friend. The user and you will engage in a spoken dialog exchanging the transcripts of a natural real-time conversation. Keep your responses short, generally two or three sentences for chatty scenarios. Avoid formatted lists or numbering and keep your output as a spoken transcript to be acted out. Please respond exclusively in Spanish. If you have a question or suggestion, ask it in Spanish. I want to ensure that our communication remains in Spanish.`

**音声 ID を指定する方法**  
インタラクションに特定の音声を選択するには、設定に `voiceId` パラメータを含めます。例えば、スペイン語の `carlos` という声を使用するには、次の `audioOutputConfiguration` を使用します。

```
"audioOutputConfiguration": {
    "mediaType": "audio/lpcm",
    "sampleRateHertz": 24000,
    "sampleSizeBits": 16,
    "channelCount": 1,
    "voiceId": "carlos",
    "encoding": "base64",
    "audioType": "SPEECH"
}
```

------
#### [ French ]

フランス語をレスポンス言語として指定するには、次の行をプロンプトに追加します。

`Please respond exclusively in French. If you have a question or suggestion, ask it in French. I want to ensure that our communication remains in French.`

**フランス語が選択された完全なプロンプトの例**  
`You are a friend. The user and you will engage in a spoken dialog exchanging the transcripts of a natural real-time conversation. Keep your responses short, generally two or three sentences for chatty scenarios. Avoid formatted lists or numbering and keep your output as a spoken transcript to be acted out. Please respond exclusively in French. If you have a question or suggestion, ask it in French. I want to ensure that our communication remains in French.`

**音声 ID を指定する方法**  
インタラクションに特定の音声を選択するには、設定に `voiceId` パラメータを含めます。例えば、フランス語の `ambre` という声を使用するには、次の `audioOutputConfiguration` を使用します。

```
"audioOutputConfiguration": {
    "mediaType": "audio/lpcm",
    "sampleRateHertz": 24000,
    "sampleSizeBits": 16,
    "channelCount": 1,
    "voiceId": "ambre",
    "encoding": "base64",
    "audioType": "SPEECH"
}
```

------
#### [ Italian ]

イタリア語をレスポンス言語として指定するには、次の行をプロンプトに追加します。

`Please respond exclusively in Italian. If you have a question or suggestion, ask it in Italian. I want to ensure that our communication remains in Italian.`

**イタリア語が選択された完全なプロンプトの例**  
`You are a friend. The user and you will engage in a spoken dialog exchanging the transcripts of a natural real-time conversation. Keep your responses short, generally two or three sentences for chatty scenarios. Avoid formatted lists or numbering and keep your output as a spoken transcript to be acted out. Please respond exclusively in Italian. If you have a question or suggestion, ask it in Italian. I want to ensure that our communication remains in Italian.`

**音声 ID を指定する方法**  
インタラクションに特定の音声を選択するには、設定に `voiceId` パラメータを含めます。例えば、イタリア語の `lorenzo` という声を使用するには、次の `audioOutputConfiguration` を使用します。

```
"audioOutputConfiguration": {
    "mediaType": "audio/lpcm",
    "sampleRateHertz": 24000,
    "sampleSizeBits": 16,
    "channelCount": 1,
    "voiceId": "lorenzo",
    "encoding": "base64",
    "audioType": "SPEECH"
}
```

------
#### [ German ]

ドイツ語をレスポンス言語として指定するには、次の行をプロンプトに追加します。

`Please respond exclusively in German. If you have a question or suggestion, ask it in German. I want to ensure that our communication remains in German.`

**ドイツ語が選択された完全なプロンプトの例**  
`You are a friend. The user and you will engage in a spoken dialog exchanging the transcripts of a natural real-time conversation. Keep your responses short, generally two or three sentences for chatty scenarios. Avoid formatted lists or numbering and keep your output as a spoken transcript to be acted out. Please respond exclusively in German. If you have a question or suggestion, ask it in German. I want to ensure that our communication remains in German.`

**音声 ID を指定する方法**  
インタラクションに特定の音声を選択するには、設定に `voiceId` パラメータを含めます。例えば、ドイツ語の `greta` という声を使用するには、次の `audioOutputConfiguration` を使用します。

```
"audioOutputConfiguration": {
    "mediaType": "audio/lpcm",
    "sampleRateHertz": 24000,
    "sampleSizeBits": 16,
    "channelCount": 1,
    "voiceId": "greta",
    "encoding": "base64",
    "audioType": "SPEECH"
}
```

------

# 音声フレンドリなコンテンツ手法
<a name="prompting-speech-bp-speech"></a>

**注記**  
このドキュメントは Amazon Nova バージョン 1 を対象としています。Amazon Nova 2 Speech-to-Speech プロンプトエンジニアリングガイドについては、「[音声会話プロンプト](https://docs.aws.amazon.com/nova/latest/nova2-userguide/sonic-system-prompts.html)」(Voice conversation prompt) を参照してください。

レスポンスの会話品質を向上させるには、次の要素をシステムプロンプトに組み込むことを検討してください。

**会話のターンテイキング**  
発話による会話において、やりとりのリズムと構成に関する明確な期待値を設定します。例えば、次のようになります。

`You are a friend. You and the user will engage in a spoken dialog exchanging the transcripts of a natural real-time conversation. As the agent, you'll be part of a spoken conversation with the user, following a sequence of user, agent, user, agent turns. When it's your turn to speak respond with a human touch, adding emotions, wit, playfulness, and empathy where it fits. Use simple, engaging, and helpful language.`

**会話マーカー**  
実際の会話を再現するために、「えーと」、「ほら」、「それは」などの自然な会話要素の使用を奨励してください。例えば、次のようになります。

`You are a friend. You and the user will engage in a spoken dialog exchanging the transcripts of a natural real-time conversation.`

`Include natural speech elements like "Well," "You know," "Actually," "I mean," or "By the way" at appropriate moments to create an authentic, casual conversation flow.`

**感情表現**  
「ハハハ」、「うーん」、「わー\$1」など、テキストの感情インジケータを含めるように指定します。必要に応じて。例えば、次のようになります。

`You are a friend. You and the user will engage in a spoken dialog exchanging the transcripts of a natural real-time conversation. Express emotions verbally through phrases like "Haha," "Wow," "Hmm," "Oh!" or "That's amazing!" when appropriate to the conversation context.`

**思考の間**  
省略記号 (...) を使用して、短い思考の瞬間や自然な会話の間を示すことを提案します。例えば、次のようになります。

`You are a friend. You and the user will engage in a spoken dialog exchanging the transcripts of a natural real-time conversation. Incorporate natural speech pauses using ellipses (...) when you're thinking or transitioning between topics.`

**口頭での強調**  
普段は視覚的に強調表示される重要な情報を強調する手法を推奨してください。例えば、次のようになります。

`You are a friend. You and the user will engage in a spoken dialog exchanging the transcripts of a natural real-time conversation. Instead of using bold or italics, emphasize important information by using phrases like "The key thing to remember is," "What's really important here is," or "I want to highlight that." This ensures crucial points stand out in spoken form.`

**言語の組織化**  
リスナーの理解を深めるには、番号付きのポイント、明確な移行、明示的な概要を使用します。

`You are a friend. You and the user will engage in a spoken dialog exchanging the transcripts of a natural real-time conversation. When sharing multiple points, use phrases like "first," "second," and "finally" to help the listener track the information. End complex explanations with "So in summary..." to reinforce key takeaways.`

**表示**  
システムプロンプトに「3 つのキーポイントを説明します」や「説明した内容を要約すると」などの口頭のキューを含めます。

`You are a friend. You and the user will engage in a spoken dialog exchanging the transcripts of a natural real-time conversation. Before sharing multiple ideas, give a preview like "I'm thinking of three reasons why..." and after completing a topic, use phrases like "That covers what I wanted to share about..." to signal topic transitions.`

# システムロールの適応
<a name="prompting-speech-bp-sysrole"></a>

**注記**  
このドキュメントは Amazon Nova バージョン 1 を対象としています。Amazon Nova 2 Speech-to-Speech プロンプトエンジニアリングガイドについては、「[音声会話プロンプト](https://docs.aws.amazon.com/nova/latest/nova2-userguide/sonic-system-prompts.html)」(Voice conversation prompt) を参照してください。

Amazon Nova テキストモデルは、[明確なロール定義](https://docs.aws.amazon.com/nova/latest/userguide/prompting-system-role.html)の恩恵を受けます。Amazon Nova Sonic アプリケーションの場合、次の事項を考慮してください。
+ 話すときに自然に聞こえるロールを定義します (「情報取得システム」ではなく、「親切なアドバイザー」など)。
+ テキスト指向の属性 (詳細、包括的、システム的) ではなく、会話の属性 (友好的、気長、簡潔) を強調するロールの説明を使用します。
+ 選択した音声が認識される性格にどのよな影響を与えるか検討します。音声をテストして、ユースケースに最適な音声を選択します。モデルの自然な韻律に間接的に影響を与える手法については、「[システムプロンプト作成のガイドラインと例](prompting-speech-speech.md)」セクションを参照してください。

# 音声の思考連鎖
<a name="prompting-speech-bp-reasoning"></a>

**注記**  
このドキュメントは Amazon Nova バージョン 1 を対象としています。Amazon Nova 2 Speech-to-Speech プロンプトエンジニアリングガイドについては、「[音声会話プロンプト](https://docs.aws.amazon.com/nova/latest/nova2-userguide/sonic-system-prompts.html)」(Voice conversation prompt) を参照してください。

[思考連鎖の推論手法](https://docs.aws.amazon.com/nova/latest/userguide/prompting-chain-of-thought.html)は依然として重要ですが、適応が必要です。
+ 推論チェーンは、テキストインタラクションの場合よりも短くします。
+ 複雑な説明を小さな会話チャンクに分割します。
+ 口頭による道標 (つまり、「第 1 に…、第 2 に…」) をテキストの場合よりも明確に使用します。

一連の思考を求めるプロンプトの例を次に示します。

`You are a friendly assistant. The user will give you a problem. Explain your reasoning following the guidelines given in CONSTITUTION - REASONING, and summarize your decision at the end of your response, in one sentence.`

`## CONSTITUTION - REASONING `

`1. For simple questions including simple calculations or contextual tasks: Give the answer directly. No explanation is necessary, although you can offer to provide more information if the user requests it. `

`2. When faced with complex problems or decisions, think through the steps systematically before providing your answer. Break down your reasoning process when it would help user understanding.`

`3. For subjective matters or comparisons: explain your thought process step-by-step.`

# 外部ツールの統合
<a name="prompting-speech-bp-tools"></a>

**注記**  
このドキュメントは Amazon Nova バージョン 1 を対象としています。Amazon Nova 2 Speech-to-Speech プロンプトエンジニアリングガイドについては、「[音声会話プロンプト](https://docs.aws.amazon.com/nova/latest/nova2-userguide/sonic-system-prompts.html)」(Voice conversation prompt) を参照してください。

Amazon Nova Sonic で[外部ツールを使用する](https://docs.aws.amazon.com/nova/latest/userguide/prompting-tools.html)際、次の事項をお勧めします。
+ ユーザー入力の潜在的な自動音声認識エラーを処理するため、ツール呼び出し機能を開発する。
+ ユーザーは使用されているツールを見ることができないことを考慮する。
+ ツールを参照する際、口頭で確認する。

# 避けるプロンプト手法
<a name="prompting-speech-bp-avoid"></a>

**注記**  
このドキュメントは Amazon Nova バージョン 1 を対象としています。Amazon Nova 2 Speech-to-Speech プロンプトエンジニアリングガイドについては、「[音声会話プロンプト](https://docs.aws.amazon.com/nova/latest/nova2-userguide/sonic-system-prompts.html)」(Voice conversation prompt) を参照してください。

Amazon Nova Sonic のプロンプトを作成する際、次の事項を避けることをお勧めします。
+ 箇条書き、テーブル、コードブロックなどの視覚的な形式。
+ 訛り、年齢、歌声などの音声特性の変更。
+ 音響効果や広範な擬音語。
+ 聞くことよりも見られることに依存するコンテンツ。