Amazon Nova Sonic プロンプトのベストプラクティス
注記
このドキュメントは Amazon Nova バージョン 1 を対象としています。Amazon Nova 2 Speech-to-Speech プロンプトエンジニアリングガイドについては、「音声会話プロンプト」(Voice conversation prompt) を参照してください。
Amazon Nova Sonic モデルには、標準のテキストベースのモデルとは異なるプロンプト手法が必要です。Speech-to-speech モデルのプロンプトを作成する際は、システムプロンプトがモデルの出力スタイルおよび語彙の選択を方向付けることを理解することが重要です。アクセントやピッチなど、音声属性を変更するために使用することはできません。モデルは、会話のコンテキストに基づいてそれらの音声特性を決定します。
主な違いは、出力が記述されたテキストではなく、音声であることです。つまり、読む理解ではなく、音声の理解のためにコンテンツを最適化する必要があります。自然に音声に変換されるテキストを生成するように、プロンプトはモデルを導く必要があります。読むときではなく、聞くときの会話の流れおよび明確さに焦点を当てます。