

# Prácticas recomendadas para la petición del sistema de Amazon Nova Sonic
<a name="prompting-speech-best-practices"></a>

**nota**  
Esta documentación corresponde a la versión 1 de Amazon Nova. Para ver la guía de ingeniería de peticiones de voz a voz de Amazon Nova 2, consulte [Voice conversation prompts](https://docs.aws.amazon.com/nova/latest/nova2-userguide/sonic-system-prompts.html).

Al crear la petición del sistema para Amazon Nova Sonic, debe comprender que las interacciones basadas en voz difieren de las basadas en texto. Si bien muchas [prácticas recomendadas de peticiones para los modelos de comprensión de Amazon Nova](https://docs.aws.amazon.com/nova/latest/userguide/prompting.html) se aplican a Amazon Nova Sonic, deben adaptarse a la dinámica única de la conversación hablada. Por ejemplo, la respuesta escrita de un usuario es una fuente de entrada fiable. Sin embargo, una interacción de voz correspondiente puede tener un contexto limitado y requerir una interacción de ida y vuelta para solicitar más información antes de continuar con la conversación. Además, las peticiones que se centran en salidas de formato largo pueden resultar en una mala experiencia para los usuarios debido al tiempo que dedican a escuchar para encontrar la respuesta correcta.

Como se describe en las [directrices de peticiones de Amazon Nova](https://docs.aws.amazon.com/nova/latest/userguide/prompting.html), la *ingeniería de peticiones* optimiza la entrada para mejorar la calidad de salida del modelo. En el caso de Amazon Nova Sonic, estos principios deben adaptarse a los patrones de habla conversacional.

Tenga en cuenta los siguientes detalles al escribir sus peticiones del sistema:

**Claridad y precisión**  
Es posible que sea necesario reformular las instrucciones que son claras en texto para adaptarlas a los contextos hablados. Asegúrese de que sus peticiones soliciten la confirmación de comprensión antes de tomar medidas a través de herramientas para evitar contratiempos.


| Task | Traditional prompt | Speech-optimized prompt | 
| --- |--- |--- |
| Primero, verifique la información de identidad y el número de reserva del usuario | `Verify the user's identity by requesting their username, email address, and reservation number. Validate that the reservation number follows the format XXX-YYYYY.` | `When asking for verification, request one piece of information at a time. First ask for their name, then wait for their response and confirm it. Next, ask for their email and repeat it back for verification. Finally, ask for their booking code, listening for the three parts separated by dashes (XXX-YYYYY). After collecting the booking code, read it back character by character to confirm accuracy before proceeding.` | 

**Flujo de conversación**  
Priorice el flujo natural del diálogo por encima de las estructuras de instrucción formales.


| Task | Traditional prompt | Speech-optimized prompt | 
| --- |--- |--- |
| Solucionar problemas de conectividad Wi-Fi | `Provide step-by-step instructions for troubleshooting Wi-Fi connectivity issues. Include diagnostic steps, common error codes, and resolutions for each potential problem.` | `Guide the customer through Wi-Fi troubleshooting as a conversation. Start by asking what they've already tried, then suggest one simple step at a time. After each step, pause to check if it is clear before moving on to the next solution. Use everyday language instead of technical terms.` | 

**Restricciones de memoria**  
Recuerde que las interacciones habladas tienen una dinámica de memoria diferente a las de texto. Por ejemplo, los oyentes no pueden “volver” al texto anterior con tanta facilidad cuando es hablado.


| Task | Traditional prompt | Speech-optimized prompt | 
| --- |--- |--- |
| Explicación de una política de vuelta | `Reference sections 1.3, 2.7, and 4.2 from the attached document when answering the user's questions about regulatory compliance. Include specific paragraph numbers in your citations.` | `When explaining our return policy, focus on one key point at a time. First cover the 30-day window, then shipping requirements, and finally condition standards. Summarize all three points together at the end to reinforce the main requirements without overwhelming the customer.` | 

**Topics**
+ [Técnicas de peticiones específicas de la voz](prompting-speech-voice-language.md)
+ [Técnicas de contenido aptas para el habla](prompting-speech-bp-speech.md)
+ [Adaptación de los roles del sistema](prompting-speech-bp-sysrole.md)
+ [Cadena de pensamiento para el habla](prompting-speech-bp-reasoning.md)
+ [Integración de herramientas externas](prompting-speech-bp-tools.md)
+ [Técnicas de petición que se deben evitar](prompting-speech-bp-avoid.md)

# Técnicas de peticiones específicas de la voz
<a name="prompting-speech-voice-language"></a>

**nota**  
Esta documentación corresponde a la versión 1 de Amazon Nova. Para ver la guía de ingeniería de peticiones de voz a voz de Amazon Nova 2, consulte [Voice conversation prompts](https://docs.aws.amazon.com/nova/latest/nova2-userguide/sonic-system-prompts.html).

Incluso en el mismo idioma, las respuestas y la elección de palabras se pueden mejorar orientando el modelo a una configuración regional en particular. Por lo tanto, le sugerimos que incluya instrucciones en la petición del sistema para que utilice un idioma que sea natural y específico para la configuración regional de su voz.

Las voces y las configuraciones regionales disponibles son las siguientes:


| Idioma | ID de voz con sonido femenino | ID de voz con sonido masculino | 
| --- |--- |--- |
| English (EE. UU.) | tiffany | matthew | 
| Inglés (RU) | amy |  | 
| Francés | ambre | florian | 
| Italiano | beatrice | lorenzo | 
| Alemán | greta | lennart | 
| Español | lupe | carlos | 

------
#### [ British English ]

Para especificar el uso de inglés británico, agregue la siguiente línea a su petición:

`Use British English as your language for your responses.`

**Ejemplo de una petición completa con selección de inglés británico**  
`You are a friend. The user and you will engage in a spoken dialog exchanging the transcripts of a natural real-time conversation. Keep your responses short, generally two or three sentences for chatty scenarios. Avoid formatted lists or numbering and keep your output as a spoken transcript to be acted out. Use British English as your language for your responses.`

**Cómo especificar un ID de voz**  
Para seleccionar una voz específica para su interacción, incluya el parámetro `voiceId` en su configuración. Por ejemplo, para utilizar la voz en inglés británico `amy`, utilice la siguiente `audioOutputConfiguration`:

```
"audioOutputConfiguration": {
    "mediaType": "audio/lpcm",
    "sampleRateHertz": 24000,
    "sampleSizeBits": 16,
    "channelCount": 1,
    "voiceId": "amy",
    "encoding": "base64",
    "audioType": "SPEECH"
}
```

------
#### [ Spanish ]

Para especificar el español como idioma de respuesta, agregue la siguiente línea a su petición:

`Please respond exclusively in Spanish. If you have a question or suggestion, ask it in Spanish. I want to ensure that our communication remains in Spanish.`

**Ejemplo de una petición completa con selección de español**  
`You are a friend. The user and you will engage in a spoken dialog exchanging the transcripts of a natural real-time conversation. Keep your responses short, generally two or three sentences for chatty scenarios. Avoid formatted lists or numbering and keep your output as a spoken transcript to be acted out. Please respond exclusively in Spanish. If you have a question or suggestion, ask it in Spanish. I want to ensure that our communication remains in Spanish.`

**Cómo especificar un ID de voz**  
Para seleccionar una voz específica para su interacción, incluya el parámetro `voiceId` en su configuración. Por ejemplo, para usar la voz en español `carlos`, use la siguiente `audioOutputConfiguration`:

```
"audioOutputConfiguration": {
    "mediaType": "audio/lpcm",
    "sampleRateHertz": 24000,
    "sampleSizeBits": 16,
    "channelCount": 1,
    "voiceId": "carlos",
    "encoding": "base64",
    "audioType": "SPEECH"
}
```

------
#### [ French ]

Para especificar el francés como idioma de respuesta, agregue la siguiente línea a su petición:

`Please respond exclusively in French. If you have a question or suggestion, ask it in French. I want to ensure that our communication remains in French.`

**Ejemplo de una petición completa con selección de francés**  
`You are a friend. The user and you will engage in a spoken dialog exchanging the transcripts of a natural real-time conversation. Keep your responses short, generally two or three sentences for chatty scenarios. Avoid formatted lists or numbering and keep your output as a spoken transcript to be acted out. Please respond exclusively in French. If you have a question or suggestion, ask it in French. I want to ensure that our communication remains in French.`

**Cómo especificar un ID de voz**  
Para seleccionar una voz específica para su interacción, incluya el parámetro `voiceId` en su configuración. Por ejemplo, para usar la voz en francés `ambre`, use la siguiente `audioOutputConfiguration`:

```
"audioOutputConfiguration": {
    "mediaType": "audio/lpcm",
    "sampleRateHertz": 24000,
    "sampleSizeBits": 16,
    "channelCount": 1,
    "voiceId": "ambre",
    "encoding": "base64",
    "audioType": "SPEECH"
}
```

------
#### [ Italian ]

Para especificar el italiano como idioma de respuesta, agregue la siguiente línea a su petición:

`Please respond exclusively in Italian. If you have a question or suggestion, ask it in Italian. I want to ensure that our communication remains in Italian.`

**Ejemplo de una petición completa con selección de italiano**  
`You are a friend. The user and you will engage in a spoken dialog exchanging the transcripts of a natural real-time conversation. Keep your responses short, generally two or three sentences for chatty scenarios. Avoid formatted lists or numbering and keep your output as a spoken transcript to be acted out. Please respond exclusively in Italian. If you have a question or suggestion, ask it in Italian. I want to ensure that our communication remains in Italian.`

**Cómo especificar un ID de voz**  
Para seleccionar una voz específica para su interacción, incluya el parámetro `voiceId` en su configuración. Por ejemplo, para usar la voz en italiano `lorenzo`, use la siguiente `audioOutputConfiguration`:

```
"audioOutputConfiguration": {
    "mediaType": "audio/lpcm",
    "sampleRateHertz": 24000,
    "sampleSizeBits": 16,
    "channelCount": 1,
    "voiceId": "lorenzo",
    "encoding": "base64",
    "audioType": "SPEECH"
}
```

------
#### [ German ]

Para especificar el alemán como idioma de respuesta, agregue la siguiente línea a su petición:

`Please respond exclusively in German. If you have a question or suggestion, ask it in German. I want to ensure that our communication remains in German.`

**Ejemplo de una petición completa con selección de alemán**  
`You are a friend. The user and you will engage in a spoken dialog exchanging the transcripts of a natural real-time conversation. Keep your responses short, generally two or three sentences for chatty scenarios. Avoid formatted lists or numbering and keep your output as a spoken transcript to be acted out. Please respond exclusively in German. If you have a question or suggestion, ask it in German. I want to ensure that our communication remains in German.`

**Cómo especificar un ID de voz**  
Para seleccionar una voz específica para su interacción, incluya el parámetro `voiceId` en su configuración. Por ejemplo, para usar la voz en alemán `greta`, use la siguiente `audioOutputConfiguration`:

```
"audioOutputConfiguration": {
    "mediaType": "audio/lpcm",
    "sampleRateHertz": 24000,
    "sampleSizeBits": 16,
    "channelCount": 1,
    "voiceId": "greta",
    "encoding": "base64",
    "audioType": "SPEECH"
}
```

------

# Técnicas de contenido aptas para el habla
<a name="prompting-speech-bp-speech"></a>

**nota**  
Esta documentación corresponde a la versión 1 de Amazon Nova. Para ver la guía de ingeniería de peticiones de voz a voz de Amazon Nova 2, consulte [Voice conversation prompts](https://docs.aws.amazon.com/nova/latest/nova2-userguide/sonic-system-prompts.html).

Para mejorar la calidad conversacional de las respuestas, considere incorporar estos elementos en su petición del sistema:

**Conversación por turnos**  
Establezca expectativas claras sobre el ritmo y la estructura del intercambio del diálogo hablado. Por ejemplo:

`You are a friend. You and the user will engage in a spoken dialog exchanging the transcripts of a natural real-time conversation. As the agent, you'll be part of a spoken conversation with the user, following a sequence of user, agent, user, agent turns. When it's your turn to speak respond with a human touch, adding emotions, wit, playfulness, and empathy where it fits. Use simple, engaging, and helpful language.`

**Marcadores conversacionales**  
Fomente el uso de elementos naturales del habla como “Bueno”, “Ya sabes” o “En realidad” para simular una conversación real. Por ejemplo:

`You are a friend. You and the user will engage in a spoken dialog exchanging the transcripts of a natural real-time conversation.`

`Include natural speech elements like "Well," "You know," "Actually," "I mean," or "By the way" at appropriate moments to create an authentic, casual conversation flow.`

**Expresión emocional**  
Especifique la inclusión de indicadores de emoción textuales como “Ja, ja”, “Mmm” u “¡Oh\$1” cuando sea apropiado. Por ejemplo:

`You are a friend. You and the user will engage in a spoken dialog exchanging the transcripts of a natural real-time conversation. Express emotions verbally through phrases like "Haha," "Wow," "Hmm," "Oh!" or "That's amazing!" when appropriate to the conversation context.`

**Pausas reflexivas**  
Sugiera utilizar puntos suspensivos (…) para indicar breves momentos de reflexión o pausas naturales del habla. Por ejemplo:

`You are a friend. You and the user will engage in a spoken dialog exchanging the transcripts of a natural real-time conversation. Incorporate natural speech pauses using ellipses (...) when you're thinking or transitioning between topics.`

**Énfasis verbal**  
Recomiende técnicas para enfatizar la información importante que normalmente se destacaría visualmente. Por ejemplo:

`You are a friend. You and the user will engage in a spoken dialog exchanging the transcripts of a natural real-time conversation. Instead of using bold or italics, emphasize important information by using phrases like "The key thing to remember is," "What's really important here is," or "I want to highlight that." This ensures crucial points stand out in spoken form.`

**Organización verbal**  
Utilice puntos numerados, transiciones claras y resúmenes explícitos para una mejor comprensión por parte del oyente.

`You are a friend. You and the user will engage in a spoken dialog exchanging the transcripts of a natural real-time conversation. When sharing multiple points, use phrases like "first," "second," and "finally" to help the listener track the information. End complex explanations with "So in summary..." to reinforce key takeaways.`

**Señalización**  
Incluya señales verbales como “Permítame explicarle tres puntos clave” o “Para resumir lo que hemos discutido” en la petición del sistema.

`You are a friend. You and the user will engage in a spoken dialog exchanging the transcripts of a natural real-time conversation. Before sharing multiple ideas, give a preview like "I'm thinking of three reasons why..." and after completing a topic, use phrases like "That covers what I wanted to share about..." to signal topic transitions.`

# Adaptación de los roles del sistema
<a name="prompting-speech-bp-sysrole"></a>

**nota**  
Esta documentación corresponde a la versión 1 de Amazon Nova. Para ver la guía de ingeniería de peticiones de voz a voz de Amazon Nova 2, consulte [Voice conversation prompts](https://docs.aws.amazon.com/nova/latest/nova2-userguide/sonic-system-prompts.html).

Los modelos de texto de Amazon Nova se benefician de [definiciones de roles claras](https://docs.aws.amazon.com/nova/latest/userguide/prompting-system-role.html). Para las aplicaciones de Amazon Nova Sonic, tenga en cuenta lo siguiente:
+ Defina roles que suenen naturales al hablar (por ejemplo, “asesor amable” en lugar de “sistema de recuperación de información”).
+ Utilice descripciones de roles que enfaticen atributos conversacionales (cálido, paciente, conciso) en lugar de atributos orientados al texto (detallado, exhaustivo, sistemático).
+ Considere cómo la voz elegida podría influir en la personalidad percibida. Pruebe las voces para elegir la más adecuada para su caso de uso. Revise la sección [Directrices y ejemplos de creación de peticiones del sistema](prompting-speech-speech.md) para ver técnicas sobre cómo influir indirectamente en la prosodia natural del modelo.

# Cadena de pensamiento para el habla
<a name="prompting-speech-bp-reasoning"></a>

**nota**  
Esta documentación corresponde a la versión 1 de Amazon Nova. Para ver la guía de ingeniería de peticiones de voz a voz de Amazon Nova 2, consulte [Voice conversation prompts](https://docs.aws.amazon.com/nova/latest/nova2-userguide/sonic-system-prompts.html).

La [técnica de razonamiento en cadena de pensamiento](https://docs.aws.amazon.com/nova/latest/userguide/prompting-chain-of-thought.html) sigue siendo valiosa, pero requiere adaptación.
+ Mantenga las cadenas de razonamiento más cortas de lo que serían para las interacciones de texto.
+ Divida las explicaciones complejas en fragmentos de conversación más pequeños.
+ Use señales verbales (es decir, “En primer lugar… En segundo lugar…”) de forma más explícita que en el texto.

Aquí se presenta una petición de ejemplo sobre una cadena de pensamiento:

`You are a friendly assistant. The user will give you a problem. Explain your reasoning following the guidelines given in CONSTITUTION - REASONING, and summarize your decision at the end of your response, in one sentence.`

`## CONSTITUTION - REASONING `

`1. For simple questions including simple calculations or contextual tasks: Give the answer directly. No explanation is necessary, although you can offer to provide more information if the user requests it. `

`2. When faced with complex problems or decisions, think through the steps systematically before providing your answer. Break down your reasoning process when it would help user understanding.`

`3. For subjective matters or comparisons: explain your thought process step-by-step.`

# Integración de herramientas externas
<a name="prompting-speech-bp-tools"></a>

**nota**  
Esta documentación corresponde a la versión 1 de Amazon Nova. Para ver la guía de ingeniería de peticiones de voz a voz de Amazon Nova 2, consulte [Voice conversation prompts](https://docs.aws.amazon.com/nova/latest/nova2-userguide/sonic-system-prompts.html).

Cuando [utilice herramientas externas](https://docs.aws.amazon.com/nova/latest/userguide/prompting-tools.html) con Amazon Nova Sonic, le recomendamos lo siguiente:
+ Diseñe invocaciones de herramientas para gestionar posibles errores de reconocimiento automático de voz en las entradas de los usuarios.
+ Tenga en cuenta el hecho de que los usuarios no pueden ver las herramientas que se utilizan.
+ Proporcione una confirmación verbal cuando se consulten las herramientas.

# Técnicas de petición que se deben evitar
<a name="prompting-speech-bp-avoid"></a>

**nota**  
Esta documentación corresponde a la versión 1 de Amazon Nova. Para ver la guía de ingeniería de peticiones de voz a voz de Amazon Nova 2, consulte [Voice conversation prompts](https://docs.aws.amazon.com/nova/latest/nova2-userguide/sonic-system-prompts.html).

Cuando cree peticiones para Amazon Nova Sonic, le recomendamos que evite lo siguiente:
+ Formato visual, como viñetas, tablas o bloques de código.
+ Modificaciones en las características de la voz, como el acento, la edad o el ritmo.
+ Efectos de sonido u onomatopeyas extensas.
+ Contenido destinado a la visualización en lugar de a la escucha.