

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

# Long-form voci
<a name="long-form-voices"></a>

Amazon Polly ha un **Long-form motore** che produce voci simili a quelle umane, altamente espressive ed emotivamente abili. Long-form le voci sono progettate per attirare l'attenzione degli ascoltatori per contenuti più lunghi, come articoli di notizie, materiali di formazione o video di marketing.

 Long-form Le voci di Amazon Polly sono sviluppate con una tecnologia TTS di deep learning all'avanguardia. Il modello impara a replicare fonemi, prosodia, intonazione e altri aspetti fonetici e acustici del linguaggio umano, ottenendo un output vocale estremamente naturale.

Il Long-form motore utilizza gli incorporamenti di testo per interpretare il significato di un testo. Utilizzando gli incorporamenti di testo, il Long-form motore può generare l'enfasi, le pause e il tono corretti di una voce naturale. Il risultato è una voce che combina la gamma completa di elementi emotivi presenti nella comunicazione umana. Ciò include l'imitazione del dialogo a sorpresa o la differenziazione del dialogo dalla narrazione. Insieme, questo crea un prodotto vocale di alta qualità che sembra un essere umano vivo.

**Nota**  
La tecnologia all'avanguardia alla base di queste voci rientra nel paradigma dell'intelligenza artificiale generativa per la modellazione del linguaggio e della voce. Un effetto collaterale della tecnologia è che qualsiasi aggiornamento ai dati di addestramento e al modello potrebbe comportare lievi variazioni nel modo in cui le voci suonano, anche nel caso in cui la loro qualità complessiva migliori con gli aggiornamenti del modello. Ciò potrebbe avere un impatto sui casi d'uso con diverse parti di contenuto sintetizzate per un lungo periodo di tempo, ad esempio una stagione di podcast.

## Voci in formato lungo disponibili
<a name="long-form-voicelist"></a>

Amazon Polly attualmente offre quattro voci in formato esteso en-US e due es-ES. In entrambe le lingue sono disponibili voci femminili e maschili. Le voci lunghe inglesi Daniel, Gregory e Ruth sono disponibili anche in una variante conversazionale NTTS. 


|  | Lingua | Codice lingua | Name/ID | Gender | 
| --- | --- | --- | --- | --- | 
| 1 | **Inglese (Stati Uniti)** | it-IT | Danielle<br />Gregory<br />Ruth\*\*<br />Patrizio | Femmina<br />Maschio<br />Femmina<br />Maschio | 
| 2 | **Spagnolo (Spagna)** | es-ES | Alba<br />Raúl | Femmina<br />Maschio | 

## Compatibilità tra funzionalità e aree geografiche
<a name="long-form-regions"></a>

Le voci estese di Amazon Polly sono disponibili nelle seguenti regioni:
+ Stati Uniti orientali (Virginia settentrionale): us-east-1
+ Altre regioni non disponibili

**Il Long-form motore Amazon Polly supporta le seguenti funzionalità:**
+ Real-time e operazioni di sintesi vocale asincrona. 
+ [Tutti i segni vocali.](https://docs.aws.amazon.com/polly/latest/dg/speechmarks.html) 
+ Molti tag SSML (ma non tutti) sono supportati da Amazon Polly. [Per ulteriori informazioni sui tag SSML, consulta Tag NTTS-supported SSML supportati](https://docs.aws.amazon.com/polly/latest/dg/supportedtags.html) 
+ Come per le voci standard, puoi scegliere tra diverse frequenze di campionamento per ottimizzare la larghezza di banda e la qualità audio della tua applicazione. Le frequenze di campionamento valide per voci standard, di forma lunga e neurali sono: 8 kHz, 16 kHz, 22 kHz o 24 kHz. Il valore predefinito per le voci standard è 22 kHz. L'impostazione predefinita per le voci lunghe e neurali è 24 kHz. Amazon Polly supporta i formati di flusso audio MP3, OGG (Vorbis) e PCM raw.

**Nota**  
Long-form il costo delle voci è specificato nella pagina di [informazioni sui prezzi di Amazon Polly](https://aws.amazon.com/polly/pricing/).