Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.
StartSpeechSynthesisTask
Consente la creazione di un'attività di sintesi asincrona, avviando un nuovo SpeechSynthesisTask. Questa operazione richiede tutte le informazioni standard necessarie per la sintesi vocale, oltre al nome di un bucket Amazon S3 affinché il servizio archivi l'output dell'attività di sintesi e due parametri opzionali (OutputS3KeyPrefix e SnsTopicArn). Una volta creata l'attività di sintesi, questa operazione restituirà un oggetto SpeechSynthesisTask, che includerà un identificatore di questa attività e lo stato corrente. L'oggetto SpeechSynthesisTask è disponibile per 72 ore dopo l'avvio dell'attività di sintesi asincrona.
Sintassi della richiesta
POST /v1/synthesisTasks HTTP/1.1
Content-type: application/json
{
"Engine": "string",
"LanguageCode": "string",
"LexiconNames": [ "string" ],
"OutputFormat": "string",
"OutputS3BucketName": "string",
"OutputS3KeyPrefix": "string",
"SampleRate": "string",
"SnsTopicArn": "string",
"SpeechMarkTypes": [ "string" ],
"Text": "string",
"TextType": "string",
"VoiceId": "string"
}
Parametri della richiesta URI:
La richiesta non utilizza parametri URI.
Corpo della richiesta
La richiesta accetta i seguenti dati in formato JSON.
- Engine
-
Speciifica il motore (
standard,neural,long-formorgenerative) per Amazon Polly da utilizzare durante l'elaborazione del testo di input per la sintesi vocale. Se si utilizza una voce non supportata per il motore selezionato, si verificherà un errore.Tipo: stringa
Valori validi:
standard | neural | long-form | generativeCampo obbligatorio: no
- LanguageCode
-
Codice lingua facoltativo per la richiesta di sintesi vocale. Ciò è necessario solo se si utilizza una voce bilingue, come Aditi, che può essere utilizzata sia per l'inglese indiano (en-IN) che per l'hindi (hi-IN).
Se viene utilizzata una voce bilingue e non viene specificato alcun codice lingua, Amazon Polly utilizza la lingua predefinita della voce bilingue. La lingua predefinita per ogni voce è quella restituita dall'DescribeVoicesoperazione per il
LanguageCodeparametro. Ad esempio, se non viene specificato alcun codice di lingua, Aditi utilizzerà l'inglese indiano anziché l'hindi.Tipo: stringa
Valori validi:
arb | cmn-CN | cy-GB | da-DK | de-DE | en-AU | en-GB | en-GB-WLS | en-IN | en-US | es-ES | es-MX | es-US | fr-CA | fr-FR | is-IS | it-IT | ja-JP | hi-IN | ko-KR | nb-NO | nl-NL | pl-PL | pt-BR | pt-PT | ro-RO | ru-RU | sv-SE | tr-TR | en-NZ | en-ZA | ca-ES | de-AT | yue-CN | ar-AE | fi-FI | en-IE | nl-BE | fr-BE | cs-CZ | de-CHCampo obbligatorio: no
- LexiconNames
-
Elenco di uno o più nomi di lessico di pronuncia che si desidera applicare il servizio durante la sintesi. I lessici vengono applicati solo se la lingua del lessico corrisponde alla lingua della voce.
Tipo: matrice di stringhe
Membri della matrice: numero massimo di 5 elementi.
Modello:
[0-9A-Za-z]{1,20}Campo obbligatorio: no
- OutputFormat
-
Il formato in cui verrà codificato l'output restituito. Per il flusso audio, questo sarà mp3, ogg_vorbis, o pcm. Per i segni vocali, questo sarà json.
Tipo: stringa
Valori validi:
json | mp3 | ogg_vorbis | pcmCampo obbligatorio: sì
- OutputS3BucketName
-
Nome del bucket Amazon S3 in cui viene salvato il file di output.
Tipo: stringa
Modello:
^[a-z0-9][\.\-a-z0-9]{1,61}[a-z0-9]$Campo obbligatorio: sì
- OutputS3KeyPrefix
-
Prefisso della chiave Amazon S3 per il file vocale di output.
Tipo: stringa
Modello:
^[0-9a-zA-Z\/\!\-_\.\*\'\(\):;\$@=+\,\?&]{0,800}$Campo obbligatorio: no
- SampleRate
-
La frequenza audio specificata in Hz.
I valori validi per mp3 e ogg_vorbis sono "8000", "16000", "22050" e "24000". Il valore predefinito per le voci standard è "22050". Il valore predefinito per le voci neurali è "24000". Il valore predefinito per le voci lunghe è «24000". Il valore predefinito per le voci generative è «24000".
I valori validi per pcm sono "8000" e "16000". Il valore predefinito è "16000".
Tipo: string
Campo obbligatorio: no
- SnsTopicArn
-
ARN per l'argomento SNS utilizzato facoltativamente per la notifica di stato per un'attività di sintesi vocale.
Tipo: stringa
Modello:
^arn:aws(-(cn|iso(-b)?|us-gov))?:sns:[a-z0-9_-]{1,50}:\d{12}:[a-zA-Z0-9_-]{1,251}([a-zA-Z0-9_-]{0,5}|\.fifo)$Campo obbligatorio: no
- SpeechMarkTypes
-
Tipo di segni vocali restituiti per il testo di input.
Tipo: matrice di stringhe
Membri della matrice: numero massimo di 4 elementi.
Valori validi:
sentence | ssml | viseme | wordCampo obbligatorio: no
- Text
-
Testo di input da sintetizzare. Se specificate ssml come TextType, seguite il formato SSML per il testo di input.
Tipo: stringa
Campo obbligatorio: sì
- TextType
-
Specifica se il testo di input è testo normale o SSML. Il valore di default è testo normale.
Tipo: stringa
Valori validi:
ssml | textCampo obbligatorio: no
- VoiceId
-
ID vocale da utilizzare per la sintesi.
Tipo: stringa
Valori validi:
Aditi | Amy | Astrid | Bianca | Brian | Camila | Carla | Carmen | Celine | Chantal | Conchita | Cristiano | Dora | Emma | Enrique | Ewa | Filiz | Gabrielle | Geraint | Giorgio | Gwyneth | Hans | Ines | Ivy | Jacek | Jan | Joanna | Joey | Justin | Karl | Kendra | Kevin | Kimberly | Lea | Liv | Lotte | Lucia | Lupe | Mads | Maja | Marlene | Mathieu | Matthew | Maxim | Mia | Miguel | Mizuki | Naja | Nicole | Olivia | Penelope | Raveena | Ricardo | Ruben | Russell | Salli | Seoyeon | Takumi | Tatyana | Vicki | Vitoria | Zeina | Zhiyu | Aria | Ayanda | Arlet | Hannah | Arthur | Daniel | Liam | Pedro | Kajal | Hiujin | Laura | Elin | Ida | Suvi | Ola | Hala | Andres | Sergio | Remi | Adriano | Thiago | Ruth | Stephen | Kazuha | Tomoko | Niamh | Sofie | Lisa | Isabelle | Zayd | Danielle | Gregory | Burcu | Jitka | SabrinaCampo obbligatorio: sì
Sintassi della risposta
HTTP/1.1 200
Content-type: application/json
{
"SynthesisTask": {
"CreationTime": number,
"Engine": "string",
"LanguageCode": "string",
"LexiconNames": [ "string" ],
"OutputFormat": "string",
"OutputUri": "string",
"RequestCharacters": number,
"SampleRate": "string",
"SnsTopicArn": "string",
"SpeechMarkTypes": [ "string" ],
"TaskId": "string",
"TaskStatus": "string",
"TaskStatusReason": "string",
"TextType": "string",
"VoiceId": "string"
}
}
Elementi di risposta
Se l'operazione riesce, il servizio restituisce una risposta HTTP 200.
I dati seguenti vengono restituiti in formato JSON mediante il servizio.
- SynthesisTask
-
SynthesisTask oggetto che fornisce informazioni e attributi su un compito di sintesi vocale appena inviato.
Tipo: oggetto SynthesisTask
Errori
- EngineNotSupportedException
-
Questo motore non è compatibile con la voce designata. Scegli una nuova voce compatibile con il motore o cambia il motore e riavvia l'operazione.
Codice di stato HTTP: 400
- InvalidS3BucketException
-
Il nome del bucket Amazon S3 non è valido. Controlla il tuo input con i requisiti di denominazione del S3 Bucket e riprova.
Codice di stato HTTP: 400
- InvalidS3KeyException
-
Il prefisso della chiave Amazon S3 non è valido. Fornisci un nome chiave oggetto S3 valido.
Codice di stato HTTP: 400
- InvalidSampleRateException
-
La frequenza di campionamento specificata non è valida.
Codice di stato HTTP: 400
- InvalidSnsTopicArnException
-
L'ARN dell'argomento SNS fornito non è valido. Fornisci un ARN di argomento SNS valido e riprova.
Codice di stato HTTP: 400
- InvalidSsmlException
-
L'SSML fornito non è valido. Verifica la sintassi SSML, l'ortografia dei tag e dei valori, quindi riprova.
Codice di stato HTTP: 400
- LanguageNotSupportedException
-
La lingua specificata non è attualmente supportata da Amazon Polly in questa capacità.
Codice di stato HTTP: 400
- LexiconNotFoundException
-
Amazon Polly non è in grado di individuare il lessico specificato. Ciò potrebbe essere causato da un lessico mancante, il suo nome è errato o specificando un lessico che si trova in una regione diversa.
Verificare che il lessico esista, sia nella regione (consulta ListLexicons) e che hai digitato il suo nome sia corretto. Allora try again.
Codice di stato HTTP: 404
- MarksNotSupportedForFormatException
-
I contrassegni vocali non sono supportati per
OutputFormatselezionato. I contrassegni vocali sono disponibili solo per il contenuto in formatojson.Codice di stato HTTP: 400
- ServiceFailureException
-
Una condizione sconosciuta ha causato un errore di servizio.
Codice di stato HTTP: 500
- SsmlMarksNotSupportedForTextTypeException
-
I contrassegni vocali SSML non sono supportati per l'input di tipo testo normale.
Codice di stato HTTP: 400
- TextLengthExceededException
-
Il valore del parametro "Testo" è più lungo dei limiti accettati. Per il API
SynthesizeSpeech, il limite per il testo di input è un massimo di 6000 caratteri totali, di cui non più di 3000 caratteri possono essere fatturati. Per il APIStartSpeechSynthesisTask, il massimo è 200.000 caratteri, di cui non più di 100.000 caratteri possono essere fatturati. I tag SSML non vengono conteggiati come caratteri fatturati.Codice di stato HTTP: 400
Vedi anche
Per ulteriori informazioni sull'utilizzo di questa API in una delle lingue specifiche AWS SDKs, consulta quanto segue: