As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.
StartTranscriptionJob
Transcreve o áudio de um arquivo de mídia e aplica quaisquer parâmetros de solicitação adicionais que você escolher incluir em sua solicitação.
Para fazer umaStartTranscriptionJob solicitação, você deve primeiro carregar seu arquivo de mídia em um bucket do Amazon S3; depois, você pode especificar a localização do arquivo no Amazon S3 usando oMedia parâmetro.
Você deve incluir os seguintes parâmetros em suaStartTranscriptionJob solicitação:
-
region: ORegião da AWS local em que você está fazendo sua solicitação. Para obter uma lista deRegiões da AWS opções compatíveis com o Amazon Transcribe, consulte os endpoints e cotas do Amazon Transcribe. -
TranscriptionJobName: um nome personalizado que você cria para seu trabalho de transcrição que é exclusivo dentro do seuConta da AWS. -
Media(MediaFileUri): A localização do seu arquivo de mídia no Amazon S3. -
Um dos
LanguageCodeIdentifyLanguage, ouIdentifyMultipleLanguages: Se você souber o idioma do seu arquivo de mídia, especifique-o usando oLanguageCodeparâmetro; você pode encontrar todos os códigos de idioma válidos na tabela Idiomas suportados. Se você não conhece os idiomas falados em sua mídia, use umIdentifyLanguageouIdentifyMultipleLanguagese deixe que o Amazon Transcribe identifique os idiomas para você.
Sintaxe da solicitação
{
"ContentRedaction": {
"PiiEntityTypes": [ "string" ],
"RedactionOutput": "string",
"RedactionType": "string"
},
"IdentifyLanguage": boolean,
"IdentifyMultipleLanguages": boolean,
"JobExecutionSettings": {
"AllowDeferredExecution": boolean,
"DataAccessRoleArn": "string"
},
"KMSEncryptionContext": {
"string" : "string"
},
"LanguageCode": "string",
"LanguageIdSettings": {
"string" : {
"LanguageModelName": "string",
"VocabularyFilterName": "string",
"VocabularyName": "string"
}
},
"LanguageOptions": [ "string" ],
"Media": {
"MediaFileUri": "string",
"RedactedMediaFileUri": "string"
},
"MediaFormat": "string",
"MediaSampleRateHertz": number,
"ModelSettings": {
"LanguageModelName": "string"
},
"OutputBucketName": "string",
"OutputEncryptionKMSKeyId": "string",
"OutputKey": "string",
"Settings": {
"ChannelIdentification": boolean,
"MaxAlternatives": number,
"MaxSpeakerLabels": number,
"ShowAlternatives": boolean,
"ShowSpeakerLabels": boolean,
"VocabularyFilterMethod": "string",
"VocabularyFilterName": "string",
"VocabularyName": "string"
},
"Subtitles": {
"Formats": [ "string" ],
"OutputStartIndex": number
},
"Tags": [
{
"Key": "string",
"Value": "string"
}
],
"TranscriptionJobName": "string"
}
Parâmetros de solicitação
Para obter informações sobre os parâmetros que são comuns a todas as ações, consulte Parâmetros comuns.
A solicitação aceita os dados a seguir no formato JSON.
- ContentRedaction
-
Permite redigir ou sinalizar informações de identificação pessoal (PII) (PII) em sua transcrição). Se você usar
ContentRedaction, também deverá incluir os subparâmetros:PiiEntityTypesRedactionOutput,RedactionTypee.Tipo: objeto ContentRedaction
Obrigatório: não
- IdentifyLanguage
-
Permite a identificação automática do idioma em sua solicitação de trabalho de transcrição. Use esse parâmetro se seu arquivo de mídia contiver somente um idioma. Se sua mídia contiver vários idiomas, use
IdentifyMultipleLanguagesem vez disso.Se você incluir
IdentifyLanguage, você pode, opcionalmente, incluir uma lista de códigos de idioma, usandoLanguageOptions, que você acha que podem estar presentes em seu arquivo de mídia.LanguageOptionsIncluir restrições somenteIdentifyLanguageàs opções de idioma que você especificar, o que pode melhorar a precisão da transcrição.Se você quiser aplicar um modelo de idioma personalizado, um vocabulário personalizado ou um filtro de vocabulário personalizado à sua solicitação de identificação automática de idioma,
LanguageIdSettingsinclua os subparâmetros relevantes (VocabularyNameLanguageModelName, eVocabularyFilterName). Se você incluirLanguageIdSettings, inclua tambémLanguageOptions.Observe que você deve incluir um dos
LanguageCodeIdentifyLanguage, ouIdentifyMultipleLanguagesem sua solicitação. Se você incluir mais de um desses parâmetros, seu trabalho de transcrição falhará.Tipo: booliano
Obrigatório: não
- IdentifyMultipleLanguages
-
Permite a identificação automática em vários idiomas em sua solicitação de trabalho de transcrição. Use esse parâmetro se seu arquivo de mídia contiver mais de um idioma. Se sua mídia contiver apenas um idioma, use
IdentifyLanguageem vez disso.Se você incluir
IdentifyMultipleLanguages, você pode, opcionalmente, incluir uma lista de códigos de idioma, usandoLanguageOptions, que você acha que podem estar presentes em seu arquivo de mídia.LanguageOptionsIncluir restrições somenteIdentifyLanguageàs opções de idioma que você especificar, o que pode melhorar a precisão da transcrição.Se você quiser aplicar um vocabulário personalizado ou um filtro de vocabulário personalizado à sua solicitação de identificação automática de idioma,
LanguageIdSettingsinclua os subparâmetros relevantes (VocabularyNameeVocabularyFilterName). Se você incluirLanguageIdSettings, inclua tambémLanguageOptions.Observe que você deve incluir um dos
LanguageCodeIdentifyLanguage, ouIdentifyMultipleLanguagesem sua solicitação. Se você incluir mais de um desses parâmetros, seu trabalho de transcrição falhará.Tipo: booliano
Obrigatório: não
- JobExecutionSettings
-
Permite controlar como seu trabalho de transcrição é processado. Atualmente, a única
JobExecutionSettingsmodificação que você pode escolher é habilitar o enfileiramento de trabalhos usando oAllowDeferredExecutionsubparâmetro.Se você incluir
JobExecutionSettingsem sua solicitação, também deverá incluir os subparâmetros:AllowDeferredExecutionDataAccessRoleArne.Tipo: objeto JobExecutionSettings
Obrigatório: não
- KMSEncryptionContext
-
Um mapa de pares chave-valor não secretos de texto simples, conhecidos como pares de contexto de criptografia, que fornecem uma camada adicional de segurança para seus dados. Para obter mais informações, consulte contextoAWS KMS de criptografia e Chaves assimétricas emAWS KMS.
Tipo:: mapa de string para string
Entradas do mapa: número máximo de 10 itens.
Restrições de tamanho de chave: tamanho mínimo de 1. Tamanho máximo de 2000.
Padrão da chave:
.*\S.*Restrições de tamanho do valor: tamanho mínimo de 1. Tamanho máximo de 2000.
Padrão de valor:
.*\S.*Obrigatório: não
- LanguageCode
-
O código do idioma que representa o idioma falado no arquivo de mídia de entrada.
Se você não tiver certeza do idioma falado em seu arquivo de mídia, considere usar
IdentifyLanguageouIdentifyMultipleLanguageshabilitar a identificação automática do idioma.Observe que você deve incluir um dos
LanguageCodeIdentifyLanguage, ouIdentifyMultipleLanguagesem sua solicitação. Se você incluir mais de um desses parâmetros, seu trabalho de transcrição falhará.Para obter uma lista dos idiomas suportados e seus códigos de idioma associados, consulte a tabela de idiomas suportados.
nota
Para transcrever a fala em árabe padrão moderno (
ar-SA), seu arquivo de mídia deve ser codificado a uma taxa de amostragem de 16.000 Hz ou superior.Tipo: String
Valores válidos:
af-ZA | ar-AE | ar-SA | da-DK | de-CH | de-DE | en-AB | en-AU | en-GB | en-IE | en-IN | en-US | en-WL | es-ES | es-US | fa-IR | fr-CA | fr-FR | he-IL | hi-IN | id-ID | it-IT | ja-JP | ko-KR | ms-MY | nl-NL | pt-BR | pt-PT | ru-RU | ta-IN | te-IN | tr-TR | zh-CN | zh-TW | th-TH | en-ZA | en-NZ | vi-VN | sv-SEObrigatório: não
- LanguageIdSettings
-
Se estiver usando a identificação automática de idioma em sua solicitação e você quiser aplicar um modelo de idioma personalizado, um vocabulário personalizado ou um filtro de vocabulário personalizado,
LanguageIdSettingsinclua os subparâmetros relevantes (VocabularyNameLanguageModelName, eVocabularyFilterName). Observe que a identificação multilíngue (IdentifyMultipleLanguages) não oferece suporte a modelos de linguagem personalizados.LanguageIdSettingssuporta códigos de dois a cinco idiomas. Cada código de idioma que você incluir pode ter um modelo de idioma personalizado associado, vocabulário personalizado e filtro de vocabulário personalizado. Os códigos de idioma que você especificar devem corresponder aos idiomas dos modelos de idioma personalizados associados, vocabulários personalizados e filtros de vocabulário personalizados.É recomendável que você inclua
LanguageOptionsao usarLanguageIdSettingspara garantir que o dialeto correto do idioma seja identificado. Por exemplo, se você especificar um vocabulário personalizado que está em usoen-US, mas o Amazon Transcribe determina que o idioma falado em sua mídia éen-AU, seu vocabulário personalizado não será aplicado à sua transcrição. Se você incluirLanguageOptionse incluiren-UScomo único dialeto em inglês, seu vocabulário personalizado será aplicado à sua transcrição.Se você quiser incluir um modelo de idioma personalizado em sua solicitação, mas não quiser usar a identificação automática de idioma, use o
ModelSettingsparâmetro com oLanguageModelNamesubparâmetro. Se você quiser incluir um vocabulário personalizado ou um filtro de vocabulário personalizado (ou ambos) em sua solicitação, mas não quiser usar a identificação automática de idioma, use oSettingsparâmetro com o subparâmetroVocabularyNameouVocabularyFilterName(ou ambos).Tipo: mapa de string paraLanguageIdSettings o objeto
Entradas do mapa: número máximo de 5 itens.
Chaves válidas:
af-ZA | ar-AE | ar-SA | da-DK | de-CH | de-DE | en-AB | en-AU | en-GB | en-IE | en-IN | en-US | en-WL | es-ES | es-US | fa-IR | fr-CA | fr-FR | he-IL | hi-IN | id-ID | it-IT | ja-JP | ko-KR | ms-MY | nl-NL | pt-BR | pt-PT | ru-RU | ta-IN | te-IN | tr-TR | zh-CN | zh-TW | th-TH | en-ZA | en-NZ | vi-VN | sv-SEObrigatório: não
- LanguageOptions
-
Você pode especificar dois ou mais códigos de idioma que representem os idiomas que você acha que podem estar presentes na sua mídia. Incluir mais de cinco não é recomendado. Se você não tiver certeza de quais idiomas estão presentes, não inclua esse parâmetro.
Se você incluir
LanguageOptionsem sua solicitação, também deverá incluirIdentifyLanguage.Para obter mais informações, consulte Idiomas suportados.
Para transcrever a fala em árabe padrão moderno (
ar-SA), seu arquivo de mídia deve ser codificado a uma taxa de amostragem de 16.000 Hz ou superior.Tipo: matriz de strings
Membros da matriz: número mínimo de 1 item.
Valores válidos:
af-ZA | ar-AE | ar-SA | da-DK | de-CH | de-DE | en-AB | en-AU | en-GB | en-IE | en-IN | en-US | en-WL | es-ES | es-US | fa-IR | fr-CA | fr-FR | he-IL | hi-IN | id-ID | it-IT | ja-JP | ko-KR | ms-MY | nl-NL | pt-BR | pt-PT | ru-RU | ta-IN | te-IN | tr-TR | zh-CN | zh-TW | th-TH | en-ZA | en-NZ | vi-VN | sv-SEObrigatório: não
- Media
-
Descreve a localização do arquivo de mídia no Amazon S3 que você deseja usar em sua solicitação.
Tipo: objeto Media
Obrigatório: Sim
- MediaFormat
-
Especifique o formato do seu arquivo de mídia de entrada.
Tipo: String
Valores válidos:
mp3 | mp4 | wav | flac | ogg | amr | webmObrigatório: não
- MediaSampleRateHertz
-
A taxa de amostragem, em hertz, da faixa de áudio em seu arquivo de mídia de entrada.
Se você não especificar a taxa de amostragem de mídia, o Amazon Transcribe a determinará para você. Se você especificar a taxa de amostragem, ela deverá corresponder à taxa detectada pelo Amazon Transcribe. Se houver uma incompatibilidade entre o valor que você especifica e o valor detectado, seu trabalho falhará. Na maioria dos casos, você pode omitir
MediaSampleRateHertze deixar o Amazon Transcribe determinar a taxa de amostragem.Tipo: inteiro
Intervalo válido: valor mínimo de 8000. Valor máximo de 48000.
Obrigatório: não
- ModelSettings
-
Especifique o modelo de idioma personalizado que você deseja incluir em seu trabalho de transcrição. Se você incluir
ModelSettingsem sua solicitação, deverá incluir oLanguageModelNamesubparâmetro.Para obter mais informações, consulte Modelos de linguagem personalizados.
Tipo: objeto ModelSettings
Obrigatório: não
- OutputBucketName
-
O nome do bucket do Amazon S3 onde você deseja armazenar sua saída de transcrição. Não inclua o
S3://prefixo do bucket especificado.Se você quiser que sua saída vá para uma subpasta desse bucket, especifique-a usando o
OutputKeyparâmetro;OutputBucketNamesó aceita o nome de um bucket.Por exemplo, se você quiser que sua saída seja armazenada em
S3://DOC-EXAMPLE-BUCKET,OutputBucketNamedefina comoDOC-EXAMPLE-BUCKET. No entanto, se você quiser que sua saída seja armazenada emS3://DOC-EXAMPLE-BUCKET/test-files/,OutputBucketNamedefina comoDOC-EXAMPLE-BUCKETeOutputKeyparatest-files/.Observe que o Amazon Transcribe deve ter permissão para usar o local especificado. Você pode alterar as permissões do Amazon S3 usando AWS Management Console
o. Consulte também Permissões necessárias para funções de usuário do IAM. Se você não especificar
OutputBucketName, sua transcrição será colocada em um bucket Amazon S3 gerenciado por serviços e você receberá um URI para acessar sua transcrição.Tipo: String
Restrições de comprimento: comprimento máximo de 64.
Padrão:
[a-z0-9][\.\-a-z0-9]{1,61}[a-z0-9]Obrigatório: não
- OutputEncryptionKMSKeyId
-
A chave do KMS que você deseja usar para criptografar sua saída de transcrição.
Se estiver usando uma chave localizada na atualConta da AWS, você pode especificar sua chave KMS de uma das quatro maneiras:
-
Use o próprio ID da chave KMS. Por exemplo,
1234abcd-12ab-34cd-56ef-1234567890ab. -
Use um alias para o ID da chave do KMS. Por exemplo,
alias/ExampleAlias. -
Use o nome do recurso da Amazon (ARN) para o ID da chave do KMS). Por exemplo,
arn:aws:kms:region:account-ID:key/1234abcd-12ab-34cd-56ef-1234567890ab. -
Use o ARN para o alias da chave do KMS. Por exemplo,
arn:aws:kms:region:account-ID:alias/ExampleAlias.
Se estiver usando uma chave localizada em umaConta da AWS posição diferente da atualConta da AWS, você pode especificar sua chave KMS de duas maneiras:
-
Use o ARN para o ID da chave KMS. Por exemplo,
arn:aws:kms:region:account-ID:key/1234abcd-12ab-34cd-56ef-1234567890ab. -
Use o ARN para o alias da chave do KMS. Por exemplo,
arn:aws:kms:region:account-ID:alias/ExampleAlias.
Se você não especificar uma chave de criptografia), sua saída será criptografada com a chave do Amazon S3) (Chave do Amazon S3) (SSE-S3)).
Se você especificar uma chave KMS para criptografar sua saída, também deverá especificar um local de saída usando o
OutputLocationparâmetro.Observe que a função que faz aStartCallAnalyticsJob solicitação deve ter permissão para usar a chave do KMS selecionada.
Tipo: String
Restrições de tamanho: tamanho mínimo 1. Tamanho máximo de 2048.
Padrão:
^[A-Za-z0-9][A-Za-z0-9:_/+=,@.-]{0,2048}$Obrigatório: não
-
- OutputKey
-
Use em combinação com
OutputBucketNamepara especificar o local de saída de sua transcrição e, opcionalmente, um nome exclusivo para seu arquivo de saída. O nome padrão para sua saída de transcrição é o mesmo que você especificou para sua tarefa de transcrição (TranscriptionJobName).Estes são alguns exemplos de como você pode usar
OutputKey:-
Se você especificar 'DOC-EXAMPLE-BUCKET' como
OutputBucketNamee 'my-transcript.json' como oOutputKey, seu caminho de saída da transcrição serás3://DOC-EXAMPLE-BUCKET/my-transcript.json. -
Se você especificar 'my-first-transcription' como o
TranscriptionJobName, 'DOC-EXAMPLE-BUCKET' como e 'my-transcript' como oOutputKey, seu caminho de saída da transcrição serás3://DOC-EXAMPLE-BUCKET/my-transcript/my-first-transcription.json.OutputBucketName -
Se você especificar 'DOC-EXAMPLE-BUCKET' como
OutputBucketNamee 'test-files/my-transcript.json' como oOutputKey, seu caminho de saída da transcrição serás3://DOC-EXAMPLE-BUCKET/test-files/my-transcript.json. -
Se você especificar 'my-first-transcription' como o
TranscriptionJobName, 'DOC-EXAMPLE-BUCKET' como oOutputBucketNamee 'test-files/my-transcript' como oOutputKey, seu caminho de saída da transcrição serás3://DOC-EXAMPLE-BUCKET/test-files/my-transcript/my-first-transcription.json.
Se você especificar o nome de uma subpasta de bucket do Amazon S3 que não existe, uma será criada para você.
Tipo: String
Restrições de tamanho: tamanho mínimo 1. Tamanho máximo de 1024.
Padrão:
[a-zA-Z0-9-_.!*'()/]{1,1024}$Obrigatório: não
-
- Settings
-
Especifique configurações opcionais adicionais em suaStartTranscriptionJob solicitação, incluindo identificação de canal, transcrições alternativas e particionamento de alto-falantes. Você pode usar isso para aplicar vocabulários e filtros de vocabulário personalizados.
Se você quiser incluir um vocabulário personalizado ou um filtro de vocabulário personalizado (ou ambos) em sua solicitação, mas não quiser usar a identificação automática de idioma, use
Settingscom o subparâmetroVocabularyNameouVocabularyFilterName(ou ambos).Se você estiver usando a identificação automática de idioma com sua solicitação e quiser incluir um modelo de idioma personalizado, um vocabulário personalizado ou um filtro de vocabulário personalizado, use o
LanguageIdSettingsparâmetro comVocabularyFilterNameos subparâmetrosVocabularyNameou.LanguageModelNameTipo: objeto Settings
Obrigatório: não
- Subtitles
-
Produz arquivos de legenda para sua mídia de entrada. Você pode especificar os formatos WebVTT (*.vtt) e SubRip (*.srt).
Tipo: objeto Subtitles
Obrigatório: não
- Tags
-
Adiciona uma ou mais tags personalizadas, cada uma na forma de um par chave:valor, a um novo trabalho de transcrição no momento em que você inicia esse novo trabalho.
Para saber mais sobre como usar tags com o Amazon Transcribe, consulte os recursos de marcação.
Tipo: matriz de objetos Tag
Membros da matriz: número mínimo de 1 item. Número máximo de 200 itens.
Obrigatório: não
- TranscriptionJobName
-
Um nome exclusivo, escolhido por você, para seu trabalho de transcrição. O nome que você especifica também é usado como o nome padrão do seu arquivo de saída de transcrição. Se você quiser especificar um nome diferente para sua saída de transcrição, use o
OutputKeyparâmetro.Esse nome diferencia maiúsculas de minúsculas, não pode conter espaços e deve ser exclusivo em umConta da AWS. Se você tentar criar um novo trabalho com o mesmo nome de um trabalho existente, você receberá um
ConflictExceptionerro.Tipo: String
Restrições de tamanho: tamanho mínimo 1. Tamanho máximo de 200.
Padrão:
^[0-9a-zA-Z._-]+Obrigatório: Sim
Sintaxe da resposta
{
"TranscriptionJob": {
"CompletionTime": number,
"ContentRedaction": {
"PiiEntityTypes": [ "string" ],
"RedactionOutput": "string",
"RedactionType": "string"
},
"CreationTime": number,
"FailureReason": "string",
"IdentifiedLanguageScore": number,
"IdentifyLanguage": boolean,
"IdentifyMultipleLanguages": boolean,
"JobExecutionSettings": {
"AllowDeferredExecution": boolean,
"DataAccessRoleArn": "string"
},
"LanguageCode": "string",
"LanguageCodes": [
{
"DurationInSeconds": number,
"LanguageCode": "string"
}
],
"LanguageIdSettings": {
"string" : {
"LanguageModelName": "string",
"VocabularyFilterName": "string",
"VocabularyName": "string"
}
},
"LanguageOptions": [ "string" ],
"Media": {
"MediaFileUri": "string",
"RedactedMediaFileUri": "string"
},
"MediaFormat": "string",
"MediaSampleRateHertz": number,
"ModelSettings": {
"LanguageModelName": "string"
},
"Settings": {
"ChannelIdentification": boolean,
"MaxAlternatives": number,
"MaxSpeakerLabels": number,
"ShowAlternatives": boolean,
"ShowSpeakerLabels": boolean,
"VocabularyFilterMethod": "string",
"VocabularyFilterName": "string",
"VocabularyName": "string"
},
"StartTime": number,
"Subtitles": {
"Formats": [ "string" ],
"OutputStartIndex": number,
"SubtitleFileUris": [ "string" ]
},
"Tags": [
{
"Key": "string",
"Value": "string"
}
],
"Transcript": {
"RedactedTranscriptFileUri": "string",
"TranscriptFileUri": "string"
},
"TranscriptionJobName": "string",
"TranscriptionJobStatus": "string"
}
}
Elementos de resposta
Se a ação for bem-sucedida, o serviço reenviará uma resposta HTTP 200.
Os seguintes dados são retornados no formato JSON pelo serviço.
- TranscriptionJob
-
Fornece informações detalhadas sobre o trabalho de transcrição atual, incluindo o status do trabalho e, se aplicável, o motivo da falha.
Tipo: objeto TranscriptionJob
Erros
Para obter informações sobre os erros comuns a todas as ações, consulteErros comuns.
- BadRequestException
-
Sua solicitação não passou em um ou mais testes de validação. Isso pode ocorrer quando a entidade que você está tentando excluir não existe ou se está em um estado não terminal (como
IN PROGRESS). Consulte o campo da mensagem de exceção para obter mais informações.Código de status HTTP: 400
- ConflictException
-
Já existe um recurso com esse nome. Os nomes dos recursos devem ser exclusivos em umConta da AWS.
Código de status HTTP: 400
- InternalFailureException
-
Ocorreu um erro interno. Verifique a mensagem de erro, corrija o problema e tente fazer sua solicitação novamente.
Código de status HTTP: 500
- LimitExceededException
-
Você enviou muitas solicitações ou seu arquivo de entrada é muito longo. Espere antes de repetir sua solicitação ou use um arquivo menor e tente novamente.
Código de status HTTP: 400
Consulte também
Para obter mais informações sobre como usar essa API em um dos AWS SDKs específicos de linguagem, consulte o seguinte: