As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.
Como usar a transcrição ao vivo do SDK do Amazon Chime
Você usa a transcrição ao vivo do SDK do Amazon Chime para gerar transcrições ao vivo atribuídas pelo usuário de suas reuniões. A transcrição ao vivo do SDK do Amazon Chime se integra aos serviços Amazon Transcribe e Amazon Transcribe Medical para gerar transcrições das reuniões do SDK do Amazon Chime enquanto elas estão em andamento.
A transcrição ao vivo do SDK do Amazon Chime processa o áudio de cada usuário separadamente para melhorar a precisão em cenários com vários alto-falantes. O SDK do Amazon Chime usa seu algoritmo de locutor ativo para selecionar os dois principais locutores ativos e, em seguida, envia o áudio para o Amazon Transcribe, em canais separados, por meio de um único stream. Os participantes da reunião recebem transcrições atribuídas pelo usuário por meio de mensagens de dados do SDK do Amazon Chime. Você pode usar as transcrições de várias maneiras, como exibir legendas, criar transcrições de reuniões ou usar as transcrições para análise de conteúdo.
A transcrição ao vivo usa um stream para o Amazon Transcribe durante a transcrição da reunião. Aplicam-se os custos-padrão do Amazon Transcribe e do Amazon Transcribe Medical. Para obter mais informações, consulte os Preços do Amazon Transcribe
Importante
Por padrão, o Amazon Transcribe pode usar e armazenar conteúdo de áudio processado pelo serviço para desenvolver e AWS melhorar os serviços de IA/ML, conforme descrito mais detalhadamente na seção 50 dos Termos de Serviço.AWS
Tópicos
Configurar sua conta para a transcrição ao vivo do SDK do Amazon Chime
Escolher as opções de transcrição ao vivo do SDK do Amazon Chime
Iniciar e interromper a transcrição ao vivo do SDK do Amazon Chime
Noções básicas sobre os eventos de transcrição ao vivo do SDK do Amazon Chime
Noções básicas sobre os eventos de transcrição ao vivo do SDK do Amazon Chime
Processar um evento de transcrição ao vivo do SDK do Amazon Chime
Arquitetura do sistema
O SDK do Amazon Chime cria transcrições de reuniões em tempo real, sem que o áudio saia da rede da AWS , por meio de uma integração do lado do serviço com sua conta Amazon Transcribe ou Amazon Transcribe Medical. Para maior precisão, o áudio dos usuários é processado separadamente e depois misturado na reunião. O SDK do Amazon Chime usa seu algoritmo de locutor ativo para selecionar os dois principais locutores ativos e, em seguida, envia o áudio para o Amazon Transcribe ou para o Amazon Transcribe Medical, em canais separados, por meio de um único stream. Para reduzir a latência, as transcrições atribuídas pelo usuário são enviadas diretamente para cada participante da reunião por meio de mensagens de dados. Ao usar um canal de mídia para capturar o áudio da reunião, as informações de transcrição da reunião também são capturadas.

Faturamento e uso
A transcrição ao vivo usa um stream para o Amazon Transcribe ou Amazon Transcribe Medical durante a transcrição da reunião. Aplicam-se os custos-padrão do Amazon Transcribe e do Amazon Transcribe Medical. Para obter mais informações, consulte os Preços do Amazon Transcribe
Parâmetros de transcrição ao vivo do SDK do Amazon Chime
O Amazon Transcribe e o Amazon Transcribe APIs Medical oferecem vários parâmetros ao iniciar a transcrição de streaming, como StartStreamTranscription e StartMedicalStreamTranscription. Você pode usar esses parâmetros na StartMeetingTranscription
API, a menos que o Amazon Chime SDK predetermine o valor do parâmetro. Por exemplo, os parâmetros MediaEncoding
e MediaSampleRateHertz
e não estão disponíveis porque o SDK do Amazon Chime os define automaticamente.
O Amazon Transcribe e o Amazon Transcribe Medical validam os parâmetros, o que permite que você use novos valores de parâmetros assim que estiverem disponíveis. Por exemplo, se o Amazon Transcribe Medical lançar o suporte para um novo idioma, você só precisará especificar o valor do novo idioma no parâmetro LanguageCode
.