Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.
Transcription des flux audio en streaming
Grâce au Amazon Transcribe streaming, vous pouvez produire des transcriptions en temps réel pour votre contenu multimédia. Contrairement aux transcriptions par lots, qui impliquent le téléchargement de fichiers multimédia, le streaming multimédia est diffusé Amazon Transcribe en temps réel. Amazon Transcribe renvoie ensuite une transcription, également en temps réel.
Le streaming peut inclure des médias préenregistrés (films, musique et podcasts) et des médias en temps réel (émissions d’information en direct). Les cas d'utilisation courants du streaming Amazon Transcribe incluent le sous-titrage en direct pour les événements sportifs et la surveillance en temps réel du son du centre d'appels.
Le contenu en streaming est diffusé sous la forme d’une série de paquets de données séquentiels, ou « blocs », qu’ Amazon Transcribe transcrit instantanément. Les avantages de l’utilisation du streaming par rapport à la diffusion par lots incluent des fonctionnalités de synthèse vocale en temps réel dans vos applications et des temps de transcription plus rapides. Cependant, cette vitesse accrue peut avoir des limites en termes de précision dans certains cas.
Amazon Transcribe propose les options suivantes pour le streaming :
-
Kits SDK (préférence)
Pour transcrire du son en streaming dans le AWS Management Console, parlez dans le microphone de votre ordinateur.
Astuce
Pour des exemples de code SDK, reportez-vous au référentiel AWS Samples
Les formats audio pris en charge pour les transcriptions en streaming sont les suivants :
FLAC
OPUS-encoded audio dans un conteneur Ogg
PCM (uniquement les formats audio Little Endian 16 bits signés, ce qui n’inclut pas WAV)
Les formats sans perte (FLAC ou PCM) sont recommandés.
Note
Les transcriptions en streaming ne sont pas prises en charge dans toutes les langues. Reportez-vous à la colonne « Entrée de données » du tableau des langues prises en charge pour plus de détails.
Pour connaître la disponibilité des transcriptions en streaming Amazon Transcribe dans la région, voir : Amazon Transcribe Points de terminaison et quotas.
Bonnes pratiques
Les recommandations suivantes améliorent l’efficacité de la transcription en streaming :
-
Si possible, utilisez le PCM-encoded son.
-
Assurez-vous que votre diffusion est aussi proche que possible du temps réel.
-
La latence dépend de la taille de vos blocs audio. Si vous êtes en mesure de spécifier la taille des blocs en fonction de votre type d’audio (par exemple avec PCM), réglez chaque segment entre 50 ms et 200 ms. Vous pouvez calculer la taille du fragment audio par la formule suivante :
chunk_size_in_bytes = chunk_duration_in_millisecond / 1000 * audio_sample_rate * 2 -
Utilisez une taille de bloc uniforme.
-
Assurez-vous de spécifier correctement le nombre de canaux audio.
-
Avec du son PCM monocanal, chaque échantillon est composé de deux octets, de sorte que chaque bloc doit être constitué d’un nombre pair d’octets.
-
Avec du son PCM à deux canaux, chaque échantillon est composé de quatre octets, de sorte que chaque bloc doit être un multiple de quatre octets.
-
Lorsque votre flux audio ne contient aucun signal vocal, encodez et envoyez la même quantité de silence. Par exemple, le silence pour PCM est un flux de zéro octet.
-
Assurez-vous de spécifier le taux d’échantillonnage correct pour votre audio. Si possible, enregistrez à une fréquence d’échantillonnage de 16 000 Hz ; cela constitue le meilleur compromis entre la qualité et le volume de données envoyées sur le réseau. Notez que la plupart des microphones haut de gamme enregistrent à 44 100 Hz ou 48 000 Hz.
Gestion des LimitExceededException erreurs
Comme tout système distribué, il Amazon Transcribe dispose de mécanismes de protection qui détectent la surconsommation de ressources et réagissent en conséquence. LimitExceededExceptiondes erreurs peuvent survenir lorsque l'un de ces mécanismes est déclenché. Trois causes distinctes peuvent être à l'origine de cette erreur :
- Quota de service de streaming simultané dépassé
-
Il s'agit de la cause la plus fréquente. Cela se produit lorsque vous dépassez votre quota de service de streaming simultané. Pour résoudre cette erreur, réessayez avec un recul exponentiel. Si vous atteignez régulièrement cette limite, demandez une augmentation du quota de service via la console Service Quotas
. Vous pouvez également contacter le AWS Support Center pour obtenir de l'aide. Pour plus d'informations sur les stratégies de nouvelle tentative, consultez la section Comportement des tentatives dans le Guide de référence AWS des SDK et des outils. - Durée maximale de session dépassée
-
Cette erreur se produit lorsqu'un flux dépasse la durée de session maximale autorisée. Il s'agit d'une limite stricte qui ne peut pas être augmentée. Pour poursuivre la transcription, lancez une nouvelle session de streaming.
- Le nombre de flux simultanés a augmenté trop rapidement
-
Il s'agit d'une cause rare. Cela peut se produire si vous augmentez trop rapidement le nombre de flux simultanés, par exemple lors de tests de charge. Il s'agit d'un mécanisme de protection au niveau du système sans quota ajustable. Pour résoudre cette erreur, réessayez avec un recul exponentiel et augmentez progressivement le nombre de streams simultanés. Pour plus d'informations sur les stratégies de nouvelle tentative, consultez la section Comportement des tentatives dans le Guide de référence AWS des SDK et des outils. Vous pouvez également visiter AWS re:Post
ou contacter le AWS Support Premium.