Mejora de la precisión de la transcripción con vocabularios y modelos de idioma personalizados - Amazon Transcribe

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Mejora de la precisión de la transcripción con vocabularios y modelos de idioma personalizados

Si su contenido multimedia contiene términos específicos de un dominio o no estándar, como nombres de marcas, acrónimos, palabras técnicas y jerga, es Amazon Transcribe posible que no capture correctamente estos términos en el resultado de la transcripción.

Para corregir las imprecisiones de la transcripción y personalizar el resultado para su caso de uso específico, puede crear Vocabularios personalizados y Modelos de idioma personalizados.

  • Vocabularios personalizados están diseñados para ajustar y mejorar tanto el reconocimiento como el formato de palabras específicas en todos los contextos. Esto implica proporcionar palabras a Amazon Transcribe y, opcionalmente, formas de pronunciación y visualización.

    Si no Amazon Transcribe reproduce correctamente términos específicos en sus transcripciones, puede crear un archivo de vocabulario personalizado que indique Amazon Transcribe cómo desea que se muestren estos términos. Este enfoque basado en palabras específicas es el más adecuado para corregir términos como nombres de marcas y acrónimos.

  • Modelos de idioma personalizados están diseñados para captar el contexto asociado a los términos. Esto implica suministrar Amazon Transcribe un gran volumen de datos de texto específicos de un dominio.

    Si no Amazon Transcribe está traduciendo correctamente los términos técnicos o utiliza un homófono incorrecto en sus transcripciones, puede crear un modelo de idioma personalizado que enseñe el idioma específico de su dominio. Amazon Transcribe Por ejemplo, un modelo de lenguaje personalizado puede aprender cuándo usar “tubo” (pieza cilíndrica hueca) en lugar de “tuvo” (conjugación del verbo tener).

    Este enfoque sensible al contexto es el más apropiado para transcribir grandes volúmenes de voz de un dominio específico. Los modelos de idioma personalizados pueden producir mejoras de precisión significativas en comparación con los vocabularios personalizados por sí solos. Al utilizar transcripciones por lotes, puede incluir un modelo de idioma personalizado y un vocabulario personalizado en su solicitud.

sugerencia

Para lograr la máxima precisión de transcripción, utilice los vocabularios personalizados junto con sus modelos de idioma personalizados.

Para ver un tutorial en vídeo sobre la creación y el uso de vocabularios personalizados, consulte:

Para ver un tutorial en vídeo sobre la creación y el uso de vocabularios personalizados, consulte: