Uso de filtros de vocabulario personalizados para eliminar, enmascarar o marcar palabras
Un filtro de vocabulario personalizado es un archivo de texto que contiene una lista personalizada de palabras individuales que se desea modificar en el resultado de la transcripción.
Un caso de uso común es la eliminación de términos ofensivos u obscenos; sin embargo, los filtros de vocabulario personalizados están completamente personalizados, por lo que puede seleccionar las palabras que desee. Por ejemplo, si tiene un producto nuevo a punto de lanzarse, puede ocultar el nombre del producto en las transcripciones de las reuniones. En este caso, mantienes a las partes interesadas informadas y, al mismo tiempo, mantienes el nombre del producto en secreto hasta el lanzamiento.
El filtrado de vocabulario tiene tres métodos de visualización: mask, remove y tag. Consulte los siguientes ejemplos para ver cómo funciona cada uno.
-
Máscara: reemplaza las palabras especificadas por tres asteriscos (***).
"transcript": "You can specify a list of *** or *** words, and *** *** removes them from transcripts automatically." -
Eliminar: elimina las palabras especificadas sin dejar nada en su lugar.
"transcript": "You can specify a list of or words, and removes them from transcripts automatically." -
Etiqueta: añade una etiqueta (
"vocabularyFilterMatch": true) a cada palabra especificada, pero no altera la palabra en sí. El etiquetado permite sustituir y editar rápidamente las transcripciones."transcript": "You can specify a list of profane or offensive words, and amazon transcribe removes them from transcripts automatically."..."alternatives": [ { "confidence": "1.0", "content": "profane" } ], "type": "pronunciation", "vocabularyFilterMatch": true
Al enviar una solicitud de transcripción, puede especificar un filtro de vocabulario personalizado y el método de filtrado que desee aplicar. Después Amazon Transcribe modifica las coincidencias de palabras exactas cuando aparecen en la transcripción, según el método de filtrado que especifique.
Se pueden aplicar filtros de vocabulario personalizados a las solicitudes de transcripción por lotes y en streaming. Para obtener, información acerca de cómo crear un filtro de vocabulario personalizado, consulte Creación de un filtro de vocabulario. Para obtener, información acerca de cómo crear un filtro de vocabulario personalizado, consulte Uso de filtros de vocabulario personalizados.
nota
Amazon Transcribe oculta automáticamente los términos sensibles de manera racional, aunque puede excluirse de este filtro predeterminado poniéndose en contacto con Soporte técnico de AWS
Para ver un tutorial en vídeo sobre el filtrado de vocabulario, consulte: