Vocabularios personalizados
Use vocabularios personalizados para mejorar la precisión de la transcripción de una o más palabras específicas. Por lo general, se trata de términos específicos de un dominio, como nombres de marcas y acrónimos, nombres propios y palabras que Amazon Transcribe no reproduce correctamente.
Los vocabularios personalizados se pueden usar con todos los idiomas admitidos. Tenga en cuenta que sólo los caracteres que figuran en el conjunto de caracteres de su idioma se pueden usar en un vocabulario personalizado.
importante
Usted es responsable de la integridad de sus propios datos cuando utiliza Amazon Transcribe. No introduzca información confidencial, información personal (PII) ni información de salud protegida (PHI) en un vocabulario personalizado.
Consideraciones a la hora de crear un vocabulario personalizado:
-
Puede tener hasta 100 archivos de vocabulario personalizados por Cuenta de AWS
-
El límite de tamaño de un archivo de vocabulario personalizado es de 50 Kb
-
Si utiliza la API para crear su vocabulario personalizado, su archivo de vocabulario debe estar en formato de texto (*.txt). Si utiliza Consola de administración de AWS, su archivo de vocabulario puede estar en formato de texto (*.txt) o en formato de valores separados por comas (*.csv).
-
Cada entrada de un vocabulario personalizado no puede superar los 256 caracteres
-
Para usar un vocabulario personalizado, debe haberse creado en la misma Región de AWS que su transcripción.
sugerencia
Puede poner a prueba su vocabulario personalizado utilizando Consola de administración de AWS. Cuando su vocabulario personalizado esté listo para usarse, inicie sesión enConsola de administración de AWS, seleccione Transcripción en tiempo real, desplácese hasta Personalizaciones, active Vocabulario personalizado y seleccione su vocabulario personalizado en la lista desplegable. Luego seleccione iniciar streaming. Diga algunas de las palabras de su vocabulario personalizado en el micrófono para comprobar si se reproducen correctamente.
Tablas de vocabulario personalizadas en lugar de listas
importante
Los vocabularios personalizados en formato de lista están en desuso. Si va a crear un vocabulario personalizado nuevo, utilice el formato de tabla.
Las tablas ofrecen más opciones y más control sobre la entrada y salida de palabras de su vocabulario personalizado. En el caso de las tablas, debe especificar varias categorías (Phrase and DisplayAs), lo que le permitirá afinar el resultado.
Las listas no tienen opciones adicionales, por lo que sólo puede escribir las entradas tal como desee que aparezcan en la transcripción, sustituyendo todos los espacios por guiones.
Consola de administración de AWS, AWS CLI y los SDK de AWS utilizan tablas de vocabulario personalizadas de la misma manera; las listas se utilizan de forma diferente para cada método y, por lo tanto, pueden requerir un formato adicional para poder utilizarlas correctamente entre los métodos.
Para obtener más información, consulte Creación de un vocabulario personalizado con una tabla y Creación de un vocabulario personalizado en formato de lista.
Para profundizar un poco más y aprender a usar Amazon Augmented AI con vocabularios personalizados, consulte: