Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.
Envío de solicitudes y generación de respuestas con inferencia de modelos
La inferencia se refiere al proceso de generar una salida a partir de una entrada proporcionada a un modelo.
Amazon Bedrock ofrece un conjunto de modelos fundacionales que puede utilizar para generar resultados de las siguientes modalidades. Para ver la compatibilidad de modalidades por modelo fundacional, consulte Modelos fundacionales compatibles en Amazon Bedrock.
| Modalidad de salida | Description (Descripción) | Ejemplos de casos de uso |
|---|---|---|
| Texto | Proporcionar entrada de texto y generar varios tipos de texto | Chat, lluvia de ideas question-and-answering, resumen, generación de código, creación de tablas, formateo de datos, reescritura |
| Image | Proporcionar texto o imágenes de entrada y generar o modificar imágenes | Generación de imágenes, edición de imágenes, variación de imágenes |
| Video | Proporcionar texto o imágenes de referencia y generar un vídeo | Generación de vídeo, conversión de imágenes a vídeo |
| Incrustaciones | Proporcionar texto, imágenes o texto e imágenes y generar un vector de valores numéricos que represente la entrada. El vector de salida se puede comparar con otros vectores de incrustaciones para determinar la similitud semántica (para el texto) o la similitud visual (para las imágenes). | Búsqueda de texto e imágenes, consulta, categorización, recomendaciones, personalización, creación de bases de conocimientos |
Temas
Obtenga información sobre los casos de uso de diferentes métodos de inferencia de modelos
Influencia sobre la generación de respuestas con parámetros de inferencia
Regiones y modelos compatibles con la ejecución de inferencia de modelos
Generación de respuestas en la consola mediante áreas de juego
Mejora de las respuestas de los modelos con el razonamiento de modelos
Niveles de servicio para optimizar el rendimiento y los costes
Envío de solicitudes y generación de respuestas mediante la API
Uso de una herramienta para completar una respuesta modelo de Amazon Bedrock
Almacenamiento en caché de peticiones para una inferencia de modelos más rápida