Obtenga información sobre los casos de uso de diferentes métodos de inferencia de modelos

Puede ejecutar directamente la inferencia de modelos de las siguientes maneras:

Método	Caso de uso
Sitios de prueba de la consola de Amazon Bedrock	Ejecutar inferencias en una interfaz gráfica intuitiva. Práctico para la exploración.
Conversar o ConverseStream	Implementar aplicaciones conversacionales con una API unificada para la entrada del modelo.
InvokeModel o InvokeModelWithResponseStream	Enviar una única petición y generar una respuesta sincrónica. Útil para generar respuestas en tiempo real o para consultas de búsqueda.
StartAsyncInvoke	Enviar una única petición y generar una respuesta asincrónica. Útil para generar respuestas a gran escala.
CreateModelInvocationJob	Preparar un conjunto de datos de peticiones y generar respuestas en lotes.
API de respuestas	Usa la API de respuestas para aplicaciones de agencia modernas que requieren el uso de herramientas integradas (búsqueda, intérprete de código), entradas multimodales y conversaciones con estado.
Finalización del chat	Usa la API Chat Completions para realizar tareas livianas, sin estado y centradas en texto, en las que necesites tener un control total sobre la administración del historial de chats y reducir la latencia.

Las siguientes características de Amazon Bedrock también utilizan la inferencia de modelos como un paso en un flujo de trabajo más amplio:

La evaluación de modelos utiliza el proceso de invocación de modelos para evaluar el rendimiento de los distintos modelos después de enviar una solicitud. CreateEvaluationJob
Las bases de conocimientos utilizan la invocación de modelos al utilizar la API de RetrieveAndGenerate para generar una respuesta basada en los resultados obtenidos de una base de conocimientos.
Los agentes utilizan la invocación de modelos para generar respuestas en varias etapas durante una solicitud de InvokeAgent.
Los flujos incluyen recursos de Amazon Bedrock, como peticiones, bases de conocimiento y agentes, que utilizan la invocación de modelos.

Tras probar distintos modelos básicos con distintas indicaciones y parámetros de inferencia, puede configurar su aplicación para que los utilice APIs con las especificaciones que desee.

Aviso JavaScript está desactivado o no está disponible en su navegador.

Para utilizar la documentación de AWS, debe estar habilitado JavaScript. Para obtener más información, consulte las páginas de ayuda de su navegador.

Convenciones del documento

Inferencia: generación de respuestas

Cómo funciona la inferencia