Obtenga información sobre los casos de uso de diferentes métodos de inferencia de modelos - Amazon Bedrock

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Obtenga información sobre los casos de uso de diferentes métodos de inferencia de modelos

Puede ejecutar directamente la inferencia de modelos de las siguientes maneras:

Método Caso de uso
Sitios de prueba de la consola de Amazon Bedrock Ejecutar inferencias en una interfaz gráfica intuitiva. Práctico para la exploración.
Converse o ConverseStream Implementar aplicaciones conversacionales con una API unificada para la entrada del modelo.
InvokeModel o InvokeModelWithResponseStream Enviar una única petición y generar una respuesta sincrónica. Útil para generar respuestas en tiempo real o para consultas de búsqueda.
StartAsyncInvoke Enviar una única petición y generar una respuesta asincrónica. Útil para generar respuestas a gran escala.
CreateModelInvocationJob Preparar un conjunto de datos de peticiones y generar respuestas en lotes.

Las siguientes características de Amazon Bedrock también utilizan la inferencia de modelos como un paso en un flujo de trabajo más amplio:

  • La evaluación del modelo utiliza el proceso de invocación de modelos para evaluar el rendimiento de los distintos modelos después de enviar una solicitud CreateEvaluationJob.

  • Las bases de conocimientos utilizan la invocación de modelos al utilizar la API de RetrieveAndGenerate para generar una respuesta basada en los resultados obtenidos de una base de conocimientos.

  • Los agentes utilizan la invocación de modelos para generar respuestas en varias etapas durante una solicitud de InvokeAgent.

  • Los flujos incluyen recursos de Amazon Bedrock, como peticiones, bases de conocimiento y agentes, que utilizan la invocación de modelos.

Tras probar diferentes modelos fundacionales con distintas peticiones y parámetros de inferencia, puede configurar su aplicación para que llame a estas API con las especificaciones que desee.