As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.
API Messages do Claude da Anthropic
Esta seção fornece os parâmetros de inferência e exemplos de código para uso da API Messages do Claude da Anthropic.
Tópicos
Visão geral da API Messages do Claude da Anthropic
Você pode usar a API Messages para criar chatbots ou aplicações de assistente virtual. A API gerencia as trocas de conversas entre um usuário e um modelo do Claude da Anthropic (assistente).
dica
Este tópico mostra como usar a API de Anthropic Claude mensagens com as operações básicas de inferência (InvokeModelou InvokeModelWithResponseStream). No entanto, recomendamos que você use a Converse API para implementar mensagens em seu aplicativo. A Converse API fornece um conjunto unificado de parâmetros que funcionam em todos os modelos compatíveis com mensagens. Para obter mais informações, consulte Converse com as operações da Converse API.
A Anthropic treina modelos Claude para operar em turnos alternados de conversação do usuário e do assistente. Ao criar uma mensagem, você especifica os turnos de conversação anteriores com o parâmetro messages. O modelo acaba gerando a próxima mensagem na conversa.
Cada mensagem de entrada deve ser um objeto com uma função e um conteúdo. Você pode especificar uma única mensagem de função do usuário ou pode incluir várias mensagens de usuário e assistente.
Se você estiver usando a técnica de pré-preencher a resposta do Claude (preenchendo o início da resposta do Claude usando uma mensagem da função de assistente final), o Claude responderá retomando de onde você parou. Com essa técnica, o Claude ainda retornará uma resposta com a função de assistente.
Se a mensagem final usar a função de assistente, o conteúdo da resposta continuará imediatamente a partir do conteúdo dessa mensagem. Você pode usar isso para restringir parte da resposta do modelo.
Exemplo com uma única mensagem do usuário:
[{"role": "user", "content": "Hello, Claude"}]
Exemplo com vários turnos de conversação:
[ {"role": "user", "content": "Hello there."}, {"role": "assistant", "content": "Hi, I'm Claude. How can I help you?"}, {"role": "user", "content": "Can you explain LLMs in plain English?"}, ]
Exemplo com uma resposta parcialmente preenchida pelo Claude:
[ {"role": "user", "content": "Please describe yourself using only JSON"}, {"role": "assistant", "content": "Here is my JSON description:\n{"}, ]
O conteúdo de cada mensagem de entrada pode ser uma string única ou uma matriz dos blocos de conteúdo, em que cada bloco tem um tipo específico. O uso de uma string é um atalho para uma matriz de um bloco de conteúdo do tipo “texto”. As seguintes mensagens de entrada são equivalentes:
{"role": "user", "content": "Hello, Claude"}
{"role": "user", "content": [{"type": "text", "text": "Hello, Claude"}]}
Para obter informações sobre como criar prompts para modelos Claude da Anthropic, consulte, Intro to prompting
Importante
O período de tempo limite para chamadas de inferência para Claude 4 Anthropic Claude 3.7 Sonnet e 4 modelos é de 60 minutos. Por padrão, os clientes AWS SDK atingem o tempo limite após 1 minuto. Recomendamos que você aumente o período de tempo limite de leitura do seu cliente AWS SDK para pelo menos 60 minutos. Por exemplo, no SDK de botocore do AWS
Python, altere o valor do read_timeout
campo em botocore.config
Prompts do sistema
Você também pode incluir um prompt do sistema na solicitação. Um prompt do sistema permite a você contextualizar e dar instruções para o Claude da Anthropic, como especificar uma meta ou função específica. Especifique um prompt do sistema no campo system
, conforme exibido no exemplo a seguir.
"system": "You are Claude, an AI assistant created by Anthropic to be helpful, harmless, and honest. Your goal is to provide informative and substantive responses to queries while avoiding potential harms."
Para obter mais informações, consulte System prompts
Prompts multimodais
Um prompt multimodal combina várias modalidades (imagens e textos) em um único prompt. Você especifica as modalidades no campo de entrada content
. O exemplo a seguir mostra como você pode pedir para o Claude da Anthropic descrever o conteúdo de uma imagem fornecida. Para obter um código de exemplo, consulte Exemplos de código multimodal.
{ "anthropic_version": "bedrock-2023-05-31", "max_tokens": 1024, "messages": [ { "role": "user", "content": [ { "type": "image", "source": { "type": "base64", "media_type": "image/jpeg", "data": "iVBORw..." } }, { "type": "text", "text": "What's in these images?" } ] } ] }
nota
As seguintes restrições pertencem ao campo content
:
-
É possível incluir até vinte imagens. O tamanho, a altura e a largura de cada imagem não devem exceder 3,75 MB, 8.000 px e 8.000 px, respectivamente.
-
É possível incluir até cinco documentos. O tamanho de cada documento não deve ser superior a 4,5 MB.
-
Você só poderá incluir imagens e documentos se
role
foruser
.
Cada imagem incluída por você em uma solicitação conta para o uso do token. Para obter mais informações, consulte Image costs