Writer Palmyra X4 - Amazon Bedrock

Writer Palmyra X4

Writer Palmyra X4 est un modèle avec une fenêtre contextuelle pouvant contenir jusqu’à 128 000 jetons. Ce modèle excelle dans le traitement et la compréhension de tâches complexes, ce qui le rend idéal pour l’automatisation des flux de travail, les tâches de codage et l’analyse des données.

  • Prestataire : Writer

  • Catégories : génération de texte, génération de code, mise en forme de texte enrichi

  • Dernière version : v1

  • Date de sortie : 28 avril 2025

  • ID du modèle : writer.palmyra-x4-v1:0

  • Modalité : texte

  • Nombre maximum de jetons : entrée : 122 880 jetons, sortie : 8 192 jetons

  • Langue : anglais, espagnol, français, allemand, chinois et plusieurs autres langues

  • Type de déploiement : sans serveur

Champ body de la demande d’invocation Palmyra X4

Lorsque vous effectuez un appel InvokeModel ou InvokeModelWithResponseStream à l’aide d’un modèle Writer, remplissez le champ body avec un objet JSON conforme à celui ci-dessous. Entrez l’invite dans le champ text de l’objet text_prompts.

{ "modelId": "writer.palmyra-x4-v1:0", "contentType": "application/json", "accept": "application/json", "body": "{\"messages\":[{\"role\":\"user\",\"content\":{\"text\":\"Explain quantum computing in simple terms\"}}]}" }

Le tableau suivant indique les valeurs minimales, maximales et par défaut des paramètres numériques.

Paramètre Type Par défaut Gamme/Validation Description

messages

array

Obligatoire

1-∞ articles

Historique des messages de discussion

temperature

float

1.0

0,0 ≤ x ≤ 2,0

Température de prélèvement

top_p

float

1.0

0,0 < valeur ≤ 1,0

Seuil d’échantillonnage du noyau

max_tokens

int

16

1 ≤ x ≤ 8 192

Nombre maximum de jetons à générer

min_tokens

int

0

0 ≤ x ≤ max_tokens

Nombre minimum de jetons avant l’arrêt

stop

array

[]

≤ 4 entrées

Séquences d’arrêt

Seed (Noyau)

int

null

Nombre entier

Random Seed (Nombre aléatoire)

presence_penalty

float

0.0

-2,0 ≤ x ≤ 2,0

Nouvelle pénalité de présence de jetons

frequency_penalty

float

0.0

-2,0 ≤ x ≤ 2,0

Pénalité de fréquence de jeton

Champ body de la réponse d’invocation Palmyra X4

Le JSON de réponse pour Writer Palmyra X4 utilise le format suivant :

{ "id": "chatcmpl-a689a6e150b048ca8814890d3d904d41", "object": "chat.completion", "created": 1745854231, "model": "writer.palmyra-x4-v1:0", "choices": [ { "index": 0, "message": { "role": "assistant", "reasoning_content": null, "content": "Quantum computing harnesses quantum mechanics to process information in extraordinarily powerful ways. Unlike classical bits, which are 0 or 1, quantum bits (qubits) can exist in multiple states simultaneously through superposition. Qubits also entangle, allowing them to be interconnected in such a way that the state of one (whether it's 0 or 1) can depend on the state of another, no matter the distance between them. This combination of superposition and entanglement enables quantum computers to solve complex problems much faster than classical computers, particularly in areas like cryptography, optimization, and simulations of molecular structures. However, quantum computing is still in its early stages, facing challenges in stability and scalability.", "tool_calls": [] }, "logprobs": null, "finish_reason": "stop", "stop_reason": null } ], "usage": { "prompt_tokens": 43, "total_tokens": 186, "completion_tokens": 143, "prompt_tokens_details": null }, "prompt_logprobs": null }

Writer Palmyra X4Exemple de code

Exemples de code pour Writer Palmyra X4 :

import boto3 import json from botocore.exceptions import ClientError client = boto3.client("bedrock-runtime", region_name="us-west-2") model_id = "writer.palmyra-x4-v1:0" # Format the request payload using the model's native structure. native_request = { "temperature": 1, "messages": [ { "role": "user", "content": "Explain quantum computing in simple terms.", } ], } # Convert the native request to JSON. request = json.dumps(native_request) try: # Invoke the model with the request. response = client.invoke_model(modelId=model_id, body=request) except (ClientError, Exception) as e: print(f"ERROR: Can't invoke '{model_id}'. Reason: {e}") exit(1) # Decode the response body. model_response = json.loads(response["body"].read()) # Extract and print the response text. response_text = model_response["content"][0]["text"] print(response_text)