Writer Palmyra X4
Writer Palmyra X4 est un modèle avec une fenêtre contextuelle pouvant contenir jusqu’à 128 000 jetons. Ce modèle excelle dans le traitement et la compréhension de tâches complexes, ce qui le rend idéal pour l’automatisation des flux de travail, les tâches de codage et l’analyse des données.
Prestataire : Writer
Catégories : génération de texte, génération de code, mise en forme de texte enrichi
Dernière version : v1
Date de sortie : 28 avril 2025
ID du modèle :
writer.palmyra-x4-v1:0Modalité : texte
Nombre maximum de jetons : entrée : 122 880 jetons, sortie : 8 192 jetons
Langue : anglais, espagnol, français, allemand, chinois et plusieurs autres langues
Type de déploiement : sans serveur
Champ body de la demande d’invocation Palmyra X4
Lorsque vous effectuez un appel InvokeModel ou InvokeModelWithResponseStream à l’aide d’un modèle Writer, remplissez le champ body avec un objet JSON conforme à celui ci-dessous. Entrez l’invite dans le champ text de l’objet text_prompts.
{ "modelId": "writer.palmyra-x4-v1:0", "contentType": "application/json", "accept": "application/json", "body": "{\"messages\":[{\"role\":\"user\",\"content\":{\"text\":\"Explain quantum computing in simple terms\"}}]}" }
Le tableau suivant indique les valeurs minimales, maximales et par défaut des paramètres numériques.
| Paramètre | Type | Par défaut | Gamme/Validation | Description |
|---|---|---|---|---|
messages |
array |
Obligatoire |
1-∞ articles |
Historique des messages de discussion |
temperature |
float |
1.0 |
0,0 ≤ x ≤ 2,0 |
Température de prélèvement |
top_p |
float |
1.0 |
0,0 < valeur ≤ 1,0 |
Seuil d’échantillonnage du noyau |
max_tokens |
int |
16 |
1 ≤ x ≤ 8 192 |
Nombre maximum de jetons à générer |
min_tokens |
int |
0 |
0 ≤ x ≤ max_tokens |
Nombre minimum de jetons avant l’arrêt |
stop |
array |
[] |
≤ 4 entrées |
Séquences d’arrêt |
Seed (Noyau) |
int |
null |
Nombre entier |
Random Seed (Nombre aléatoire) |
presence_penalty |
float |
0.0 |
-2,0 ≤ x ≤ 2,0 |
Nouvelle pénalité de présence de jetons |
frequency_penalty |
float |
0.0 |
-2,0 ≤ x ≤ 2,0 |
Pénalité de fréquence de jeton |
Champ body de la réponse d’invocation Palmyra X4
Le JSON de réponse pour Writer Palmyra X4 utilise le format suivant :
{ "id": "chatcmpl-a689a6e150b048ca8814890d3d904d41", "object": "chat.completion", "created": 1745854231, "model": "writer.palmyra-x4-v1:0", "choices": [ { "index": 0, "message": { "role": "assistant", "reasoning_content": null, "content": "Quantum computing harnesses quantum mechanics to process information in extraordinarily powerful ways. Unlike classical bits, which are 0 or 1, quantum bits (qubits) can exist in multiple states simultaneously through superposition. Qubits also entangle, allowing them to be interconnected in such a way that the state of one (whether it's 0 or 1) can depend on the state of another, no matter the distance between them. This combination of superposition and entanglement enables quantum computers to solve complex problems much faster than classical computers, particularly in areas like cryptography, optimization, and simulations of molecular structures. However, quantum computing is still in its early stages, facing challenges in stability and scalability.", "tool_calls": [] }, "logprobs": null, "finish_reason": "stop", "stop_reason": null } ], "usage": { "prompt_tokens": 43, "total_tokens": 186, "completion_tokens": 143, "prompt_tokens_details": null }, "prompt_logprobs": null }
Writer Palmyra X4Exemple de code
Exemples de code pour Writer Palmyra X4 :
import boto3 import json from botocore.exceptions import ClientError client = boto3.client("bedrock-runtime", region_name="us-west-2") model_id = "writer.palmyra-x4-v1:0" # Format the request payload using the model's native structure. native_request = { "temperature": 1, "messages": [ { "role": "user", "content": "Explain quantum computing in simple terms.", } ], } # Convert the native request to JSON. request = json.dumps(native_request) try: # Invoke the model with the request. response = client.invoke_model(modelId=model_id, body=request) except (ClientError, Exception) as e: print(f"ERROR: Can't invoke '{model_id}'. Reason: {e}") exit(1) # Decode the response body. model_response = json.loads(response["body"].read()) # Extract and print the response text. response_text = model_response["content"][0]["text"] print(response_text)