Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.
Scénariste Palmyra X4
Writer Palmyra X4est un modèle avec une fenêtre contextuelle pouvant contenir jusqu'à 128 000 jetons. Ce modèle excelle dans le traitement et la compréhension de tâches complexes, ce qui le rend idéal pour l'automatisation des flux de travail, les tâches de codage et l'analyse des données.
Prestataire — Rédacteur
Catégories — Génération de texte, génération de code, mise en forme de texte enrichi
Dernière version — v1
Date de sortie : 28 avril 2025
Identifiant du modèle —
writer.palmyra-x4-v1:0
Modalité — Texte
Nombre maximum de jetons — Entrée : 122 880 jetons, sortie : 8192 jetons
Langue : anglais, espagnol, français, allemand, chinois et plusieurs autres langues
Type de déploiement : sans serveur
Champ du corps de la demande d'invocation Palmyra X4
Lorsque vous effectuez un InvokeModelWithResponseStreamappel InvokeModelou à l'aide d'un modèle Writer, remplissez le body
champ avec un objet JSON conforme à celui ci-dessous. Entrez l’invite dans le champ text
de l’objet text_prompts
.
{ "modelId": "writer.palmyra-x4-v1:0", "contentType": "application/json", "accept": "application/json", "body": "{\"messages\":[{\"role\":\"user\",\"content\":{\"text\":\"Explain quantum computing in simple terms\"}}]}" }
Le tableau suivant indique les valeurs minimales, maximales et par défaut des paramètres numériques.
Paramètre | Type | Par défaut | Gamme/Validation | Description |
---|---|---|---|---|
messages |
array |
Obligatoire |
1-∞ articles |
Messages de l'historique des discussions |
temperature |
float |
1.0 |
0,0 ≤ x ≤ 2,0 |
Température d'échantillonnage |
top_p |
float |
1.0 |
0,0 < valeur ≤ 1,0 |
Seuil d'échantillonnage du noyau |
max_tokens |
int |
16 |
1 ≤ x ≤ 8192 |
Nombre maximum de jetons à générer |
min_jetons |
int |
0 |
0 ≤ x ≤ max_jetons |
Nombre minimum de jetons avant l'arrêt |
stop |
array |
[] |
≤4 entrées |
Séquences d'arrêt |
Seed (Noyau) |
int |
null |
N'importe quel entier |
Random Seed (Nombre aléatoire) |
pénalité de présence |
float |
0.0 |
-2,0 ≤ x ≤ 2,0 |
Nouvelle pénalité de présence de jetons |
pénalité de fréquence |
float |
0.0 |
-2,0 ≤ x ≤ 2,0 |
Pénalité de fréquence des jetons |
Champ de corps de réponse à l'invocation du Palmyra X4
La réponse JSON pour Writer Palmyra X4 utilise le format suivant :
{ "id": "chatcmpl-a689a6e150b048ca8814890d3d904d41", "object": "chat.completion", "created": 1745854231, "model": "writer.palmyra-x4-v1:0", "choices": [ { "index": 0, "message": { "role": "assistant", "reasoning_content": null, "content": "Quantum computing harnesses quantum mechanics to process information in extraordinarily powerful ways. Unlike classical bits, which are 0 or 1, quantum bits (qubits) can exist in multiple states simultaneously through superposition. Qubits also entangle, allowing them to be interconnected in such a way that the state of one (whether it's 0 or 1) can depend on the state of another, no matter the distance between them. This combination of superposition and entanglement enables quantum computers to solve complex problems much faster than classical computers, particularly in areas like cryptography, optimization, and simulations of molecular structures. However, quantum computing is still in its early stages, facing challenges in stability and scalability.", "tool_calls": [] }, "logprobs": null, "finish_reason": "stop", "stop_reason": null } ], "usage": { "prompt_tokens": 43, "total_tokens": 186, "completion_tokens": 143, "prompt_tokens_details": null }, "prompt_logprobs": null }
Exemple de code Writer Palmyra X4
Exemple de code pour Writer Palmyra X4 :
import boto3 import json from botocore.exceptions import ClientError client = boto3.client("bedrock-runtime", region_name="us-west-2") model_id = "writer.palmyra-x4-v1:0" # Format the request payload using the model's native structure. native_request = { "temperature": 1, "messages": [ { "role": "user", "content": "Explain quantum computing in simple terms.", } ], } # Convert the native request to JSON. request = json.dumps(native_request) try: # Invoke the model with the request. response = client.invoke_model(modelId=model_id, body=request) except (ClientError, Exception) as e: print(f"ERROR: Can't invoke '{model_id}'. Reason: {e}") exit(1) # Decode the response body. model_response = json.loads(response["body"].read()) # Extract and print the response text. response_text = model_response["content"][0]["text"] print(response_text)