Scénariste Palmyra X4 - Amazon Bedrock

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Scénariste Palmyra X4

Writer Palmyra X4est un modèle avec une fenêtre contextuelle pouvant contenir jusqu'à 128 000 jetons. Ce modèle excelle dans le traitement et la compréhension de tâches complexes, ce qui le rend idéal pour l'automatisation des flux de travail, les tâches de codage et l'analyse des données.

  • Prestataire — Rédacteur

  • Catégories — Génération de texte, génération de code, mise en forme de texte enrichi

  • Dernière version — v1

  • Date de sortie : 28 avril 2025

  • Identifiant du modèle — writer.palmyra-x4-v1:0

  • Modalité — Texte

  • Nombre maximum de jetons — Entrée : 122 880 jetons, sortie : 8192 jetons

  • Langue : anglais, espagnol, français, allemand, chinois et plusieurs autres langues

  • Type de déploiement : sans serveur

Champ du corps de la demande d'invocation Palmyra X4

Lorsque vous effectuez un InvokeModelWithResponseStreamappel InvokeModelou à l'aide d'un modèle Writer, remplissez le body champ avec un objet JSON conforme à celui ci-dessous. Entrez l’invite dans le champ text de l’objet text_prompts.

{ "modelId": "writer.palmyra-x4-v1:0", "contentType": "application/json", "accept": "application/json", "body": "{\"messages\":[{\"role\":\"user\",\"content\":{\"text\":\"Explain quantum computing in simple terms\"}}]}" }

Le tableau suivant indique les valeurs minimales, maximales et par défaut des paramètres numériques.

Paramètre Type Par défaut Gamme/Validation Description

messages

array

Obligatoire

1-∞ articles

Messages de l'historique des discussions

temperature

float

1.0

0,0 ≤ x ≤ 2,0

Température d'échantillonnage

top_p

float

1.0

0,0 < valeur ≤ 1,0

Seuil d'échantillonnage du noyau

max_tokens

int

16

1 ≤ x ≤ 8192

Nombre maximum de jetons à générer

min_jetons

int

0

0 ≤ x ≤ max_jetons

Nombre minimum de jetons avant l'arrêt

stop

array

[]

≤4 entrées

Séquences d'arrêt

Seed (Noyau)

int

null

N'importe quel entier

Random Seed (Nombre aléatoire)

pénalité de présence

float

0.0

-2,0 ≤ x ≤ 2,0

Nouvelle pénalité de présence de jetons

pénalité de fréquence

float

0.0

-2,0 ≤ x ≤ 2,0

Pénalité de fréquence des jetons

Champ de corps de réponse à l'invocation du Palmyra X4

La réponse JSON pour Writer Palmyra X4 utilise le format suivant :

{ "id": "chatcmpl-a689a6e150b048ca8814890d3d904d41", "object": "chat.completion", "created": 1745854231, "model": "writer.palmyra-x4-v1:0", "choices": [ { "index": 0, "message": { "role": "assistant", "reasoning_content": null, "content": "Quantum computing harnesses quantum mechanics to process information in extraordinarily powerful ways. Unlike classical bits, which are 0 or 1, quantum bits (qubits) can exist in multiple states simultaneously through superposition. Qubits also entangle, allowing them to be interconnected in such a way that the state of one (whether it's 0 or 1) can depend on the state of another, no matter the distance between them. This combination of superposition and entanglement enables quantum computers to solve complex problems much faster than classical computers, particularly in areas like cryptography, optimization, and simulations of molecular structures. However, quantum computing is still in its early stages, facing challenges in stability and scalability.", "tool_calls": [] }, "logprobs": null, "finish_reason": "stop", "stop_reason": null } ], "usage": { "prompt_tokens": 43, "total_tokens": 186, "completion_tokens": 143, "prompt_tokens_details": null }, "prompt_logprobs": null }

Exemple de code Writer Palmyra X4

Exemple de code pour Writer Palmyra X4 :

import boto3 import json from botocore.exceptions import ClientError client = boto3.client("bedrock-runtime", region_name="us-west-2") model_id = "writer.palmyra-x4-v1:0" # Format the request payload using the model's native structure. native_request = { "temperature": 1, "messages": [ { "role": "user", "content": "Explain quantum computing in simple terms.", } ], } # Convert the native request to JSON. request = json.dumps(native_request) try: # Invoke the model with the request. response = client.invoke_model(modelId=model_id, body=request) except (ClientError, Exception) as e: print(f"ERROR: Can't invoke '{model_id}'. Reason: {e}") exit(1) # Decode the response body. model_response = json.loads(response["body"].read()) # Extract and print the response text. response_text = model_response["content"][0]["text"] print(response_text)