Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.
Escritor Palmyra X4
Writer Palmyra X4es un modelo con una ventana de contexto de hasta 128 000 fichas. Este modelo destaca en el procesamiento y la comprensión de tareas complejas, lo que lo hace ideal para la automatización del flujo de trabajo, las tareas de codificación y el análisis de datos.
Proveedor — Escritor
Categorías: generación de texto, generación de código, formato de texto enriquecido
Última versión: v1
Fecha de lanzamiento: 28 de abril de 2025
ID de modelo:
writer.palmyra-x4-v1:0
Modalidad: texto
Número máximo de fichas: entrada: 122.880 fichas, salida: 8192 fichas
Idioma: inglés, español, francés, alemán, chino y muchos otros idiomas
Tipo de implementación: sin servidor
Campo del cuerpo de la solicitud de invocación de Palmyra X4
Cuando realices una InvokeModelWithResponseStreamllamada InvokeModelo realices una llamada con un modelo de Writer, rellena el body
campo con un objeto JSON que se ajuste al siguiente. Introduce la petición en el campo text
del objeto text_prompts
.
{ "modelId": "writer.palmyra-x4-v1:0", "contentType": "application/json", "accept": "application/json", "body": "{\"messages\":[{\"role\":\"user\",\"content\":{\"text\":\"Explain quantum computing in simple terms\"}}]}" }
La siguiente tabla muestra los valores mínimo, máximo y predeterminado de los parámetros numéricos.
Parámetro | Tipo | Predeterminado/a | Alcance/validación | Descripción |
---|---|---|---|---|
Mensajes |
array |
Obligatorio |
1-∞ artículos |
Mensajes del historial de chat |
temperature |
float |
1.0 |
0.0 ≤ x ≤ 2.0 |
Temperatura de muestreo |
top_p |
float |
1.0 |
0.0 < valor ≤ 1.0 |
Umbral de muestreo del núcleo |
max_tokens |
int |
16 |
1 ≤ x ≤ 8192 |
Número máximo de fichas que se pueden generar |
min_tokens |
int |
0 |
0 ≤ x ≤ max_tokens |
Número mínimo de fichas antes de parar |
parar |
array |
[] |
≤4 entradas |
Detenga las secuencias |
valor de inicialización |
int |
nulo |
Cualquier número entero |
Random seed (Origen aleatorio) |
presence_penalty |
float |
0.0 |
-2,0 ≤ x ≤ 2,0 |
Nueva penalización por presencia de fichas |
penalización de frecuencia |
float |
0.0 |
-2,0 ≤ x ≤ 2,0 |
Penalización por frecuencia simbólica |
Campo corporal de respuesta a la invocación del Palmyra X4
La respuesta para JSON Writer Palmyra X4 usa el siguiente formato:
{ "id": "chatcmpl-a689a6e150b048ca8814890d3d904d41", "object": "chat.completion", "created": 1745854231, "model": "writer.palmyra-x4-v1:0", "choices": [ { "index": 0, "message": { "role": "assistant", "reasoning_content": null, "content": "Quantum computing harnesses quantum mechanics to process information in extraordinarily powerful ways. Unlike classical bits, which are 0 or 1, quantum bits (qubits) can exist in multiple states simultaneously through superposition. Qubits also entangle, allowing them to be interconnected in such a way that the state of one (whether it's 0 or 1) can depend on the state of another, no matter the distance between them. This combination of superposition and entanglement enables quantum computers to solve complex problems much faster than classical computers, particularly in areas like cryptography, optimization, and simulations of molecular structures. However, quantum computing is still in its early stages, facing challenges in stability and scalability.", "tool_calls": [] }, "logprobs": null, "finish_reason": "stop", "stop_reason": null } ], "usage": { "prompt_tokens": 43, "total_tokens": 186, "completion_tokens": 143, "prompt_tokens_details": null }, "prompt_logprobs": null }
Código de ejemplo del Writer Palmyra X4
Código de ejemplo paraWriter Palmyra X4:
import boto3 import json from botocore.exceptions import ClientError client = boto3.client("bedrock-runtime", region_name="us-west-2") model_id = "writer.palmyra-x4-v1:0" # Format the request payload using the model's native structure. native_request = { "temperature": 1, "messages": [ { "role": "user", "content": "Explain quantum computing in simple terms.", } ], } # Convert the native request to JSON. request = json.dumps(native_request) try: # Invoke the model with the request. response = client.invoke_model(modelId=model_id, body=request) except (ClientError, Exception) as e: print(f"ERROR: Can't invoke '{model_id}'. Reason: {e}") exit(1) # Decode the response body. model_response = json.loads(response["body"].read()) # Extract and print the response text. response_text = model_response["content"][0]["text"] print(response_text)