Writer Palmyra X4 - Amazon Bedrock

Writer Palmyra X4

Writer Palmyra X4 は、最大 128,000 トークンのコンテキストウィンドウを持つモデルです。このモデルは、複雑なタスクの処理と理解に優れているため、ワークフローオートメーション、コーディングタスク、データ分析に最適です。

  • プロバイダー — Writer

  • カテゴリ — テキスト生成、コード生成、リッチテキストフォーマット

  • 最新バージョン — v1

  • リリース日 — 2025 年 4 月 28 日

  • モデル ID — writer.palmyra-x4-v1:0

  • モダリティ — テキスト

  • 最大トークン数 — 入力: 122,880 トークン、出力: 8,192 トークン

  • 言語 — 英語、スペイン語、フランス語、ドイツ語、中国語、その他の複数の言語

  • デプロイタイプ — サーバーレス

Palmyra X4 呼び出しリクエストの本文フィールド

Writer モデルを使用して InvokeModel または InvokeModelWithResponseStream を呼び出す場合、以下の JSON オブジェクトを body フィールドに入力します。text_prompts オブジェクトの text フィールドにプロンプトを入力してください。

{ "modelId": "writer.palmyra-x4-v1:0", "contentType": "application/json", "accept": "application/json", "body": "{\"messages\":[{\"role\":\"user\",\"content\":{\"text\":\"Explain quantum computing in simple terms\"}}]}" }

次の表は、数値パラメータの最小値、最大値、およびデフォルト値を示しています。

パラメータ タイプ デフォルト 範囲/検証 説明

メッセージ

配列

必須

1~∞ 項目

チャット履歴メッセージ

温度

フロート

1.0

0.0 ≤ x ≤ 2.0

サンプリング温度

top_p

フロート

1.0

0.0 < 値 ≤ 1.0

Nucleus サンプリングしきい値

max_tokens

int

16

1 ≤ x ≤ 8192

生成する最大トークン数

min_tokens

int

0

0 ≤ x ≤ max_tokens

停止前の最小トークン数

停止

配列

[]

≤4 エントリ

停止シーケンス

シード

int

null

任意の整数

[Random seed] (ランダムシード)

presence_penalty

フロート

0.0

-2.0 ≤ x ≤ 2.0

新しいトークンプレゼンスのペナルティ

frequency_penalty

フロート

0.0

-2.0 ≤ x ≤ 2.0

トークンの頻度ペナルティ

Palmyra X4 呼び出しレスポンスの本文フィールド

Writer Palmyra X4 のレスポンス JSON は、以下の形式を使用します。

{ "id": "chatcmpl-a689a6e150b048ca8814890d3d904d41", "object": "chat.completion", "created": 1745854231, "model": "writer.palmyra-x4-v1:0", "choices": [ { "index": 0, "message": { "role": "assistant", "reasoning_content": null, "content": "Quantum computing harnesses quantum mechanics to process information in extraordinarily powerful ways. Unlike classical bits, which are 0 or 1, quantum bits (qubits) can exist in multiple states simultaneously through superposition. Qubits also entangle, allowing them to be interconnected in such a way that the state of one (whether it's 0 or 1) can depend on the state of another, no matter the distance between them. This combination of superposition and entanglement enables quantum computers to solve complex problems much faster than classical computers, particularly in areas like cryptography, optimization, and simulations of molecular structures. However, quantum computing is still in its early stages, facing challenges in stability and scalability.", "tool_calls": [] }, "logprobs": null, "finish_reason": "stop", "stop_reason": null } ], "usage": { "prompt_tokens": 43, "total_tokens": 186, "completion_tokens": 143, "prompt_tokens_details": null }, "prompt_logprobs": null }

Writer Palmyra X4 のコードの例

Writer Palmyra X4 のコード例

import boto3 import json from botocore.exceptions import ClientError client = boto3.client("bedrock-runtime", region_name="us-west-2") model_id = "writer.palmyra-x4-v1:0" # Format the request payload using the model's native structure. native_request = { "temperature": 1, "messages": [ { "role": "user", "content": "Explain quantum computing in simple terms.", } ], } # Convert the native request to JSON. request = json.dumps(native_request) try: # Invoke the model with the request. response = client.invoke_model(modelId=model_id, body=request) except (ClientError, Exception) as e: print(f"ERROR: Can't invoke '{model_id}'. Reason: {e}") exit(1) # Decode the response body. model_response = json.loads(response["body"].read()) # Extract and print the response text. response_text = model_response["content"][0]["text"] print(response_text)