Modèles Writer AI Palmyra - Amazon Bedrock

Modèles Writer AI Palmyra

Cette section décrit les paramètres de demande et les champs de réponse pour les modèles Writer AI. Utilisez ces informations pour effectuer des appels d’inférence aux modèles Writer AI à l’aide des opérations InvokeModel et InvokeModelWithResponseStream (streaming). Cette section inclut également des exemples de code Python qui montrent comment appeler les modèles Writer AI. Pour utiliser un modèle dans une opération d’inférence, vous avez besoin de l’ID du modèle. Pour obtenir l’ID du modèle, consultez Modèles de fondation pris en charge dans Amazon Bedrock. Certains modèles fonctionnent également avec l’API Converse. Pour vérifier si l’API Converse prend en charge un modèle Writer AI spécifique, consultez Modèles et fonctionnalités des modèles pris en charge. Pour plus d’exemples de code, consultez Exemples de code pour Amazon Bedrock utilisant des kits AWS SDK.

Les modèles de fondation d’Amazon Bedrock prennent en charge les modalités d’entrée et de sortie, qui varient d’un modèle à l’autre. Pour vérifier les modalités prises en charge par les modèles Writer AI, consultez Modèles de fondation pris en charge dans Amazon Bedrock. Pour vérifier quelles fonctionnalités Amazon Bedrock sont prises en charge par les modèles Writer AI, consultez Modèles de fondation pris en charge dans Amazon Bedrock. Pour vérifier dans quelles régions AWS les modèles Writer AI sont disponibles, consultez Modèles de fondation pris en charge dans Amazon Bedrock.

Lorsque vous effectuez des appels d’inférence avec les modèles Writer AI, vous incluez une invite pour le modèle. Pour plus d’informations générales sur la création d’invites pour les modèles pris en charge par Amazon Bedrock, consultez Concepts d’ingénierie de requête. Pour obtenir des informations sur les invites spécifiques Writer AI, consultez le guide d’ingénierie de requête Writer AI.

Writer Palmyra X4

Classé en tête du classement Stanford HELM, Writer Palmyra X4 atteint des performances supérieures dans le cadre de tâches complexes et de flux de travail agentiques. Il combine une fenêtre contextuelle de 128 000 jetons à une suite de fonctionnalités destinées aux entreprises, notamment le raisonnement avancé, l’appel d’outils, la délégation LLM, la génération à enrichissement contextuel (RAG) intégrée, la génération de code, les sorties structurées, la multimodalité et le support multilingue. À l’aide d’outils spécifiques à l’entreprise qui étendent la capacité d’action du modèle, Palmyra X4 permet aux développeurs de créer des applications et des agents chargés de mettre à jour le système, d’effectuer des transactions, d’envoyer des e-mails, de déclencher un flux de travail, etc.

Writer Palmyra X5

Avec une fenêtre contextuelle d’un million de jetons, Writer Palmyra X5 marque la fin des contraintes contextuelles pour le développement d’applications et d’agents. Le nouveau modèle de Writer atteint des performances supérieures en matière d’inférence contextuelle prolongée grâce à une mémoire et à une puissance de traitement étendues, permettant aux développeurs de créer plus rapidement des flux de travail agentiques plus complexes en plusieurs étapes. À l’instar de Palmyra X4, Palmyra X5 inclut une suite de fonctionnalités adaptées aux entreprises, notamment le raisonnement avancé, l’appel d’outils, la délégation LLM, la génération à enrichissement contextuel (RAG) intégrée, la génération de code, les sorties structurées, la multimodalité et le support multilingue