AI21 Labs Jurassic-2 Modèles

Cette section fournit les paramètres d’inférence et un exemple de code pour l’utilisation des modèles AI21 Labs AI21 Labs Jurassic-2.

Rubriques

Paramètres d'inférence
Exemple de code

Paramètres d'inférence

Les modèles AI21 Labs Jurassic-2 prennent en charge les paramètres d’inférence suivants.

Rubriques

Caractère aléatoire et diversité
Length
Répétitions
Champ body de la demande d’invocation du modèle
Champ body de la réponse à l’invocation du modèle

Caractère aléatoire et diversité

Les modèles AI21 Labs Jurassic-2 prennent en charge les paramètres suivants pour contrôler le caractère aléatoire et la diversité de la réponse.

Température (temperature) : utilisez une valeur inférieure pour réduire le caractère aléatoire de la réponse.
Top P (topP) : utilisez une valeur inférieure pour ignorer les options les moins probables.

Length

Les modèles AI21 Labs Jurassic-2 prennent en charge les paramètres suivants pour contrôler la longueur de la réponse générée.

Longueur maximale de complétion (maxTokens) : spécifiez le nombre maximum de jetons à utiliser dans la réponse générée.
Séquences d’arrêt (stopSequences) : configurez les séquences d’arrêt que le modèle reconnaît et après lesquelles il arrêtera de générer d’autres jetons. Appuyez sur la touche Entrée pour insérer un caractère de nouvelle ligne dans une séquence d’arrêt. Utilisez la touche de tabulation pour terminer l’insertion d’une séquence d’arrêt.

Répétitions

Les modèles AI21 Labs Jurassic-2 prennent en charge les paramètres suivants pour contrôler la répétition dans la réponse générée.

Pénalité de présence (presencePenalty) : utilisez une valeur élevée pour réduire la probabilité de la génération de nouveaux jetons qui apparaissent déjà au moins une fois dans l’invite ou dans la complétion.
Pénalité de décompte (countPenalty) : utilisez une valeur élevée pour réduire la probabilité de la génération de nouveaux jetons qui apparaissent déjà au moins une fois dans l’invite ou dans la complétion. Proportionnelle au nombre d’apparitions.
Pénalité de fréquence (frequencyPenalty) : utilisez une valeur élevée pour réduire la probabilité de la génération de nouveaux jetons qui apparaissent déjà au moins une fois dans l’invite ou dans la complétion. Cette valeur est proportionnelle à la fréquence d’apparition des jetons (normalisée en fonction de la longueur du texte).
Pénaliser les jetons spéciaux : réduisez la probabilité de la répétition de caractères spéciaux. Les valeurs par défaut sont true.
- Espaces blancs (applyToWhitespaces) : une valeur true applique la pénalité aux espaces blancs et aux nouvelles lignes.
- Ponctuation (applyToPunctuation) : une valeur true applique la pénalité à la ponctuation.
- Nombres (applyToNumbers) : une valeur true applique la pénalité aux nombres.
- Mots vides (applyToStopwords) : une valeur true applique la pénalité aux mots vides.
- Emojis (applyToEmojis) : une valeur true exclut les emojis de la pénalité.

Champ body de la demande d’invocation du modèle

Lorsque vous effectuez un InvokeModelWithResponseStreamappel InvokeModelou à l'aide d'un AI21 Labs modèle, remplissez le body champ avec un objet JSON conforme à celui ci-dessous. Entrez l’invite dans le champ prompt.


{
    "prompt": string,
    "temperature": float,
    "topP": float,
    "maxTokens": int,
    "stopSequences": [string],
    "countPenalty": {
        "scale": float
    },
    "presencePenalty": {
        "scale": float
    },
    "frequencyPenalty": {
        "scale": float
    }
}

Pour pénaliser des jetons spéciaux, ajoutez ces champs à n’importe quel objet de pénalité. Par exemple, vous pouvez modifier le champ countPenalty comme suit.


"countPenalty": {
    "scale": float,
    "applyToWhitespaces": boolean,
    "applyToPunctuations": boolean,
    "applyToNumbers": boolean,
    "applyToStopwords": boolean,
    "applyToEmojis": boolean
}

Le tableau suivant indique les valeurs minimales, maximales et par défaut des paramètres numériques.

Catégorie	Paramètre	Format d'objet JSON	Maximum	Par défaut
Caractère aléatoire et diversité	Température	temperature	1	0.5
Caractère aléatoire et diversité	Top P	topP	1	0.5
Length	Nombre maximum de jetons (modèles moyens, ultra et grands)	maxTokens	8 191	200
Length	Nombre maximum de jetons (autres modèles)	maxTokens	2 048	200
Répétitions	Pénalité de présence	presencePenalty	5	0
	Pénalité de décompte	countPenalty	1	0
	Pénalité de fréquence	frequencyPenalty	500	0

Champ body de la réponse à l’invocation du modèle

Pour plus d'informations sur le format du body champ dans la réponse, consultez la référence de l'API AI21.

Note

Amazon Bedrock renvoie l’identifiant de réponse (id) sous forme de valeur entière.

Exemple de code

Cet exemple montre comment appeler le modèle A2I AI21 Labs Jurassic-2 Mid.


import boto3
import json

brt = boto3.client(service_name='bedrock-runtime')

body = json.dumps({
    "prompt": "Translate to spanish: 'Amazon Bedrock is the easiest way to build and scale generative AI applications with base models (FMs)'.", 
    "maxTokens": 200,
    "temperature": 0.5,
    "topP": 0.5
})

modelId = 'ai21.j2-mid-v1'
accept = 'application/json'
contentType = 'application/json'

response = brt.invoke_model(
    body=body, 
    modelId=modelId, 
    accept=accept, 
    contentType=contentType
)

response_body = json.loads(response.get('body').read())

# text
print(response_body.get('completions')[0].get('data').get('text'))

Avertissement JavaScript est désactivé ou n'est pas disponible dans votre navigateur.

Pour que vous puissiez utiliser la documentation AWS, Javascript doit être activé. Vous trouverez des instructions sur les pages d'aide de votre navigateur.

Conventions de rédaction

AI21 Labs Modèles

AI21 Labs Modèles Jamba