Ajout de fonctionnalités et d’enregistrements à un groupe de caractéristiques - Amazon SageMaker AI

Ajout de fonctionnalités et d’enregistrements à un groupe de caractéristiques

Vous pouvez utiliser l’API Amazon SageMaker Feature Store ou la console pour mettre à jour et décrire votre groupe de caractéristiques, ainsi qu’ajouter des caractéristiques et des enregistrements à votre groupe de caractéristiques. Un groupe de fonctionnalités est un objet qui contient vos données et une fonctionnalité décrit une colonne de la table. Lorsque vous ajoutez une fonctionnalité au groupe de fonctionnalités, vous ajoutez effectivement une colonne à la table. Lorsque vous ajoutez un nouvel enregistrement au groupe de fonctionnalités, vous renseignez les valeurs des fonctionnalités associées à un identificateur d'enregistrement spécifique. Pour plus d'informations sur les concepts de Feature Store, consultez Concepts liés à Feature Store.

Après avoir ajouté des fonctionnalités à un groupe de fonctionnalités, vous ne pouvez pas les supprimer. Les fonctionnalités que vous avez ajoutées n'ajoutent aucune donnée à vos enregistrements. Vous pouvez ajouter de nouveaux enregistrements dans le groupe de fonctionnalités ou vous pouvez les remplacer à l'aide de l'API PutRecord. Pour obtenir des exemples de mise à jour, de description et de placement d’enregistrements dans un groupe de caractéristiques, consultez Exemple de code.

Vous pouvez utiliser la console pour ajouter des caractéristiques à un groupe de caractéristiques. Pour plus d’informations sur la manière de mettre à jour vos groupes de caractéristiques à l’aide de la console, consultez Mise à jour d’un groupe de caractéristiques depuis la console.

Les sections suivantes fournissent une vue d’ensemble de l’utilisation des API Feature Store pour ajouter des caractéristiques à un groupe de caractéristiques, suivie par des exemples. Avec l’API, vous pouvez également ajouter ou remplacer des enregistrements après avoir mis à jour le groupe de caractéristiques.

« Hello, World! »

Utilisation de l'opération UpdateFeatureGroup pour ajouter des fonctionnalités à un groupe de fonctionnalités

Vous pouvez utiliser le plugin DescribeFeatureGroup pour voir si vous avez ajouté les fonctionnalités avec succès.

Pour ajouter ou écraser des enregistrements, utilisez l'opération PutRecord.

Pour voir les mises à jour que vous avez apportées à un enregistrement, utilisez l'opération GetRecord. Pour voir les mises à jour que vous avez apportées à plusieurs enregistrements, utilisez l'opération BatchGetRecord. L'affichage des mises à jour que vous avez apportées peut prendre jusqu'à cinq minutes.

Vous pouvez utiliser l'exemple de code de la section suivante pour vous guider dans l'ajout de fonctionnalités et d'enregistrements à l'aide de AWS SDK for Python (Boto3).

Exemple de code

L'exemple de code vous guide tout au long du processus suivant :

  1. Ajouter des fonctionnalités au groupe de fonctionnalités

  2. Vérifier que vous les avez bien ajoutés

  3. Ajouter un enregistrement au groupe de fonctionnalités

  4. Vérifier que vous l'avez ajouté avec succès

Étape 1 : Ajouter des fonctionnalités à un groupe de fonctionnalités

Le code suivant utilise l'opération UpdateFeatureGroup pour ajouter de nouvelles fonctionnalités au groupe de fonctionnalités. Il suppose que vous avez configuré la Feature store et créé un groupe de fonctionnalités Pour plus d'informations sur comment démarrer, consultez Exemple de bloc-notes Introduction à Feature Store.

import boto3 sagemaker_client = boto3.client("sagemaker") sagemaker_client.update_feature_group( FeatureGroupName=feature_group_name, FeatureAdditions=[ {"FeatureName": "new-feature-1", "FeatureType": "Integral"}, {"FeatureName": "new-feature-2", "FeatureType": "Fractional"}, {"FeatureName": "new-feature-3", "FeatureType": "String"} ] )

Le code suivant utilise l'opération DescribeFeatureGroup pour vérifier l'état de la mise à jour. Si le champ LastUpdateStatus est Successful, vous avez ajouté les fonctionnalités avec succès.

sagemaker_client.describe_feature_group( FeatureGroupName=feature_group_name )

Étape 2 : Ajouter un nouvel enregistrement au groupe de fonctionnalités

Le code suivant utilise l'opération PutRecord pour ajouter des enregistrements au groupe de fonctionnalités que vous avez créé.

record_identifier_value = 'new_record' sagemaker_featurestore_runtime_client = boto3.client("sagemaker-featurestore-runtime") sagemaker_runtime_client.put_record( FeatureGroupName=feature_group_name, Record=[ { 'FeatureName': "record-identifier-feature-name", 'ValueAsString': record_identifier_value }, { 'FeatureName': "event-time-feature", 'ValueAsString': "timestamp-that-feature-store-returns" }, { 'FeatureName': "new-feature-1", 'ValueAsString': "value-as-string" }, { 'FeatureName': "new-feature-2", 'ValueAsString': "value-as-string" }, { 'FeatureName': "new-feature-3", 'ValueAsString': "value-as-string" }, ] )

Utilisez de l'opération GetRecord pour voir quels enregistrements de votre groupe de fonctionnalités ne contiennent pas de données pour les fonctionnalités que vous avez ajoutées. Vous pouvez utiliser l’opération PutRecord pour écraser les enregistrements qui ne contiennent pas de données pour les fonctionnalités que vous avez ajoutées.