

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

# Usar o Feature Store com o SDK para Python (Boto3)
<a name="feature-store-create-feature-group"></a>

O grupo de recursos é o principal recurso da Feature Store que contém seus dados e metadados de aprendizado de máquina (ML) armazenados na Amazon SageMaker Feature Store. Um grupo de recursos é um agrupamento lógico de recursos e registros. A definição de um grupo de atributos é composta por configurações para seu armazenamento on-line e offline e uma lista de definições de atributos que são usados para descrever os valores de seus registros. As definições do atributo devem incluir um nome de identificador de registro e um nome de horário do evento. Para obter mais informações sobre conceitos de arquivo de atributos, consulte [Conceitos do Feature Store](feature-store-concepts.md).

Antes de usar um arquivo de atributos, você normalmente carrega seu conjunto de dados, executa transformações e configura seus atributos para ingestão. Esse processo tem muitas variações e depende muito dos seus dados. O código de exemplo nos tópicos a seguir se refere aos notebooks de exemplo [Introdução à Feature Store](https://sagemaker-examples.readthedocs.io/en/latest/sagemaker-featurestore/feature_store_introduction.html) e [Detecção de Fraudes com a Amazon SageMaker Feature Store](https://sagemaker-examples.readthedocs.io/en/latest/sagemaker-featurestore/sagemaker_featurestore_fraud_detection_python_sdk.html), respectivamente. Ambos usam o AWS SDK para Python (Boto3). Para obter mais exemplos e recursos do Feature Store, consulte [Recursos da Amazon SageMaker Feature Store](feature-store-resources.md).

O Feature Store é compatível com os seguintes tipos de atributos:`String`, `Fractional` (valor de ponto flutuante IEEE de 64 bits) e `Integral` (valor integral assinado Int64 - 64 bits). O tipo de padrão é definido como `String`. Isso significa que, se uma coluna em seu conjunto de dados não for do tipo de atributo `float` ou `long`, o padrão será `String` em seu arquivo de atributos.

Você pode usar um esquema para descrever as colunas e os tipos de dados dos seus dados. Você passa esse esquema para `FeatureDefinitions`, um parâmetro obrigatório para o `FeatureGroup`. É possível usar o SDK para Python (Boto3), que tem detecção automática de tipo de dados quando você usa a função `load_feature_definitions`.

O comportamento padrão quando um novo registro de atributo é adicionado com uma ID de registro já existente é o seguinte: No armazenamento offline, o novo registro será anexado. No armazenamento on-line, se o horário do evento do novo registro for menor que o horário do evento existente, nada acontecerá, mas se o horário do evento do novo registro for maior ou igual ao horário do evento existente, o registro será sobrescrito.

Ao criar um novo grupo de atributos, você pode escolher um dos seguintes formatos de tabela:
+ AWS Glue (Padrão)
+ Apache Iceberg

A ingestão de dados, especialmente durante o streaming, pode resultar em um grande número de arquivos pequenos depositados no armazenamento offline. Isso pode afetar negativamente o desempenho da consulta devido ao maior número de operações de arquivo necessárias. Para evitar possíveis problemas de desempenho, use o formato de tabela Apache Iceberg ao criar novos grupos de atributos. Com o Iceberg, você pode compactar os pequenos arquivos de dados em menos arquivos grandes na partição, resultando em consultas significativamente mais rápidas. Essa operação de compactação é simultânea e não afeta as operações contínuas de leitura e gravação no grupo de atributos. Se você escolher a opção Iceberg ao criar novos grupos de recursos, a Amazon SageMaker Feature Store criará as tabelas Iceberg usando o formato de arquivo Parquet e registrará as tabelas com o. AWS Glue Data Catalog

**Importante**  
Observe que, para grupos de atributos no formato de tabela Iceberg, você deve especificar `String` como o valor do horário do evento. Se você especificar qualquer outro tipo, não poderá criar o grupo de atributos com êxito.

A seguir, listamos alguns atributos gerenciados do Feature Store disponíveis.

**Topics**
+ [Introdução ao caderno de exemplo do Feature Store](feature-store-introduction-notebook.md)
+ [Detecção de fraudes com o caderno de exemplo do Feature Store](feature-store-fraud-detection-notebook.md)