

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

# Le migliori pratiche per i file S3
<a name="s3-files-best-practices"></a>

Questa pagina descrive le migliori pratiche consigliate per lavorare con i file system S3.

## Ottimizzazione delle prestazioni e dei costi
<a name="s3-files-best-practices-performance"></a>
+ **Parallelizza i tuoi carichi di lavoro**: S3 Files è progettato per supportare carichi di lavoro altamente paralleli. La distribuzione delle letture su più file e più istanze di calcolo aiuta a massimizzare il throughput aggregato. Puoi anche creare più file system con diversi prefissi specifici all'interno dello stesso bucket (anziché creare un file system per l'intero bucket) per scalare orizzontalmente e migliorare la produttività aggregata.
+ **Definisci il file system con il prefisso più piccolo necessario per il carico di lavoro per ridurre al minimo l'impatto delle ridenominazioni: S3 non ha un concetto nativo di directory**. Quando rinomini o sposti una directory, S3 Files deve scrivere i dati su un nuovo oggetto con la chiave aggiornata ed eliminare l'originale per ogni file in quella directory. La ridenominazione di directory con decine di milioni di file può aumentare significativamente i costi delle richieste S3 e i tempi di sincronizzazione. Adattate il file system al set di dati attivo oppure strutturate i dati in modo che le directory che intendete rinominare contengano meno file. Per ulteriori informazioni, consulta [Comprendere l'impatto delle operazioni di ridenominazione e spostamento](s3-files-synchronization.md#s3-files-sync-rename-move).
+ **Utilizzate I/O di grandi dimensioni**: S3 Files misura ogni operazione di lettura e scrittura a almeno 32 KB. L'utilizzo di I/O di dimensioni maggiori (1 MB o più) ammortizza il sovraccarico per operazione ed è più conveniente rispetto a molte letture o scritture di piccole dimensioni. Quando si utilizza il mount helper, le dimensioni predefinite del buffer di lettura e scrittura NFS sono impostate su 1 MB per prestazioni ottimali.
+ **Ottimizzate il sizeLessThan valore della configurazione di importazione in base alle dimensioni dei file**: per impostazione predefinita, S3 Files memorizza nella cache i dati per i file di dimensioni inferiori a 128 KB quando accedete per la prima volta a una directory. I file più grandi di questa soglia vengono letti direttamente da S3. Se il tuo carico di lavoro esegue letture di piccole dimensioni e sensibili alla latenza su file di grandi dimensioni, aumenta la sizeLessThan soglia in modo che corrisponda alle dimensioni dei file di cui hai bisogno sullo storage ad alte prestazioni del file system per un accesso a bassa latenza. Per ulteriori informazioni, consulta [Personalizzazione della sincronizzazione per i file S3](s3-files-synchronization-customizing.md).
+ **Imposta le finestre di scadenza in modo che corrispondano al ciclo di vita del carico di lavoro**: i dati che non sono stati letti entro la finestra di scadenza vengono rimossi automaticamente dal file system. Per carichi di lavoro di breve durata, come lavori in batch o sessioni di formazione, utilizza una scadenza più breve (1—7 giorni) per ridurre al minimo i costi di storage. Per i carichi di lavoro che rivisitano gli stessi dati per settimane, utilizza una scadenza più lunga (30—90 giorni) per continuare a beneficiare della bassa latenza. Per ulteriori informazioni, consulta [Personalizzazione della sincronizzazione per i file S3](s3-files-synchronization-customizing.md).
+ **Utilizza regole con ambito prefisso per carichi di lavoro misti**: se il bucket contiene dati con accesso frequente e dati ad accesso raro, crea regole di importazione separate per ogni prefisso. Ciò consente di importare i dati in modo aggressivo per i prefissi caldi, mantenendo i prefissi freddi solo per i metadati. Per ulteriori informazioni, consulta [Personalizzazione della sincronizzazione per i file S3](s3-files-synchronization-customizing.md).
+ **Crea un target di montaggio in ogni zona di disponibilità**: ti consigliamo di creare un target di montaggio in ogni zona di disponibilità in cui operi in modo da ridurre i costi di trasferimento dei dati tra le varie zone di disponibilità e migliorare le prestazioni. Ciò garantisce che le risorse di elaborazione abbiano sempre un percorso di rete locale verso il file system, migliorando sia la disponibilità che la latenza. Quando crei un file system utilizzando la console di AWS gestione, S3 Files crea automaticamente una destinazione di montaggio in ogni zona di disponibilità nel VPC selezionato.

## Sincronizzazione
<a name="s3-files-best-practices-sync"></a>
+ **Comprendi il modello di consistenza di S3 Files**: quando un file nel file system viene modificato contemporaneamente all'oggetto corrispondente nel bucket S3, S3 Files considera il bucket S3 come fonte di verità e lo sposta nella directory lost and found. Per evitare conflitti, designa un percorso (file system o S3) come autore principale.
+ **Monitora lo stato della sincronizzazione**: utilizza le CloudWatch metriche per tenere traccia dello stato della sincronizzazione tra il file system e il bucket S3. Un aumento `PendingExports` indica che il carico di lavoro sta generando modifiche più velocemente della velocità di sincronizzazione, il che significa che il completamento della sincronizzazione richiederà più tempo. Una `ExportFailures` CloudWatch metrica diversa da zero indica i file che non possono essere esportati e richiedono un'azione. Per ulteriori informazioni, consulta [Risoluzione dei problemi relativi ai file S3](s3-files-troubleshooting.md).

## Controllo accessi
<a name="s3-files-best-practices-access"></a>
+ **Segui il principio del privilegio minimo**: concedi solo le autorizzazioni minime richieste per ogni ruolo IAM e policy del file system. Ad esempio, se una risorsa di elaborazione deve solo leggere i dati dal file system, allega invece la policy `AmazonS3FilesClientReadOnlyAccess` gestita. `AmazonS3FilesClientFullAccess` Inoltre, prendete in considerazione la possibilità di creare un file system basato su un prefisso specifico anziché sull'intero bucket, in modo che i client possano accedere solo ai dati all'interno di quel prefisso.
+ **Non modificare il ruolo IAM di S3 Files: non modificare o eliminare il ruolo IAM** che S3 Files presuppone per la sincronizzazione con il bucket S3. La modifica o la rimozione di questo ruolo può interrompere la sincronizzazione tra il file system e il bucket S3.
+ **Non modificare la regola S3 Files: S3 Files crea una EventBridge EventBridge regola** (con il prefisso DO-NOT-DELETE-S 3-Files) per rilevare le modifiche nel bucket S3. Non disattivate, modificate o eliminate questa regola. La sua rimozione impedisce a S3 Files di rilevare oggetti nuovi o modificati nel bucket, causando l'obsolescenza del file system.
+ **Prendi in considerazione la possibilità di limitare l'accesso ai log scritti da `efs-utils`**: `efs-utils` scrive i nomi delle chiavi degli oggetti S3 direttamente nei log che memorizza nella directory. `/var/log/amazon/efs` Se i nomi delle chiavi S3 contengono informazioni riservate, è necessario limitare l'accesso a questa directory tramite le autorizzazioni POSIX. Ad esempio, è possibile limitare l'accesso tramite il comando. `sudo chmod 700 /var/log/amazon/efs`

## Monitoraggio
<a name="s3-files-best-practices-monitoring"></a>
+ **Imposta allarmi in caso di errori di sincronizzazione: attiva** gli CloudWatch allarmi `ImportFailures` e ricevi una notifica quando i file non riescono `ExportFailures` a sincronizzarsi. Le esportazioni non riuscite possono indicare problemi di autorizzazione, problemi con le chiavi di crittografia o limiti di lunghezza del percorso. Per ulteriori informazioni, consulta [Risoluzione dei problemi relativi ai file S3](s3-files-troubleshooting.md).