

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

# Il pilastro dell'eccellenza operativa
<a name="operational-excellence"></a>

Il pilastro dell'[eccellenza operativa](https://docs.aws.amazon.com/wellarchitected/latest/framework/operational-excellence.html) del AWS Well-Architected Framework si concentra sull'esecuzione e sul monitoraggio dei sistemi e sul miglioramento continuo dei processi e delle procedure per fornire valore aziendale. Il pilastro dell'eccellenza operativa include la capacità di supportare lo sviluppo ed eseguire i carichi di lavoro in modo efficace e di ottenere informazioni dettagliate sul loro funzionamento.

È possibile ridurre la complessità operativa attraverso carichi di lavoro con riparazione automatica, che rilevano e risolvono la maggior parte dei problemi senza l'intervento umano. Per raggiungere questo obiettivo, segui le best practice descritte in questa sezione. Usa i parametri [Amazon](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/WhatIsCloudWatch.html) per Amazon Timestream for InfluxDB, l' APIsendpoint di CloudWatch metriche nativo di InfluxDB e i meccanismi per rispondere quando il carico di lavoro si discosta dal comportamento previsto.

Questa discussione sul pilastro dell'eccellenza operativa si concentra sulle seguenti aree chiave:
+ Infrastructure as code (IaC)
+ Gestione delle modifiche
+ Strategie di resilienza
+ Gestione degli incidenti
+ Registrazione e monitoraggio a fini di controllo

## Automatizza l'implementazione utilizzando un approccio IaC
<a name="iac"></a>

Le migliori pratiche per automatizzare l'implementazione su Timestream for InfluxDB utilizzando IaC includono quanto segue:
+ Applica IAc per distribuire Timestream per InfluxDB quando possibile. Per una configurazione coerente dell'ambiente, usa un [AWS CloudFormation](https://docs.aws.amazon.com/AWSCloudFormation/latest/UserGuide/Welcome.html)modello o [HashiCorp Terraform](https://aws.amazon.com/blogs/apn/terraform-beyond-the-basics-with-aws/) per creare tutte le risorse necessarie per la tua istanza. [AWS Cloud Development Kit (AWS CDK)](https://docs.aws.amazon.com/cdk/v2/guide/home.html)
+ Automatizza Timestream per le procedure operative di InfluxDB, come il ridimensionamento delle istanze.
+ Usa i tag per aggiungere metadati alle tue risorse Timestream for InfluxDB e monitora l'utilizzo in base ai tag. Per ulteriori informazioni, consulta [Tagging Amazon Timestream](https://docs.aws.amazon.com/timestream/latest/developerguide/tagging-keyspaces-influxdb.html) for InfluxDB.

## Apporta modifiche frequenti, piccole e reversibili
<a name="change-management"></a>

Le seguenti raccomandazioni si concentrano su modifiche piccole e reversibili per ridurre al minimo la complessità e ridurre la probabilità di interruzione del carico di lavoro:
+ Archivia modelli e script IaC in un servizio di controllo del codice sorgente, ad esempio o. GitHub GitLab Non AWS memorizzate le credenziali nel controllo del codice sorgente.
+ Richiedi che le implementazioni IaC utilizzino un servizio di integrazione e distribuzione continua (CI/CD), come o. [AWS CodeDeploy[AWS CodeBuild](https://docs.aws.amazon.com/codebuild/latest/userguide/welcome.html)](https://docs.aws.amazon.com/codedeploy/latest/userguide/welcome.html) Questi servizi compilano, testano e distribuiscono il codice in un ambiente non di produzione che contiene un'istanza temporanea di InfluxDB prima di influire sull'istanza di produzione di InfluxDB.
+ Testa le query sull'infrastruttura e sulle applicazioni in un ambiente inferiore prima di distribuirle in produzione. Ciò riduce al minimo la probabilità di interruzioni e aiuta a garantire che funzionino bene con il carico di lavoro e la scalabilità.

## Anticipa il fallimento
<a name="resilience"></a>

Un'infrastruttura con riparazione automatica esemplifica l'eccellenza operativa anticipando i guasti e tentando di risolvere eventuali problemi senza intervento. I seguenti consigli ti aiutano a raggiungere tale maturità con Timestream for InfluxDB:
+ Utilizza le metriche per monitorare l'utilizzo della memoria, della CPU e dello storage. CloudWatch può essere configurato per avvisarti quando i modelli di utilizzo cambiano o quando stai per raggiungere la capacità massima della distribuzione. In questo modo, è possibile mantenere le prestazioni e la disponibilità del sistema.
+ Aumenta la scalabilità della tua istanza DB quando ti avvicini al limite di risorse. Avrai bisogno di memoria e storage aggiuntivi per soddisfare aumenti imprevisti della domanda delle tue applicazioni.
+ Se il carico di lavoro del database richiede I/O più di quanto previsto, il ripristino dopo un failover o un errore del database sarà lento. Per aumentare la capacità. I/O capacity of a DB instance, migrate to a different DB instance that has higher I/O
+ Se l'applicazione client memorizza nella cache i dati DNS delle istanze DB, imposta un valore time-to-live (TTL) inferiore a 30 secondi. L'indirizzo IP sottostante di un'istanza DB può cambiare dopo un failover. La memorizzazione nella cache dei dati DNS per un periodo prolungato può causare errori di connessione. L'applicazione potrebbe tentare di connettersi a un indirizzo IP non più in uso.
+ Se la tua applicazione richiede di sopravvivere a un' Regione AWS interruzione completa, prendi in considerazione la possibilità di configurare la replica o di scrivere in un'altra regione come parte dei tuoi piani di disaster recovery (DR). Comprendi i limiti durante la configurazione della replica. Per ulteriori informazioni sulla replica, consulta la documentazione di [InfluxDB](https://docs.influxdata.com/influxdb/cloud/write-data/replication/replicate-data/).

## Imparate da tutti gli errori operativi
<a name="incident-management"></a>

Un'infrastruttura che si ripara automaticamente è uno sforzo a lungo termine che si sviluppa in iterazioni quando si verificano problemi rari o le risposte non sono così efficaci come si desidera. Per concentrarti sulla realizzazione di un'infrastruttura con riparazione automatica, adotta le seguenti pratiche:
+ Promuovi il miglioramento imparando da tutti i fallimenti.
+ Condividi ciò che viene appreso tra i team e l'organizzazione. Se più team all'interno di un'organizzazione utilizzano Timestream for InfluxDB, crea una chat room o un gruppo di utenti comune per condividere le lezioni apprese e le migliori pratiche.

## Utilizza le funzionalità di registrazione per monitorare attività non autorizzate o anomale
<a name="logging-monitoring"></a>

Per osservare modelli anomali di prestazioni e attività, prendi in considerazione le seguenti pratiche:
+ Abilita la [consegna dei log](https://docs.aws.amazon.com/timestream/latest/developerguide/timestream-for-influx-managing-view-influx-logs.html) per archiviare i log di InfluxDB in [Amazon Simple Storage Service (](https://docs.aws.amazon.com/AmazonS3/latest/userguide/Welcome.html)Amazon S3). InfluxDB registra le informazioni sui record che possono aiutare a verificare quanto segue:
  + [Eventi dell'API Data Plane](https://docs.influxdata.com/influxdb/v2/reference/api/)
  + Tempi di risposta
  + Dettagli sulla compattazione
  + Eventuali errori o avvisi critici riscontrati dal sistema

  Esamina i registri per verificare eventuali accessi non autorizzati o anomalie. Nel complesso, la registrazione fornisce informazioni diagnostiche per la risoluzione dei problemi.
+ Timestream for InfluxDB supporta la registrazione delle azioni del piano di controllo utilizzando. AWS CloudTrail Per ulteriori informazioni, consulta [Registrazione di Timestream](https://docs.aws.amazon.com/timestream/latest/developerguide/logging-using-cloudtrail-influxdb.html) per le chiamate API InfluxDB con. AWS CloudTrail
+ **Puoi monitorare e misurare le `DiskUtilization` metriche da `CPUUtilization` `MemoryUtilization` **Timestream/InfluxDB** > < Namespace > in.** CloudWatch

[Per ulteriori informazioni, consulta la documentazione di Timestream for InfluxDB.](https://docs.aws.amazon.com/timestream/latest/developerguide/monitoring-influxdb.html)