Quote di Lambda - AWS Lambda

Quote di Lambda

Importante

I nuovi Account AWS hanno ridotto la simultaneità e le quote di memoria. AWS aumenta automaticamente queste quote in base all'utilizzo.

AWS Lambda Lambda è progettato per scalare rapidamente per soddisfare la domanda, permettendo alle funzioni di aumentare per servire il traffico della tua applicazione. Il servizio Lambda è progettato per attività di elaborazione di breve durata che non mantengono o si basano sullo stato tra le invocazioni. Il codice può essere eseguito per un massimo di 15 minuti in una singola chiamata e una singola funzione può utilizzare fino a 10.240 MB di memoria.

Tuttavia, prima di scalare un'applicazione a questi livelli, è importante comprendere i limiti definiti per proteggere il proprio account e i carichi di lavoro degli altri clienti. I Service Quotas sono presenti in tutti i servizi AWS e sono costituiti da limiti rigidi, che non è possibile modificare, e limiti flessibili, per i quali è possibile richiedere aumenti. Per impostazione predefinita, a tutti i nuovi account viene assegnato un profilo di quota che consente l'esplorazione dei servizi.

Per visualizzare le quote applicabili al tuo account, vai al pannello di controllo di Service Quotas. Ciò consente di visualizzare le Service Quotas, richiedere un aumento della quota di servizio e visualizzare l'utente corrente. Da qui, puoi approfondire un servizio AWS specifico, come Lambda:

progettazione dell'applicazione (figura 1)

Le seguenti sezioni elencano le quote e i limiti predefiniti in Lambda per categoria.

Calcolo e archiviazione

Lambda imposta le quote per la quantità di risorse di calcolo e storage che è possibile utilizzare per eseguire e archiviare le funzioni. Le quote per le esecuzioni e l'archiviazione simultanee sono applicate in base alla Regione AWS. Le quote dell'interfaccia di rete elastica (ENI) sono applicate in base al cloud privato virtuale (VPC), indipendentemente dalla regione. Le seguenti quote possono essere aumentate rispetto ai relativi valori predefiniti. Per ulteriori informazioni, consulta Richiesta di un aumento delle quote nella Guida per l'utente di Service Quotas.

Risorsa Quota predefinita Può essere aumentato fino a

Esecuzioni simultanee

1.000

Decine di migliaia

Storage per funzioni caricate (archivi di file .zip) e livelli. Ogni versione di funzione e di livello consuma spazio di storage.

Per le best practice da seguire per la gestione dell'archiviazione del codice, consulta Monitoraggio dell'archiviazione del codice Lambda in Serverless Land.

75 GB

Terabyte

Storage per le funzioni definite come immagini di container. Queste immagini sono memorizzate in Amazon ECR.

Consulta Service Quotas di Amazon ECR.

Interfacce di rete elastiche per Virtual Private Cloud (VPC)

Nota

Questa quota è condivisa con altri servizi, ad esempio, Amazon Elastic File System (Amazon EFS). Consulta Quote Amazon VPC.

500

Migliaia

Per ulteriori informazioni sulla simultaneità e su come Lambda ridimensiona la simultaneità della funzione in risposta al traffico, consulta Informazioni sulla scalabilità della funzione Lambda.

Configurazione, implementazione ed esecuzione della funzione

Le seguenti quote si applicano alla configurazione, all'implementazione e all'esecuzione della funzione. Fatto salvo per quanto indicato, non possono essere modificate.

Nota

La documentazione Lambda, i messaggi di log e la console utilizzano l'abbreviazione MB (anziché MiB) per fare riferimento a 1.024 KB.

Risorsa Quota

Allocazione di memoria della funzione

Da 128 MB a 10.240 MB, in incrementi di 1 MB.

Nota: Lambda alloca la potenza della CPU in proporzione alla quantità di memoria configurata. È possibile aumentare o diminuire la memoria e la potenza della CPU assegnate alla funzione utilizzando l'impostazione Memory (MB). A 1.769 MB, una funzione ha l'equivalente di una vCPU.

Timeout della funzione.

900 secondi (15 minuti)

Variabili di ambiente della funzione

4 KB, per tutte le variabili di ambiente associate alla funzione, in forma aggregata

Policy basata sulle risorse della funzione

20 KB

Livelli della funzione

5 livelli

Limite di dimensionamento della simultaneità delle funzioni

Per ogni funzione, 1.000 ambienti di esecuzione ogni 10 secondi

Payload dell'invocazione (richiesta e risposta)

6 MB ciascuno per richiesta e risposta (sincrono)

200 MB per ciascuna risposta trasmessa (sincrona)

1 MB (asincrono)

1 MB per la dimensione totale combinata dei valori della riga di richiesta e dell'intestazione

Larghezza di banda per le risposte in streaming

Senza limite per i primi 6 MB di risposta della funzione

Per risposte superiori a 6 MB, 2 MB/s per il resto della risposta

Dimensioni del pacchetto di implementazione (archivio di file .zip)

50 MB (compressi, se caricato tramite l'API Lambda o gli SDK). Carica file di dimensioni maggiori con Amazon S3.

50 MB (se caricati tramite la console Lambda)

250 MB La dimensione massima del contenuto di un pacchetto di implementazione, inclusi livelli e runtime personalizzati (decompresso).

Impostazioni dell'immagine di container

16 KB

Dimensione del pacchetto del codice dell'immagine di container

10 GB (dimensione massima dell'immagine non compressa, inclusi tutti i livelli)

Eventi di test (editor della console)

10

/tmpStorage della directory

Compreso tra 512 MB e 10.240 MB in incrementi di 1 MB

Descrittori di file

1,024

Processi/thread dell'esecuzione

1,024

Richieste API Lambda

Le seguenti quote sono associate alle richieste API Lambda.

Risorsa Quota

Richieste di chiamata per funzione per regione (sincrona)

Ogni istanza del tuo ambiente di esecuzione può gestire fino a 10 richieste al secondo. In altre parole, il limite totale di chiamate è 10 volte il limite di simultaneità. Per informazioni, consulta Informazioni sulla scalabilità della funzione Lambda.

Richieste di chiamata per funzione per regione (asincrona)

Ogni istanza del tuo ambiente di esecuzione può soddisfare un numero illimitato di richieste. In altre parole, il limite totale di chiamate si basa solo sulla simultaneità disponibile per la funzione. Per informazioni, consulta Informazioni sulla scalabilità della funzione Lambda.

Richieste di invocazione per versione di funzione o alias (richieste al secondo)

10 x simultaneità fornita allocata

Nota

Questa quota si applica solo alle funzioni che utilizzano la simultaneità fornita.

Richieste API GetFunction

100 richieste al secondo. Non può essere aumentato.

Richieste API GetPolicy

15 richieste al secondo. Non può essere aumentato.

Promemoria delle richieste API del piano di controllo (escluse le richieste di invocazione, GetFunction e GetPolicy)

15 richieste al secondo per tutte le API (non 15 richieste al secondo per API). Non può essere aumentato.

Altri servizi

Quote per altri servizi, come AWS Identity and Access Management( IAM), Amazon CloudFront (Lambda@Edge) e Amazon Virtual Private Cloud (Amazon VPC), possono influire sulle funzioni di Lambda. Per ulteriori informazioni, consulta la pagina Servizio AWS quotas nella Riferimenti generali di Amazon Web Services e la pagina Richiamare Lambda con eventi di altri servizi AWS.

Molte applicazioni che coinvolgono Lambda utilizzano più AWS servizi. Poiché servizi diversi hanno quote diverse per diverse funzionalità, può essere difficile gestire queste quote nell'intera applicazione. Ad esempio, API Gateway ha un limite di simultaneità predefinito di 10.000 richieste al secondo, mentre Lambda ha un limite di simultaneità predefinito di 1.000. A causa di questa mancata corrispondenza, è possibile che Lambda sia in grado di gestire un numero maggiore di richieste in arrivo da API Gateway. Questo problema può essere risolto richiedendo l'innalzamento del limite di simultaneità Lambda in modo che corrisponda al livello di traffico previsto.

Il test di carico dell'applicazione serverless consente inoltre di monitorare le prestazioni di un'applicazione prima che venga implementata in produzione. Durante un test di carico, è possibile identificare eventuali quote che possono fungere da fattore limitante per i livelli di traffico previsti e agire di conseguenza.