Quote di Lambda
Importante
I nuovi Account AWS hanno ridotto la simultaneità e le quote di memoria. AWS aumenta automaticamente queste quote in base all'utilizzo.
AWS Lambda Lambda è progettato per scalare rapidamente per soddisfare la domanda, permettendo alle funzioni di aumentare per servire il traffico della tua applicazione. Il servizio Lambda è progettato per attività di elaborazione di breve durata che non mantengono o si basano sullo stato tra le invocazioni. Il codice può essere eseguito per un massimo di 15 minuti in una singola chiamata e una singola funzione può utilizzare fino a 10.240 MB di memoria.
Tuttavia, prima di scalare un'applicazione a questi livelli, è importante comprendere i limiti definiti per proteggere il proprio account e i carichi di lavoro degli altri clienti. I Service Quotas sono presenti in tutti i servizi AWS e sono costituiti da limiti rigidi, che non è possibile modificare, e limiti flessibili, per i quali è possibile richiedere aumenti. Per impostazione predefinita, a tutti i nuovi account viene assegnato un profilo di quota che consente l'esplorazione dei servizi.
Per visualizzare le quote applicabili al tuo account, vai al pannello di controllo di Service Quotas
Le seguenti sezioni elencano le quote e i limiti predefiniti in Lambda per categoria.
Argomenti
Calcolo e archiviazione
Lambda imposta le quote per la quantità di risorse di calcolo e storage che è possibile utilizzare per eseguire e archiviare le funzioni. Le quote per le esecuzioni e l'archiviazione simultanee sono applicate in base alla Regione AWS. Le quote dell'interfaccia di rete elastica (ENI) sono applicate in base al cloud privato virtuale (VPC), indipendentemente dalla regione. Le seguenti quote possono essere aumentate rispetto ai relativi valori predefiniti. Per ulteriori informazioni, consulta Richiesta di un aumento delle quote nella Guida per l'utente di Service Quotas.
| Risorsa | Quota predefinita | Può essere aumentato fino a |
|---|---|---|
|
Esecuzioni simultanee |
1.000 |
Decine di migliaia |
|
Storage per funzioni caricate (archivi di file .zip) e livelli. Ogni versione di funzione e di livello consuma spazio di storage. Per le best practice da seguire per la gestione dell'archiviazione del codice, consulta Monitoraggio dell'archiviazione del codice Lambda |
75 GB |
Terabyte |
|
Storage per le funzioni definite come immagini di container. Queste immagini sono memorizzate in Amazon ECR. |
Consulta Service Quotas di Amazon ECR. |
|
|
Interfacce di rete elastiche per Virtual Private Cloud (VPC) NotaQuesta quota è condivisa con altri servizi, ad esempio, Amazon Elastic File System (Amazon EFS). Consulta Quote Amazon VPC. |
500 |
Migliaia |
Per ulteriori informazioni sulla simultaneità e su come Lambda ridimensiona la simultaneità della funzione in risposta al traffico, consulta Informazioni sulla scalabilità della funzione Lambda.
Configurazione, implementazione ed esecuzione della funzione
Le seguenti quote si applicano alla configurazione, all'implementazione e all'esecuzione della funzione. Fatto salvo per quanto indicato, non possono essere modificate.
Nota
La documentazione Lambda, i messaggi di log e la console utilizzano l'abbreviazione MB (anziché MiB) per fare riferimento a 1.024 KB.
| Risorsa | Quota |
|---|---|
|
Allocazione di memoria della funzione |
Da 128 MB a 10.240 MB, in incrementi di 1 MB. Nota: Lambda alloca la potenza della CPU in proporzione alla quantità di memoria configurata. È possibile aumentare o diminuire la memoria e la potenza della CPU assegnate alla funzione utilizzando l'impostazione Memory (MB). A 1.769 MB, una funzione ha l'equivalente di una vCPU. |
|
Timeout della funzione. |
900 secondi (15 minuti) |
|
Variabili di ambiente della funzione |
4 KB, per tutte le variabili di ambiente associate alla funzione, in forma aggregata |
|
Policy basata sulle risorse della funzione |
20 KB |
|
Livelli della funzione |
5 livelli |
|
Limite di dimensionamento della simultaneità delle funzioni |
Per ogni funzione, 1.000 ambienti di esecuzione ogni 10 secondi |
|
Payload dell'invocazione (richiesta e risposta) |
6 MB ciascuno per richiesta e risposta (sincrono) 200 MB per ciascuna risposta trasmessa (sincrona) 1 MB (asincrono) 1 MB per la dimensione totale combinata dei valori della riga di richiesta e dell'intestazione |
|
Larghezza di banda per le risposte in streaming |
Senza limite per i primi 6 MB di risposta della funzione Per risposte superiori a 6 MB, 2 MB/s per il resto della risposta |
|
Dimensioni del pacchetto di implementazione (archivio di file .zip) |
50 MB (compressi, se caricato tramite l'API Lambda o gli SDK). Carica file di dimensioni maggiori con Amazon S3. 50 MB (se caricati tramite la console Lambda) 250 MB La dimensione massima del contenuto di un pacchetto di implementazione, inclusi livelli e runtime personalizzati (decompresso). |
|
Impostazioni dell'immagine di container |
16 KB |
|
Dimensione del pacchetto del codice dell'immagine di container |
10 GB (dimensione massima dell'immagine non compressa, inclusi tutti i livelli) |
|
Eventi di test (editor della console) |
10 |
|
|
Compreso tra 512 MB e 10.240 MB in incrementi di 1 MB |
|
Descrittori di file |
1,024 |
|
Processi/thread dell'esecuzione |
1,024 |
Richieste API Lambda
Le seguenti quote sono associate alle richieste API Lambda.
| Risorsa | Quota |
|---|---|
|
Richieste di chiamata per funzione per regione (sincrona) |
Ogni istanza del tuo ambiente di esecuzione può gestire fino a 10 richieste al secondo. In altre parole, il limite totale di chiamate è 10 volte il limite di simultaneità. Per informazioni, consulta Informazioni sulla scalabilità della funzione Lambda. |
|
Richieste di chiamata per funzione per regione (asincrona) |
Ogni istanza del tuo ambiente di esecuzione può soddisfare un numero illimitato di richieste. In altre parole, il limite totale di chiamate si basa solo sulla simultaneità disponibile per la funzione. Per informazioni, consulta Informazioni sulla scalabilità della funzione Lambda. |
|
Richieste di invocazione per versione di funzione o alias (richieste al secondo) |
10 x simultaneità fornita allocata NotaQuesta quota si applica solo alle funzioni che utilizzano la simultaneità fornita. |
|
Richieste API GetFunction |
100 richieste al secondo. Non può essere aumentato. |
|
Richieste API GetPolicy |
15 richieste al secondo. Non può essere aumentato. |
|
Promemoria delle richieste API del piano di controllo (escluse le richieste di invocazione, GetFunction e GetPolicy) |
15 richieste al secondo per tutte le API (non 15 richieste al secondo per API). Non può essere aumentato. |
Altri servizi
Quote per altri servizi, come AWS Identity and Access Management( IAM), Amazon CloudFront (Lambda@Edge) e Amazon Virtual Private Cloud (Amazon VPC), possono influire sulle funzioni di Lambda. Per ulteriori informazioni, consulta la pagina Servizio AWS quotas nella Riferimenti generali di Amazon Web Services e la pagina Richiamare Lambda con eventi di altri servizi AWS.
Molte applicazioni che coinvolgono Lambda utilizzano più AWS servizi. Poiché servizi diversi hanno quote diverse per diverse funzionalità, può essere difficile gestire queste quote nell'intera applicazione. Ad esempio, API Gateway ha un limite di simultaneità predefinito di 10.000 richieste al secondo, mentre Lambda ha un limite di simultaneità predefinito di 1.000. A causa di questa mancata corrispondenza, è possibile che Lambda sia in grado di gestire un numero maggiore di richieste in arrivo da API Gateway. Questo problema può essere risolto richiedendo l'innalzamento del limite di simultaneità Lambda in modo che corrisponda al livello di traffico previsto.
Il test di carico dell'applicazione serverless consente inoltre di monitorare le prestazioni di un'applicazione prima che venga implementata in produzione. Durante un test di carico, è possibile identificare eventuali quote che possono fungere da fattore limitante per i livelli di traffico previsti e agire di conseguenza.