Lambda-Kontingente - AWS Lambda

Lambda-Kontingente

Wichtig

Neue AWS-Konten haben reduzierte Parallelität und Speicherkontingente. AWS erhöht diese Kontingente automatisch auf der Grundlage Ihrer Nutzung.

AWS Lambda ist so konzipiert, dass es schnell skaliert werden kann, um den Bedarf zu decken, sodass Ihre Funktionen skaliert werden können, um den Datenverkehr in Ihrer Anwendung zu bedienen. Lambda ist für kurzlebige Rechenaufgaben konzipiert, die den Status zwischen Aufrufen nicht beibehalten oder nicht darauf angewiesen sind. Code kann in einem einzigen Aufruf bis zu 15 Minuten lang ausgeführt werden und eine einzelne Funktion kann bis zu 10 240 MB Speicher beanspruchen.

Es ist wichtig, die Schutzmaßnahmen zu verstehen, die zum Schutz Ihres Kontos und der Workloads anderer Kunden eingerichtet wurden. Service Quotas gibt es in allen AWS-Services und bestehen aus festen Grenzwerten, die Sie nicht ändern können, und weichen Grenzwerten, für die Sie Erhöhungen beantragen können. Standardmäßig wird allen neuen Konten ein Kontingentprofil zugewiesen, das die Erkundung der AWS-Services ermöglicht.

Um die Kontingente zu sehen, die für Ihr Konto gelten, navigieren Sie zum Service-Quotas-Dashboard. Hier können Sie Service Quotas anzeigen, eine Erhöhung des Service-Kontingents anfordern und die aktuelle Auslastung anzeigen. Von hier aus können Sie einen bestimmten AWS-Dienst, z. B. Lambda, aufschlüsseln:

Anwendungsdesign, Abbildung 1

In folgenden Abschnitten sind Standardkontingente und Grenzwerte in Lambda nach Kategorien aufgeführt.

Datenverarbeitung und Speicherung

Lambda legt Kontingente für die Menge an Datenverarbeitung und Speicherressourcen, die Sie verwenden können, um Funktionen auszuführen und zu speichern. Kontingente für gleichzeitige Ausführungen und Speicherung gelten pro AWS-Region. Die Elastic-Network-Schnittstelle (ENI)-Kontingente gelten für jede Virtual Private Cloud (VPC), unabhängig von der Region. Die folgenden Kontingente können gegenüber ihren Standardwerten erhöht werden. Weitere Informationen finden Sie unter Beantragen einer Kontingenterhöhung im Service-Quotas-Benutzerhandbuch.

Ressource Standardkontingent Kann erhöht werden bis zu

Gleichzeitige Ausführungen

1.000

Zehntausende

Speicher für hochgeladene Funktionen (.zip-Datei-Archive) und Ebenen. Jede Funktionsversion und Ebenenversion verbraucht Speicher.

Bewährte Methoden für die Verwaltung Ihres Codespeichers finden Sie bei Serverless Land unter Monitoring Lambda code storage.

75 GB

Terabytes

Speicher für als Container-Images definierten Funktionen Diese Bilder werden in Amazon ECR gespeichert.

Siehe Amazon-ECR-Servicekontingente.

Elastic Network-Schnittstellen in der Virtual Private Cloud (VPC)

Anmerkung

Dieses Kontingent wird mit anderen Services wie Amazon Elastic File System (Amazon EFS) geteilt. Siehe Amazon-VPC-Kontingente.

500

Tausende

Weitere Details zur Gleichzeitigkeit und zur datenverkehrbasierten Skalierung der Funktionsgleichzeitigkeit von Lambda finden Sie unter Verstehen der Skalierung von Lambda-Funktionen.

Funktionskonfiguration, -bereitstellung und -ausführung

Die folgenden Kontingente gelten für die Konfiguration, Bereitstellung und Ausführung von Funktionen. Sofern nicht anders angegeben, können sie nicht geändert werden.

Anmerkung

Die Lambda-Dokumentation, die Protokollmeldungen und die Konsole verwenden die Abkürzung MB (anstelle von MiB), um auf 1 024 KB zu verweisen.

Ressource Quota

Funktion Speicherzuweisung

128 MB bis 10.240 MB (in Schritten von 1 MB).

Hinweis: Lambda weist die CPU-Leistung proportional zur Menge des konfigurierten Arbeitsspeichers zu. Sie können den Arbeitsspeicher und die CPU-Leistung, die Ihrer Funktion zugewiesen sind, mit der Einstellung Arbeitsspeicher (MB) erhöhen oder verringern. Bei 1 769 MB hat eine Funktion das Äquivalent von einer vCPU.

Funktion Zeitüberschreitung

900 Sekunden (15 Minuten)

Funktion Umgebungsvariablen

4 KB, für alle Umgebungsvariablen, die mit der Funktion verknüpft sind, im Aggregat

Funktion ressourcenbasierte Richtlinie

20 KB

Funktionsebenen

5 Ebenen

Funktion – Limit für Gleichzeitigkeitsskalierung

Für jede Funktion 1 000 Ausführungsumgebungen alle 10 Sekunden

Aufrufnutzlast (Anfrage und Antwort)

Jeweils 6 MB für Anfrage und Antwort (synchron)

Jeweils 200 MB für jede gestreamte Antwort (synchron)

1 MB (asynchron)

1 MB für die kombinierte Gesamtgröße von Anforderungszeile und Kopfdaten

Bandbreite für gestreamte Antworten

Unbegrenzt für die ersten 6 MB der Antwort Ihrer Funktion

Für Antworten, die größer als 6 MB sind, 2 Mbit/s für den Rest der Antwort

Größe des Bereitstellungspakets (ZIP-Dateiarchiv)

50 MB (gezippt, wenn sie über die Lambda-API oder SDKs hochgeladen werden). Laden Sie größere Dateien mit Amazon S3 hoch.

50 MB (beim Hochladen über die Lambda-Konsole)

250 MB Die maximale Größe des Inhalts eines Bereitstellungspakets, einschließlich Ebenen und benutzerdefinierter Laufzeiten. (ungezippt)

Größe der Container-Image-Einstellungen

16 KB

Codepaketgröße des Container-Images

10 GB (maximale unkomprimierte Image-Größe, einschließlich aller Ebenen)

Testereignisse (Konsoleneditor)

10

/tmp-Verzeichnisspeicher

Zwischen 512 MB und 10 240 MB, in 1-MB-Schritten.

Dateibeschreibungen

1,024

Ausführungsprozesse/-Threads

1,024

Lambda-API-Anforderungen

Die folgenden Kontingente sind Lambda-API-Anfragen zugeordnet.

Ressource Kontingent

Aufrufanfragen pro Funktion pro Region (synchron)

Jede Instance Ihrer Ausführungsumgebung kann bis zu 10 Anfragen pro Sekunde bearbeiten. Mit anderen Worten, das Gesamtaufruflimit beträgt das 10-fache Ihres Gleichzeitigkeitslimits. Siehe Verstehen der Skalierung von Lambda-Funktionen.

Aufrufanfragen pro Funktion pro Region (asynchron)

Jede Instance Ihrer Ausführungsumgebung kann eine unbegrenzte Anzahl an Anfragen bearbeiten. Mit anderen Worten, das Gesamtlimit für Aufrufe basiert nur auf der für Ihre Funktion verfügbaren Gleichzeitigkeit. Siehe Verstehen der Skalierung von Lambda-Funktionen.

Aufrufanforderungen pro Funktionsversion oder Alias (Anfragen pro Sekunde)

10 x zugewiesene Provisioned Concurrency

Anmerkung

Dieses Kontingent gilt nur für Funktionen, die Provisioned Concurrency verwenden.

GetFunction-API-Anforderungen

100 Anforderungen pro Sekunde. Kann nicht erhöht werden.

GetPolicy-API-Anforderungen

15 Anforderungen pro Sekunde. Kann nicht erhöht werden.

Rest der API-Anforderungen der Steuerungsebene (ausgenommen Aufruf-, GetFunction- und GetPolicy-Anforderungen)

15 Anforderungen pro Sekunde über alle APIs (nicht 15 Anforderungen pro Sekunde pro API). Kann nicht erhöht werden.

Sonstige Services

Kontingente für andere Services wie AWS Identity and Access Management (IAM), Amazon CloudFront (Lambda@Edge) und Amazon Virtual Private Cloud (Amazon VPC) können sich auf Ihre Lambda-Funktionen auswirken. Weitere Informationen finden Sie unter AWS-Service-Kontingent im Allgemeine Amazon Web Services-Referenz und Lambda mit Ereignissen aus anderen AWS-Diensten aufrufen.

Viele Anwendungen, an denen Lambda beteiligt ist, verwenden mehrere AWS-Services. Da verschiedene Services unterschiedliche Kontingente für verschiedene Funktionen haben, kann es schwierig sein, diese Kontingente für Ihre gesamte Anwendung zu verwalten. API Gateway hat z. B. eine standardmäßige Drosselungsgrenze von 10.000 Anforderungen pro Sekunde, während Lambda eine standardmäßige Gleichzeitigkeitsbeschränkung von 1.000 Anforderungen pro Sekunde hat. Aufgrund dieser Diskrepanz ist es möglich, dass mehr eingehende Anfragen von API Gateway eingehen, als Lambda verarbeiten kann. Sie können dies beheben, indem Sie eine Erhöhung der Lambda-Gleichzeitigkeitsbeschränkung auf das erwartete Datenverkehrsaufkommen beantragen.

Durch Auslastungstests Ihrer Anwendung können Sie auch die Leistung einer Anwendung von Ende zu Ende überwachen, bevor sie in der Produktion eingesetzt wird. Während eines Lasttests können Sie alle Kontingente ermitteln, die einen begrenzenden Faktor für das erwartete Verkehrsaufkommen darstellen und entsprechende Maßnahmen ergreifen.