View a markdown version of this page

Versionshinweise zu Elastic Fabric Adapter - Amazon Elastic Compute Cloud

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Versionshinweise zu Elastic Fabric Adapter

In der folgenden Tabelle werden der Versionsverlauf und das Änderungsprotokoll für die Elastic-Fabric-Adapter-Software beschrieben.

Version Änderungen Datum der Veröffentlichung
1,48,0
  • Führen Sie ein Upgrade auf libfabric 2.4.0amzn3.0 durch

    • Optimieren Sie den Abruf von SHM-Adressen bei RDM-Vorgängen

    • Behebt Fehler bei der Fertigstellung von DC-Paketen, beim CQ-Drain, beim AH-Unit-Test und bei der MR-Protokollierung

    • Die Rennbedingungen in efa_rdm_ep_get_peer und beim Sperren von QP wurden behoben

    • Korrigiert uninitialisierte Deskriptor-Arrays, die einen Segfault verursachen, mit FI_EFA_ENABLE_SHM_TRANSFER=0

    • Behebt Speicherlecks bei fi_info, err_buf, bei der Zerstörung von EFA-Geräten und bei Unit-Tests

    • Fügen Sie beim CQ-Polling eine Nullprüfung für base_ep hinzu, um zerstörte QPs zu behandeln

    • Setze qp->base_ep in efa_qp_create und gib einen Fehler zurück, wenn efa_mr_reg_ibv_mr NULL zurückgibt

    • Verschieben Sie die QP-Tabelle mit Sperren auf Geräteebene von der Domäne auf das Gerät

    • Fügen Sie die QP-Generierung zur direkten Anforderungs-ID des Datenpfads hinzu und überprüfen Sie die QP-Nummer auf CQE

    • Beenden Sie die Einstellung qp->ibv_qp_ex->wr_id für den direkten Datenpfad

    • Entferne txe korrekt aus der longcts_send-Liste, wenn der Empfangseingang abgeschlossen ist

    • Refaktorieren und bereinigen Sie efa_cq_handle_error

    • Konvertiert MR-Registrierungszähler in atomare Operationen

    • Migrieren Sie den Shm-MR-Registrierungscode und führen Sie die interne MR-Regv-Funktion ein

    • Deaktivieren Sie den MR-Cache standardmäßig unter ASAN

    • Deaktivieren Sie zcpy_rx nur, wenn P2P nicht verfügbar ist, aber FI_HMEM angefordert wird

    • Verfolge den TX-PKT-Pool nicht für Builds, die nicht zum Debuggen verwendet werden

    • Verbessern Sie die Wait_Send-Prozedur und die Mock-Funktionen

    • Passen Sie die Log-Levels für efa-direct CQ err_data und efa_show_help an

    • Definieren Sie Sanitizer-Makros und deaktivieren Sie Memhooks unter ASAN

    • Fügen Sie Komponententests für ep hinzu, aktivieren Sie den Fehlerpfad und die Behandlung von Fehlern

  • Führen Sie ein Upgrade auf libnccl-ofi 1.19.0 durch

    • Es wurde ein Fehler beim Umgang mit DMA-Buf-Handles behoben, die durch die DMA-Buf-Unterstützungserkennung bei der Verwendung der HSA-Runtime auf ROCM-Plattformen erstellt wurden, ROCm/HSA und es wurde ein Fehler hinzugefügt

    • Mögliche Speicherlecks wurden behoben

    • Die NCCL-Topologiegenerierung für GB200 in Docker-Containern wurde behoben, bei der NUMA-Knoten, die von Paketknoten getrennt wurden, zu einer falschen Topologiegenerierung führten

    • Reduzierte QP-Auslastung auf NIC 0 während der Initialisierung

    • Verbesserte Auswahl des Tuner-Algorithmus für P6-B200 Instanztypen und Instanztypen P6-B300

  • Support für die Installation von libnccl-ofi auf NGC-Containern

  • Unterstützung für die Überprüfung einzelner Paketsignaturen hinzufügen RPM/DEB

  • Unterstützung für RHEL 10 hinzufügen

  • Fügen Sie das OFI NCCL-Plugin auf Debian 12 und RHEL 10 hinzu

14. April 2026
1.47.0
  • Führen Sie ein Upgrade auf libfabric 2.4.0amzn1.0 durch

    • Refaktorieren Sie das Peer-Management: Verschieben Sie die Endpunkt→Peer-Hashmap auf AV-Ebene

    • Fügen Sie einen Zähler zur Generierung von Paketeinträgen hinzu, um ABA-Probleme zu vermeiden

    • Implementieren Sie blockierende CQ-Leseunterstützung (fi_cq_sread) mit Wait-Objekten

    • Problem mit Double-Free bei der RTM-Paketverarbeitung in /longread behoben eager/mulreq

    • Korrigieren Sie die IBV-Zugriffsflags für die MR-Registrierung, die auf den RDMA-Funktionen des Geräts basieren

    • Deaktiviert FI_OPT_EFA_SENDRECV_IN_ORDER_ALIGNED_128_BYTES (gibt -FI_EOPNOTSUPP zurück)

    • Optimieren Sie die Paketeingabe so, dass sie in zwei x86-Cache-Zeilen (128 Byte) passt

    • Führen Sie bei Fehlern immer efa_rdm_srx_start und slide recv window aus RTM/RTA

    • Trennen Sie während der Endpunktbereinigung die Verknüpfung von RX-Paketeinträgen vor der Freigabe

  • Führen Sie ein Upgrade auf libnccl-ofi 1.18.0 durch

    • P6-B300 Unterstützung: Es wurden benutzerdefinierte Tuner-Entscheidungen hinzugefügt für P6-B300

    • Die Leistung von PAT on P6-B200 wurde verbessert, indem die Anzahl der Kanäle für kleinere Nachrichtengrößen reduziert wurde

    • Die Protokollstandardwerte wurden geändert, standardmäßig das RDMA-Protokoll auf Trn1 und das SENDRECV-Protokoll auf g7e.8xlarge

    • Dynamische Plattformauswahl: Funktion hinzugefügt, um Optimierungen zur Laufzeit auf der Grundlage des Vorhandenseins von NICs zu ermöglichen. AWS AWS Dadurch kann eine einzelne Plugin-Binärdatei sowohl für Plattformen als auch für andere AWS Plattformen verwendet werden.AWS AWS Optimierungen können während der Kompilierung immer noch deaktiviert werden.

    • Die Unterstützung für Nicht-FI_MR_Virt_ADDR-Anbieter im RDMA-Protokoll wurde behoben

    • Verbesserte Berichterstattung über Geschwindigkeit und Breite der NIC-PCIe-Verbindung an NCCL

    • Überarbeitetes Threading-Modell zur Unterstützung von Multithread-Anwendungen, ohne dass für jeden Thread eine separate Libfabric-Domain erforderlich ist.

    • Die Unterstützung für FI_MR_ENDPOINT-Anbieter (unterstützt nur das SENDRECV-Protokoll) wurde behoben, indem Ressourcen in der richtigen Reihenfolge bereinigt wurden

  • Führen Sie ein Upgrade auf RDMA-Core 61.0 durch

    • Verwenden Sie Single-Thread-CQ, wenn die Thread-Domäne bereitgestellt wurde

    • Überprüfen Sie die QP-Nummer für CQE-Prozesse

  • Führen Sie ein Upgrade auf den EFA-Treiber 3.0.0 durch

    • Verbessern Sie die Fehlerbehandlung durch den Administrator

    • Prüfen Sie bei Abschluss der Umfrage, ob die QP-Nummer korrekt ist

    • Entfernen Sie die bedingungslose Rückportierung der Suche nach der besten Seitengröße

    • Druckt Errno-Zeichenketten für Fehlerzeiger

    • Vereinfachen Sie den Code in den CQ-Erstellungsabläufen

    • Upstream-Änderungen in CQ mit dem Umem-Erstellungsablauf zurückportieren

    • Passen Sie die DKMS-Konfiguration für neue DKMS-Versionen an

  • Führen Sie ein Upgrade auf Open MPI 5.0.9amzn1 durch

    • Bugfix: Legt das Domain-Threading-Level basierend auf der MPI-Thread-Unterstützung fest

    • Bugfix: Fordere das Flag FI_COMPLETION an, um sicherzustellen, dass Vervollständigungen für alle Datenübertragungsereignisse generiert werden

    • Teilen Sie Domänen zwischen BTL und MTL, um die Gesamtzahl der Domänen zu reduzieren, die erstellt wurden, um die Ressourcenerschöpfung auf Systemen mit einer hohen Anzahl von Kernen zu beheben

29. Januar 2026
1.46.0
  • Support für Debian 13 hinzugefügt

  • Führen Sie ein Upgrade auf efa-nv-peermem 1.2.3 durch

    • Korrigiert Build-Fehler und Warnungen mit neuen Kerneln und DKMS

  • Führen Sie ein Upgrade auf libfabric 2.3.1amzn4.0 durch

    • Aktivieren Sie den direkten Datenpfad für den efa-rdm-Protokollpfad

    • Aktivieren Sie die RoCR-HMEM-Unterstützung

    • Neue Option FI_OPT_EFA_USE_UNSOLICITED_WRITE_RECV zur Deaktivierung unaufgeforderter Schreibzugriffe

    • Optimieren Sie die Zeit für den Verbindungsaufbau

  • Fügen Sie libnccl-ofi auf RHEL 9, Rocky Linux 9 und Debian 13 hinzu

12. Dezember 2025
1.45.1
  • Führen Sie ein Upgrade auf libfabric 2.3.1amzn3.0 durch

    • Es wurde ein Fehler behoben, durch den cq_data auf 2 Byte gekürzt wurde, obwohl der Anbieter die Unterstützung für 4 Byte angekündigt hatte

26. November 2025
1.45.0
  • Führen Sie ein Upgrade auf rdma-core 60.amzn0 durch

    • Erweitern Sie die DV-Abfrage CQ, um die Türklingel zurückzugeben

  • Führen Sie ein Upgrade auf libfabric 2.3.1amzn2.0 durch

    • Support den FI_RX_CQ_DATA-Modus für efa-direct

    • Optimieren Sie den WQE-Post-in-Datenpfad (direkter Pfad)

    • Korrigieren Sie die Rennbedingung im laufenden Modus

    • Verbessern Sie die Protokollierung von Warnmeldungen

    • Verarbeitet den RMA-Abschluss für entfernte Peers korrekt

    • Entfernt AH-Einträge aus dem impliziten AV, wenn das AH-Limit erreicht ist

  • Führen Sie ein Upgrade auf libnccl-ofi 1.17.2 durch

    • Es wurde ein Absturz mit NCCL v2.28.x behoben, bei dem die Libfabric-Initialisierung fehlschlug

    • Unterstützung für die G7E-Instance-Familie hinzugefügt

    • Es wurde ein Problem behoben, bei dem NCCL fälschlicherweise versuchen konnte, einen GPUDirect-RDMA-Pfad auf Plattformen zu verwenden, die dies unterstützen DMA-BUF

    • Das Problem mit der Reihenfolge beim Herunterfahren auf NICs, die eine Speicherregistrierung pro Endpunkt erfordern, wurde behoben (Cray Slingshot)

17. November 2025
1,44,0
  • Upgrade auf rdma-core 59.amzn0

    • Unterstützung hinzufügen, um QPs und CQs an Thread-Domains zu binden

    • Unterstützung für die Zuweisung einer übergeordneten Domain hinzufügen

    • Unterstützung für die Zuweisung von Thread-Domains hinzufügen

    • Direkte Verbanfragen zu QP und CQ hinzufügen

    • Option zum Erstellen von CQ mit externem Arbeitsspeicher hinzufügen

    • CQ-Umfrage nach der QP-Zerstörung korrigieren

  • Upgrade auf libfabric 2.3.1amzn1.0

  • Upgrade auf Open MPI 5.0.8amzn1

    • Funktionserweiterungen

    • Fehlerbehebungen

  • Upgrade auf libnccl-ofi 1.17.1

    • Unterstützt NCCL v2.28.3-1 unter Beibehaltung der Abwärtskompatibilität mit NCCL v2.17.1 und höher.

    • Für das Entwickeln mit platform-aws ist Libfabric v1.22.0amzn4.0 oder höher erforderlich. Wurde mit Versionen bis Libfabric v2.3.1amzn1.0 getestet.

    • Korrekturen zur Unterstützung der Kompatibilität zwischen CUDA12 und CUDA13.

29. Oktober 2025
1.43.3
  • Upgrade auf EFA-Treiber 2.17.3

    • P2P mit NVIDIA-580-Treibern unterstützen

    • Die MR-Registrierung für 6.17 und auf Kernels anpassen

1. Oktober 2025
1.43,2
  • Upgrade auf libnccl-ofi 1.16.3

    • Unterstützt NCCL v2.27.7-1 unter Beibehaltung der Abwärtskompatibilität mit NCCL v2.17.1 und höher.

    • Für das Entwickeln mit platform-aws ist Libfabric v1.22.0amzn4.0 oder höher erforderlich. Wurde mit Versionen bis Libfabric v2.1.0amzn5.0 getestet.

    • Aktivieren Sie standardmäßig Domain-pro-Thread auf allen Amazon-EC2-Instance-Typen, um die Leistung einiger Anwendungen zu verbessern, bei denen NCCL mehrere Proxy-Threads erstellt

15. August 2025
1.43,1
  • Upgrade auf libnccl-ofi 1.16.2

    • Unterstützt NCCL v2.27.6-1 unter Beibehaltung der Abwärtskompatibilität mit NCCL v2.17.1 und höher.

    • Für das Entwickeln mit platform-aws ist Libfabric v1.22.0amzn4.0 oder höher erforderlich. Wurde mit Versionen bis Libfabric v2.1.0amzn4.0 getestet.

    • Es wurde eine neue Plattformkonfiguration hinzugefügt, um die Verwendung des OFI-NCCL-Plug-Ins auf dem Instance-Typ p5.4xlarge von Amazon EC2 zu unterstützen

  • Upgrade auf libfabric 2.1.0amzn5.0

31. Juli 2025
1.43,0
  • Upgrade auf libnccl-ofi 1.16.1

    • Unterstützt NCCL v2.27.6-1 unter Beibehaltung der Abwärtskompatibilität mit NCCL v2.17.1 und höher.

    • Für das Entwickeln mit platform-aws ist Libfabric v1.22.0amzn4.0 oder höher erforderlich. Wurde mit Versionen bis Libfabric 2.1.0amzn3 getestet.

    • Aktualisieren Sie das in der Topologiedatei angegebene PCI-Link-Speed-Format, sodass es mit Kernel 5.7+ übereinstimmt

    • SKIP_NICS_WITHOUT_ACCEL_AT_SAME_PCI_LEVEL wurde hinzugefügt, um libfabric-NICs zu überspringen, die keinen Beschleuniger auf derselben PCI-Ebene haben

  • Upgrade auf EFA-Treiber 2.17.2

  • Upgrade auf efa-nv-peermem 1.2.2

  • Upgrade auf libfabric 2.1.0amzn4.0

  • Upgrade auf rdma-core 58.amzn0

    • Doppelte Verwendung des Arbeitsanforderungsindexes behoben

    • WQE-Länge zum Nachverfolgungspunkt post_send hinzufügen

  • Optimierungen für Graviton-Plattformen ermöglichen

  • Außerbetriebnahme der Unterstützung für Ubuntu 20.04

25 Juli 2025
1.42.0
  • Upgrade auf EFA-Treiber 2.15.3

  • Upgrade auf efa-nv-peermem 1.2.1

  • Upgrade auf rdma-core 57.amzn1

    • Doppelte Verwendung des Arbeitsanforderungsindexes behoben

  • Upgrade auf libfabric 2.1.0amzn3.0

  • Upgrade auf libnccl-ofi 1.15.0

    • Unterstützt NCCL v2.26.6-1 unter Beibehaltung der Abwärtskompatibilität mit NCCL v2.17.1 und höher.

    • Für das Entwickeln mit platform-aws ist Libfabric v1.22.0amzn4.0 oder höher erforderlich. Wurde mit Versionen bis Libfabric 2.1.0amzn3 getestet.

    • Build-System- und Plattformunterstützung

      • Unterstützung für die Amazon P6-B200 EC2-Plattform hinzugefügt

      • Der Standardname der Plugin-Bibliothek wurde in libnccl-net-ofi.so geändert und standardmäßig ein Symlink von libnccl-net-ofi.so zu libnccl-net.so erstellt, um die Abwärtskompatibilität aufrechtzuerhalten. Dadurch können Benutzer NCCL_NET_PLUGIN=ofi setzen, um NCCL zu zwingen, das OFI-Plug-In für die Kommunikation zu verwenden. Wenn Sie --disable-nccl-net-symlink zur Konfiguration angeben, wird der Symlink übersprungen, sodass mehrere Plugins im selben Container installiert werden können.

    • Tuning- und Leistungsverbesserungen

      • Tuner-Unterstützung P6-B200 für AllReduce, und ReduceScatter Regionen für 0x0 AllGather - und 0x7-Bitmasken hinzugefügt

      • Die Standardlatenz für P5en und P6-B200 Plattformen wurde auf der Grundlage empirischer Ergebnisse und Analysen aktualisiert

    • Aktualisierung zur Verwendung der NCCL-v10-API mit TrafficClass-Parameterunterstützung für die zukünftige Priorisierung des Datenverkehrs

    • Die Plugin-Codebasis wurde von C nach C++ migriert

    • Unterstützung für Aufträge hinzugefügt, bei denen die Anzahl der NICs pro GPU von System zu System unterschiedlich ist. Weitere Informationen finden Sie in der Dokumentation zur Laufzeitumgebungsvariablen OFI_NCCL_FORCE_NUM_RAILS.

6. Juni 2025
1.41.0
  • Upgrade auf rdma-core 57.amzn0

16. Mai 2025
1.40.0
  • Upgrade auf libfabric 2.1.0amzn2.0

  • Upgrade auf rdma-core 56.0

  • Upgrade auf efa-config 1.18

  • Außerbetriebnahme der Unterstützung für Debian 10

  • Upgrade auf libnccl-ofi 1.14.2

  • CUDA-Unterstützung in Libfabric in ARM für Ubuntu und Amazon Linux 2023 aktivieren

  • libnccl-ofi in ARM für Ubuntu und Amazon Linux 2023 hinzufügen

2. Mai 2025
1.39.0
  • Upgrade auf libfabric 2.1.0

  • Upgrade auf Open MPI 5.0.6

  • Upgrade auf libnccl-ofi 1.14.1

  • Upgrade auf EFA-Treiber 2.15.0

16. April 2025
1,38,1
  • Auf Libfabric 1.22.0amzn5.0 aktualisieren

03. März 2025
1,38,0
  • Add libnccl-ofi 1.13.2-1

8. Januar 2025
1.37.0
  • Aktualisieren auf libfabric 1.22.0amzn4.0

  • Aktualisieren auf rdma-core 54.amzn0

18. November 2024
1.36.0
  • Unterstützung für Debian 12 hinzufügen

  • efa_test.sh als Hilfsprogramm-Skript unter /opt/amazon/efa/bin verteilen

  • Upgrade auf EFA-Treiber 2.13.0

  • Aktualisieren auf libfabric 1.22.0amzn3.0

  • Aktualisieren auf rdma-core 54.0

  • Upgrade auf Open MPI 4.1.7

7. November 2024
1.35.0
  • Upgrade auf Open MPI 5.0.5

  • Upgrade auf PRRTE 3.0.6 und Umbenennung des RPM-Pakets in prrte-aws

  • Umbenennung des OpenPMIx-RPM-Pakets in pmix-aws

  • Build-Optionen für dpkg- und RPM-Builds konfigurieren

  • Aktualisieren auf Libfabric 1.22.0amzn2.0

  • Upgrade auf EFA-Treiber 2.12.1

14. Oktober 2024
1,34,0
  • Unterstützung für CentOS 7 und RHEL 7 einstellen

  • Libfabric 1.22.0amzn1.0 erfassen

  • Das Paket efa-config auf Version 1.17 aktualisieren

6. August 2024
1,33,0
  • Upgrade auf EFA-Treiber 2.10.0

  • Aktualisieren auf rdma-core 52.0

  • Upgrade auf PRRTE 3.0.5

  • Upgrade auf Open MPI 5.0.3

  • Unterstützung für Ubuntu 24.04 LTS hinzufügen

  • Dokumentation für OpenPMIx, PRRTE und Open MPI HTML entfernen Benutzer sollten sich auf die offizielle Website beziehen.

  • Unterstützung für openSUSE 15.4 oder älter einstellen

20. Juni 2024
1.32.0
  • Upgrade auf EFA-Treiber 2.8.0

  • Upgrade auf efa-nv-peermem-Treiber 1.1.1

  • Upgrade auf efa-config-Paket 1.16

  • Upgrade auf efa-profile-Paket 1.7

  • Aktualisieren auf rdma-core 50.0

  • Aktualisieren auf libfabric 1.21.0amzn1.0

  • efa_test.sh durch die Portauswahl fi_pingpong erweitern

  • Bei Bedarf einen neueren rdma-core vom System installieren

18. April 2024
1.31.0
  • Upgrade auf OpenPMIx 4.2.8

  • Upgrade auf PRRTE 3.0.3

  • Führen Sie ein Upgrade auf Open MPI 5.0.2 durch und konvertieren Sie die MCA-Komponenten in DSO.

  • Aktualisieren auf Libfabric 1.20.1amzn1.0

7. März 2024
1.30.0
  • OpenPMIx 4.2.7 einschließen, das standardmäßig unter /opt/amazon/pmix installiert ist

  • PRRTE 3.0.2 einschließen, das standardmäßig unter /opt/amazon/prrte installiert ist

  • OpenMPI 5.0.0 einschließen, das standardmäßig unter /opt/amazon/openmpi5 installiert ist

  • efa-profile auf Version 1.6 aktualisieren

Dezember 2023
1.29.1
  • libfabric 1.19.0amzn4.0 erfassen

Dezember 2023
1.29.0
  • EFA-Kernel-Treiber 2.6.0 erfassen

  • libfabric 1.19.0amzn3.0 erfassen

November 2023
1.28.0
  • Upgrade auf Open MPI 4.1.6

  • libfabric 1.19.0amzn2.0 erfassen

Oktober 2023
1.27.0
  • Libfabric 1.19.0amzn1.0 zum Installer hinzufügen

  • GCC-integrierte Atomics für Open MPI 4 ermöglichen

September 2023
1,26,1
  • efa_test.sh: Fehler bei unendlichen Wiederholungsversuchen beheben

September 2023
1.26.0
  • Unterstützung für RHEL 9 hinzufügen

  • Debug-Build auf mehreren Distributionen behoben

  • libfabric 1.18.2amzn1.0 erfassen

  • efa_test.sh: Wiederholungsversuch für fi_pingpong hinzufügen

September 2023
1.25.1
  • libfabric 1.18.1amzn1.0 erfassen

  • Timeouts in EFA-Installationsskripten aktualisieren

September 2023
1.25.0
  • Unterstützung für Amazon Linux 2023 hinzufügen

  • Bugfix beim Test nach der Installation

Juli 2023
1.24.1
  • Upgrade auf libfabric 1.18.1

  • Upgrade auf EFA-Treiber 2.5.0

Juli 2023
1.24.0
  • rdma-core 46.0 erfassen

  • EFA-Treiber 2.4.1 erfassen

  • Unterstützung für Debian 11

Juni 2023
1.23.1
  • libfabric 1.18.0amzn2.0 erfassen

Juni 2023
1.23.0
  • Unterstützung für Debian 10 hinzufügen

  • Unterstützung für Ubuntu 18.04 LTS einstellen

  • Upgrade auf efa-config-Paket 1.14

  • libfabric 1.18.0amzn1.0 erfassen

Mai 2023
1.22.1
  • Upgrade auf libfabric 1.17.1

März 2023
1.22.0
  • Upgrade auf Open MPI 4.1.5

  • Upgrade auf libfabric 1.17.0

  • Upgrade auf efa-config-Paket 1.13

Februar 2023
1.21.0
  • Unterstützung für das Betriebssystem Rocky Linux 9 hinzufügen

  • EFA-Treiber 2.1.1 erfassen

  • libfabric 1.16.1amzn3.0 erfassen

  • Upgrade auf efa-config-Paket 1.12

Dezember 2022
1.20.0
  • Unterstützung für das Betriebssystem Rocky Linux 8 hinzufügen.

  • EFA-Treiber 2.1.0 erfassen

  • rdma-core 43.0 erfassen

  • libfabric 1.16.1amzn1.0 erfassen

November 2022
1.19.0
  • libfabric 1.16.0 erfassen

  • Open MPI mit --enable-orterun-prefix-by-default erstellen

Oktober 2022
1.18.0
  • Unterstützung hinzufügen für Ubuntu22.04

August 2022
1.17.3
  • libfabric auf 1.16.0~amzn4.0 aktualisieren. Das ~ weist darauf hin, dass es sich um eine Vorabversion von libfabric 1.16.0 handelt.

  • Verlängern Sie das Timeout für den Pingpong-Test nach der Installation auf 20 Sekunden.

August 2022
1.17.2
  • libfabric auf 1.16.0~amzn3.0 aktualisieren. Das ~ weist darauf hin, dass es sich um eine Vorabversion von libfabric 1.16.0 handelt.

Juli 2022
1.17.1
  • libfabric auf 1.16.0~amzn2.0 aktualisieren. Das ~ weist darauf hin, dass es sich um eine Vorabversion von libfabric 1.16.0 handelt.

  • Den experimentellen Netzanbieter beim Erstellen von libfabric deaktivieren

Juli 2022
1.17.0
  • rdma-core auf v41.0 aktualisieren

  • Open MPI auf 4.1.4 aktualisieren

  • libfabric auf 1.16.0~amzn1.0 aktualisieren. Das ~ weist darauf hin, dass es sich um eine Vorabversion von libfabric 1.16.0 handelt.

Juli 2022
1.16.0
  • libfabric auf 1.15.1amzn1.0 aktualisieren, enthält eine Änderung des Namens der Neuron-Bibliothek

  • Upgrade auf efa-config 1.10

  • Anbieter opx und rxd im libfabric-Build ausschließen

Juni 2022
1.15.2
  • libfabric auf 1.14.1 aktualisieren

Mai 2022
1.15.1
  • libfabric auf 1.14.0amzn1.0 aktualisieren

März 2022
1.15.0
  • Behebt einen Fehler, der dazu führte, dass die Installation auf Open SuSE 15.3 fehlschlug

  • Unterstützung für Open SuSE 15.2 einstellen (da Open SuSE 15.2 das Ende seiner Lebensdauer erreicht hat)

  • Unterstützung für CentOS 8 einstellen (da CentOS 8 das Ende seiner Lebensdauer erreicht hat)

  • libfabric auf 1.14.0 aktualisieren

  • EFA-Kerneltreibers auf 1.16.0 aktualisieren

  • rdma-core auf v39.0 aktualisieren

  • Aktualisieren Sie Open MPI auf Version 4.1.2.

Februar 2022
1.14.1
  • libfabric auf 1.13.2amzn1.0 aktualisieren.

Oktober 2021
1.14.0
  • EFA-Kernel-Treiber 1.14.2 erfassen

  • Legen Sie -g, --enable-gdr in efa_installer.sh als no-op-Option fest, da der neueste EFA-Kerneltreiber die GDR-Unterstützung standardmäßig aktiviert.

  • rdma-core v37.0 erfassen

  • libfabric 1.13.2 erfassen

  • Fügen Sie während der Installation eine Paketliste hinzu und vergleichen Sie RPM/DEB sie mit der Liste, um unbekannte Paketinstallationen zu verhindern.

  • Fügen Sie dem Installationsskript sleep hinzu, um zu warten, bis die udev-Regel nach dem erneuten Laden des EFA-Treibers angewendet wird.

Oktober 2021
1.13.0
  • Aktualisieren Sie rdma-core auf v35.0.

  • libfabric auf v1.13.0amzn1.0 aktualisieren

  • Fügen Sie EFA-Unterstützung für CentOS/RHEL 8 auf der Gravition2-Plattform hinzu.

  • Fügen Sie dem Installationsskript eine Logik für den Versionsvergleich hinzu, um die lokale Paketinstallation zu überspringen, wenn auf dem System eines mit einer höheren Version installiert ist.

August 2021
1.12.3
  • Aktualisieren Sie das EFA-Kernelmodul auf 1.13.0.

  • Aktualisieren Sie das efa-config-Paket auf Version 1.9. Verbessern Sie die Berechnung großer Seitenreservierungen, um große Standardseitengrößen verarbeiten zu können.

Juli 2021
1.12.2
  • Aktualisieren Sie das EFA-Kernelmodul auf 1.12.3.

  • Erstellen Sie Open-MPI-Debian-Pakete mit --with-libevent=external und --with-hwloc=external.

  • Erhöhen Sie die OpenMPI-RPM-Build-ID auf 2, um das Abwärtskompatibilitätsproblem von HWLOC auf CentOS 8 zu beheben.

  • Entfernen Sie die Installation der Pakete kernel-devel und kernel-source auf SLES15SP2 und openSUSE 15.2.

Juni 2021
1.12.1
  • Aktualisieren Sie Libfabric auf Version 1.11.2amzon1.1.

  • Aktualisieren Sie das EFA-Kernelmodul auf 1.12.1.

Mai 2021
1.12.0
  • Aktualisieren Sie Open MPI auf Version 4.1.1.

  • Aktualisieren Sie Libfabric auf Version 1.11.2amzon1.0.

  • Erstellen Sie rdma-core für Amazon Linux 2 mit derselben Paketkonfiguration wie der AL2-rdma-core.

  • Erzwingen Sie -Wl,--enable-new-dtags nicht beim Erstellen von Open-MPI-RPMs.

  • Erstellen Sie Open MPI mit Systembibliotheken für hwloc und libevent.

  • Aktualisieren Sie das EFA-Kernelmodul auf 1.12.0.

  • Aktualisieren Sie das efa-config-Paket auf Version 1.8. Verbessern Sie die Berechnung großer Seitenreservierungen für langlebige Instances.

  • Aktualisieren Sie das efa-profile-Paket auf Version 1.5. Entfernen Sie die Datei open mpi collective tuning, die als Problemumgehung diente, um das Einfrieren von Open MPI 4.1.0 auf P4d zu Beheben.

  • Aktualisieren Sie rdma-core auf v32.1.

  • Stellen Sie die Unterstützung für Amazon 1 und Ubuntu 16.04 ein.

Mai 2021
1.11.2
  • Behebung eines Fehlers bei dem Open MPI bei der Verwendung auf P4d einfriert, indem der Standardalgorithmus für die Implementierung von MPI_BARRIER über eine Konfigurationsdatei geändert wurde.

  • Deaktivieren Sie die Verwendung der integrierten Atomics in Open MPI in ARM über --disable-builtin-atomics, um das Compiler-Problem zu umgehen.

Februar 2021
1.11.1
  • Aktualisieren Sie Open MPI auf Version 4.1.0.

  • Aktualisieren Sie das efa-config-Paket auf Version 1.7. Verbessern Sie die Berechnung der Anzahl von riesigen Seitenreservierungen.

  • Aktualisieren Sie das efa-profile-Paket auf Version 1.3. Entfernt jetzt, da Open MPI 4.1.0 verwendet wird, nicht mehr benötigte Dateien für kollektive Entscheidungen.

Dezember 2020
1.11.0
  • Fügen Sie Unterstützung für die Gravition2-Plattform hinzu.

  • Aktualisieren Sie rdma-core auf Version 31.2amzn.

  • Aktualisieren Sie Libfabric auf Version 1.11.1amzon1.0.

  • Aktualisieren Sie efa-config auf Version 1.6.

  • Aktualisieren Sie efa-profile auf Version 1.2.

Dezember 2020
1.10.1
  • Fügen Sie Unterstützung für CentOS/RHEL 8 hinzu.

  • Fügen Sie Unterstützung für Ubuntu 20.04 hinzu.

  • Fügen Sie Unterstützung für SUSE Linux Enterprise 15 hinzu.

November 2020
1.10.0
  • Fügen Sie GPUDirect-RDMA-Unterstützung für die P4d-Plattform hinzu. Verwenden Sie die --enable-gdr Installationsoption, um das GDR-aware Kernelmodul und den Userspace zu installieren.

  • Aktualisieren Sie das EFA-Kernelmodul auf Version 1.10.2.

  • Aktualisieren Sie rdma-core auf Version 31.amzn0.

  • Aktualisieren Sie Libfabric auf Version 1.11.1.

  • Aktualisieren Sie Open MPI auf Version 4.0.5.

  • Aktualisieren Sie efa-config auf Version 1.5.

  • Aktualisieren Sie efa-profile auf Version 1.1. Beinhaltet eine verbesserte Entscheidungsdatei für Open MPI Collectives.

Oktober 2020
1.9.5
  • Aktualisieren Sie efa-config auf Version 1.4. Behebt einen Fehler in der Entscheidungsdatei für Open MPI Collective.

September 2020
1.9.4
  • Aktualisieren Sie Open MPI auf Version 4.0.3.

  • Aktualisieren Sie Libfabric auf Version 1.10.2amzn1.1.

  • Aktualisieren Sie rdma-core auf Version 28.amzn0.

Juli 2020
1.9.3
  • Aktualisieren Sie das EFA-Kernelmodul auf Version 1.6.0.

  • Aktualisieren Sie rdma-core auf Version 28.amzn0.

  • Aktualisieren Sie Libfabric auf Version 1.10.1amzn1.1.

  • Aktualisieren Sie efa-config auf Version 1.3. Fügt eine kollektive Tuning-Datei für Open MPI hinzu.

  • Überspringen Sie die dkms-Installation, wenn sie bereits installiert ist.

  • Korrigieren Sie den --skip-kmod-Installationsmodus so, dass er tatsächlich funktioniert.

Juni 2020
1.8.4
  • Verschieben Sie die Konfigurationsdateien in die Pakete efa-config und efa-profile, sodass sie vom Paketmanager des Betriebssystems nachverfolgt werden.

  • Aktualisieren Sie Open MPI auf Version 4.0.3.

April 2020
1.8.3
  • Aktualisieren Sie das EFA-Kernelmodul auf Version 1.5.1.

  • Um die Zuverlässigkeit der Installation zu erhöhen, wurde DKMS auf einigen Plattformen verteilt, anstatt sich auf EPEL-Repositorys zu verlassen.

  • Installieren Sie RPMs in RHEL 7, die auf CentOS 7 basieren, anstelle von RPMs, die auf Amazon Linux 2 basieren.

Februar 2020
1.8.2
  • Stellen Sie rdma-core auf die Version 25 zurück, da die Gerätenamen zwischen dem Kernelmodul und rdma-core nicht übereinstimmen.

Januar 2020
1.8.1
  • Aktualisieren Sie Libfabric auf Version 1.9.0amzn1.1.

Januar 2020
1.8.0
  • Aktualisieren Sie rdma-core auf Version 27.0.

  • Aktualisieren Sie das EFA-Kernelmodul auf Version 1.5.0.

  • Aktualisieren Sie Libfabric auf Version 1.9.0amzn1.0.

  • Fügen Sie die Option --minimal hinzu, um nur das EFA-Kernelmodul zu installieren und rdma-core zu installieren.

Dezember 2019
1.7.1
  • Aktualisieren Sie Libfabric auf Version 1.8.1amzn1.3.

Dezember 2019
1.7.0
  • Fügen Sie die Libfabric-Moduldatei hinzu.

  • Aktualisieren Sie Libfabric auf Version 1.8.1amzn1.1.

November 2019
1.6.2
  • Aktualisieren Sie Open MPI auf Version 1.6.2.

Oktober 2019
1.6.1
  • Aktualisieren Sie Libfabric auf Version 1.8.1amzn1.0.

  • Aktualisieren Sie Open MPI auf Version 4.0.1.

  • Aktualisieren Sie rdma-core auf Version 26.0.

Oktober 2019
1.5.4
  • Aktualisieren Sie das EFA-Kernelmodul auf Version 1.4.1.

September 2019
1.5.3
  • Aktualisieren Sie das EFA-Kernelmodul auf Version 1.3.1.

  • Vermeiden Sie die Installation von kernel-devel- oder linux-headers-Paketen, es sei denn, Sie installieren den Kernel-Treiber.

September 2019
1.5.1
  • Konfigurieren Sie riesige Seiten nur, wenn ein EFA-Gerät vorhanden ist.

August 2019
1.5.0
  • Aktualisieren Sie Libfabric auf Version 1.8.0amzn1.1.

  • Aktualisieren Sie rmda-core auf Version 25.0.

August 2019
1.4.1
  • Fügen Sie die Bibliothekspfade (/opt/amazon/efa/lib64 und /opt/amazon/efa/openmpi/lib) für Libfabric und Open MPI zu /etc/ld.so.conf.d/efa.conf hinzu, um sicherzustellen, dass die gemeinsam genutzten Bibliotheken von Open MPI und Libfabric korrekt gefunden werden.

Juli 2019
1.4.0
  • Aktualisieren Sie das EFA-Kernelmodul auf Version 1.3.0.

  • Aktualisieren Sie Libfabric auf Version 1.8.0amzn1.0.

  • Erste Version zur Unterstützung von Intel MPI 2019 Update 4.

Juli 2019