Elastic Fabric Adapter (EFA) は、Amazon EC2 インスタンスにアタッチできるネットワークデバイスで、高性能コンピューティング (HPC) や機械学習 (ML) アプリケーションのパフォーマンスを向上させるために設計されています。EFAは低レイテンシーかつ高スループットの通信を提供し、大規模な並列処理が求められるアプリケーションの効率を大幅に向上させます。
主な特徴
- 低レイテンシー通信:従来のTCP通信よりも低いレイテンシーと高いスループットを提供し、HPCアプリケーションのスケーラビリティを向上させます。
- OSバイパス機能:アプリケーションがOSカーネルをバイパスして直接ネットワークハードウェアと通信できるため、オーバーヘッドが削減されます。
- 既存ライブラリとの互換性:Message Passing Interface (MPI) や NVIDIA Collective Communications Library (NCCL) などのライブラリと統合でき、アプリケーションの変更を最小限に抑えて導入可能です。
使用例
EFAは、数千のCPUやGPUを使用する大規模なHPCクラスターや、機械学習モデルのトレーニングにおいてインスタンス間の高速通信が必要なシナリオで活用されます。
要するに、Elastic Fabric Adapter は、AWS クラウド上でHPCやMLアプリケーションの通信性能を向上させ、オンプレミス環境に匹敵するパフォーマンスを実現するネットワークインターフェイスです。