Mellanox (NVIDIA Mellanox) 920-9B110-00FH-0D0 в действии: оптимизация межсоединений с низкой задержкой для кластеров RDMA / HPC / AI

April 14, 2026

последние новости компании о Mellanox (NVIDIA Mellanox) 920-9B110-00FH-0D0 в действии: оптимизация межсоединений с низкой задержкой для кластеров RDMA / HPC / AI

В эпоху крупномасштабного обучения моделей ИИ и высокопроизводительных вычислений эксафлопсного класса сетевая задержка стала самым критическим узким местом, ограничивающим линейную масштабируемость кластера. Решая эту проблему напрямую, коммутатор Mellanox (NVIDIA Mellanox) 920-9B110-00FH-0D0 InfiniBand меняет подход исследовательских институтов и корпоративных лабораторий ИИ к проектированию своих высокопроизводительных сетей. В этой статье рассматривается типичный сценарий развертывания, в котором аппаратное уведомление о перегрузке 920-9B110-00FH-0D0 обеспечивает детерминированную сверхнизкую задержку для рабочих нагрузок, интенсивно использующих RDMA.

Предыстория и проблема: стена коммуникаций в кластерах ИИ

Средний научно-исследовательский центр ИИ столкнулся с проблемой простоя GPU во время распределенного обучения на 64 узлах. Их существующая сеть Ethernet 100 Гбит/с страдала от перегрузки при инкасте, что приводило к тому, что операции коллективной связи (all-reduce, all-gather) занимали до 40% общего времени обучения. Сетевым архитекторам требовалось без потерь высокопроизводительное решение, способное масштабироваться до 200 Гбит/с на порт при сохранении задержки менее микросекунды. После оценки доступных вариантов команда выбрала 920-9B110-00FH-0D0 MQM8790-HS2F 200 Гбит/с HDR в качестве основного строительного блока для своей новой топологии «spine-leaf».

Решение и развертывание: внедрение сети InfiniBand

Развертывание было сосредоточено вокруг коммутаторов NVIDIA Mellanox 920-9B110-00FH-0D0, сконфигурированных в двухуровневой архитектуре fat-tree. Каждый вычислительный узел был оснащен адаптерами HDR ConnectX-6, подключенными к граничным коммутаторам с помощью пассивных медных кабелей. Ключевые этапы внедрения включали:

  • Альтернатива RDMA over Converged Ethernet (RoCE): Собственная InfiniBand с аппаратным управлением перегрузкой полностью исключила потерю пакетов.
  • Адаптивная маршрутизация: Решение 920-9B110-00FH-0D0 InfiniBand switch OPN обеспечило динамическую балансировку нагрузки по нескольким путям, предотвращая образование горячих точек.
  • Управление сетью: Использование Subnet Manager (OpenSM) с спецификациями 920-9B110-00FH-0D0, подтверждающее поддержку до 2000 узлов в одной сети.

Перед закупкой инженеры изучили техническое описание 920-9B110-00FH-0D0, чтобы проверить совместимость с существующей оптикой. совместимых с 920-9B110-00FH-0D0 экосистема включала все основные кабельные сборки HDR, упрощая спецификацию материалов. Что касается бюджета, то цены 920-9B110-00FH-0D0 оказалась конкурентоспособной по сравнению с альтернативными коммутаторами HDR, и устройства были легко доступны (920-9B110-00FH-0D0 для продажи) через партнерских каналов NVIDIA.

Результаты и преимущества: измеримое повышение производительности

Телеметрия после развертывания выявила драматические улучшения по трем ключевым показателям:

Показатель До (100GbE) После (920-9B110-00FH-0D0 HDR) Улучшение
Средняя задержка All-Reduce (64 узла) 340 мкс 78 мкс Снижение на 77%
Простой GPU (коммуникационные накладные расходы) 38% 11% Абсолютный прирост на 27%
Эффективное использование пропускной способности сети 62% 94% +32%

Помимо сырых цифр, 920-9B110-00FH-0D0 InfiniBand switch OPN позволил команде масштабироваться с 64 до 256 узлов без перепроектирования сети. Детерминированная задержка, обеспечиваемая управлением потоком на основе кредитов InfiniBand, оказалась необходимой для поддержания согласованности обучения на сотнях GPU. Инженеры также использовали аппаратное уведомление о перегрузке 920-9B110-00FH-0D0 для выявления и устранения микро-всплесков в режиме реального времени.

Резюме и перспективы: будущее межсоединений ИИ

Развертывание подтверждает, что NVIDIA Mellanox 920-9B110-00FH-0D0 служит основой для кластеров ИИ и HPC следующего поколения. Заменяя сети Ethernet с потерями на InfiniBand без потерь, организации могут вернуть до 30% вычислительной мощности GPU, ранее потраченной впустую на коммуникационные задержки. Для архитекторов, планирующих новую инфраструктуру ИИ, техническое описание 920-9B110-00FH-0D0 предоставляет подробные рекомендации по топологиям от небольших кластеров DGX до развертываний масштаба суперкомпьютеров.

По мере того как рабочие нагрузки развиваются в сторону большего параллелизма моделей и более высокой плотности GPU, 920-9B110-00FH-0D0 MQM8790-HS2F 200 Гбит/с HDR предлагает четкий путь обновления до будущих сетей 400 Гбит/с благодаря своей обратно совместимой конструкции. Будь то оценка цены 920-9B110-00FH-0D0 по сравнению с повышением операционной эффективности или проверка совместимых с 920-9B110-00FH-0D0 вариантов кабелей, этот коммутатор InfiniBand обеспечивает измеримую рентабельность инвестиций для организаций, основанных на данных.