Практика применения: NVIDIA Mellanox MCX631102AN-ADAT RDMA/RoCE Низкозадержный транспорт и повышение пропускной способности серверов
April 27, 2026
В распределенных системах хранения данных, высокопроизводительных вычислениях и кластерах для обучения ИИ задержка сети и нагрузка на ЦП стали основными узкими местами, ограничивающими производительность серверов. Поставщик облачных услуг недавно модернизировал свой бэкэнд хранения NVMe-oF, выбрав сетевой адаптер NVIDIA Mellanox MCX631102AN-ADAT. Развернув RDMA over Converged Ethernet (RoCEv2), они добились сквозной передачи с низкой задержкой и значительного увеличения пропускной способности сервера. В этом тематическом исследовании рассматривается производительность адаптера в производственной среде.
Предпосылки и проблемы: узкое место стека протоколов TCP/IP
Существующая инфраструктура 25GbE провайдера обрабатывала трафик хранения с использованием традиционного программного стека TCP/IP. В сценариях NVMe/TCP утилизация ЦП для инкапсуляции и декапсуляции пакетов превышала 40%, что приводило к задержкам хранения выше 200 мкс и значительному снижению вычислительной мощности на серверах приложений. Архитекторам срочно требовалось решение, которое могло бы обойти сетевой стек ядра, уменьшить вмешательство ЦП и поддерживать пропускную способность на уровне линии на двойных 25GbE каналах. После оценки нескольких вариантов они выбрали MCX631102AN-ADAT ConnectX-6 Lx с двумя портами 25GbE SFP28 в качестве основного аппаратного обеспечения для модернизации их сети хранения данных.
Решение и развертывание: RDMA/RoCEv2 с аппаратными разгрузками
При развертывании все серверы, ориентированные на хранение данных, были заменены на сетевой адаптер MCX631102AN-ADAT, работающий в режиме RoCEv2 без потерь (с использованием ECN и PFC). Ключевые этапы развертывания включали:
- Включение SR-IOV и выделение виртуальных функций (VF) для виртуальных машин хранения данных, обходя сетевой стек гипервизора
- Конфигурирование NVMe over Fabrics (NVMe-oF) с транспортом RDMA, полностью устраняющее накладные расходы TCP
- Настройка порогов буферизации коммутаторов для трафика RoCE 25GbE без потерь в топологии leaf-spine
Технические характеристики MCX631102AN-ADAT — включая аппаратные временные метки, динамический транспорт соединений (DCT) и векторизованный приемный движок — были полностью использованы для обеспечения предсказуемой задержки менее микросекунды даже при совокупной нагрузке 50 Гбит/с.
Измеренные приросты производительности и операционные преимущества
После миграции на сеть на базе NVIDIA Mellanox MCX631102AN-ADAT были зафиксированы следующие метрики:
| Метрика | До (TCP/IP 25GbE) | После (RoCEv2 с MCX631102AN-ADAT) |
|---|---|---|
| Задержка чтения NVMe-oF (P99) | 215 мкс | 18 мкс |
| Утилизация ЦП (путь ввода-вывода хранилища) | 41% (одно ядро насыщено) | 7% (распределено по ядрам) |
| Совокупная пропускная способность сервера (RX+TX) | 42 Гбит/с (ограничено программным обеспечением) | 49,8 Гбит/с (линейная скорость) |
| Пропускная способность малых пакетов (64B) | 8,1 млн пакетов/с | 37,5 млн пакетов/с (аппаратное управление потоками) |
Инженеры отметили, что решение MCX631102AN-ADAT Ethernet adapter card solution обеспечило предсказуемую хвостовую задержку, подходящую для баз данных аналитики в реальном времени. Кроме того, освободившиеся ядра ЦП были переназначены для рабочих нагрузок приложений, что увеличило общую плотность арендаторов примерно на 24% на тех же физических серверах.
Совместимость и интеграция с экосистемой
При расширении развертывания команда эксплуатации проверила, что адаптер MCX631102AN-ADAT совместим с их существующими коммутаторами NVIDIA Spectrum (профили RoCE без потерь), а также со сторонними коммутаторами ToR от Arista и Cisco с конфигурацией DCBX. Для планирования закупок они ссылались на технический паспорт MCX631102AN-ADAT, чтобы проверить энергетические характеристики (типично около 12 Вт) и тепловые требования. Первоначальные оптовые запросы подтвердили, что цена MCX631102AN-ADAT остается конкурентоспособной по сравнению с аналогичными SmartNIC, при этом несколько дистрибьюторов предлагают MCX631102AN-ADAT для продажи по стандартным объемным соглашениям.
Резюме и перспективы
Производственный кейс наглядно демонстрирует, что MCX631102AN-ADAT обеспечивает фундаментальный переход от сетей хранения данных, ограниченных TCP, к сетям, ускоренным RDMA, без необходимости полной модернизации инфраструктуры до 100GbE. Используя конструкцию MCX631102AN-ADAT ConnectX-6 Lx с двумя портами 25GbE SFP28, организации могут удвоить эффективную пропускную способность для чувствительных к задержкам рабочих нагрузок, одновременно высвобождая значительные ресурсы ЦП. В дальнейшем такая же схема развертывания будет распространена на распределенные фреймворки машинного обучения (NCCL через RoCE) и приложения с состоянием на основе микросервисов. Для архитекторов, оценивающих модернизацию до 25GbE, NVIDIA Mellanox MCX631102AN-ADAT является проверенным, готовым к производству строительным блоком для высокопроизводительных сетей центров обработки данных с низкой задержкой.

