NVIDIA Mellanox MCX4121A-ACAT Server Adapter в действии.
April 22, 2026
Крупный поставщик облачных услуг столкнулся со знакомой проблемой при создании своего распределенного кластера хранения нового поколения. По мере расширения кластера до сотен узлов накладные расходы на ЦП и дрожание задержки на уровне микросекунд, присущие традиционному стеку TCP/IP, серьезно ограничивали производительность NVMe-oF и распределенных баз данных. После тщательной оценки команда выбрала NVIDIA Mellanox MCX4121A-ACAT для модернизации своей сетевой инфраструктуры, используя технологию RDMA/RoCE для фундаментального преобразования путей передачи данных.
Обзор и проблема: узкое место TCP/IP в трафике East-West
В современных центрах обработки данных трафик East-West (связь между серверами) доминирует в общих схемах трафика. Для распределенной платформы хранения данных провайдера каждая операция ввода-вывода требовала нескольких сетевых циклов. Обычный стек TCP потреблял более 30% ядер ЦП только для обработки протокола, вызывая непредсказуемые всплески задержки, которые снижали производительность приложений. Команде требовалось решение, которое могло бы обойти ядро, уменьшить вмешательство ЦП и обеспечить стабильную задержку менее микросекунды во всем кластере.
Решение и развертывание: развертывание MCX4121A-ACAT для транспорта RoCE
Провайдер развернул сетевую карту Ethernet MCX4121A-ACAT на 120 узлах хранения, каждый из которых был оснащен двухпортовым подключением 25GbE. Основанный на архитектуре ConnectX-4 Lx, MCX4121A-ACAT ConnectX-4 Lx с двумя портами 25GbE SFP28 позволил беспрепятственно развернуть RoCE (RDMA over Converged Ethernet) без необходимости использования выделенной инфраструктуры InfiniBand. Ключевые параметры развертывания включали:
- Приоритетное управление потоком (PFC) и расширенный выбор передачи (ETS), настроенные на всех коммутаторах ToR.
- Маркировка ECN включена для транспорта RoCE с учетом перегрузки.
- Роли инициатора и целевого устройства NVMe-oF, сопоставленные непосредственно с аппаратными механизмами разгрузки адаптера.
Согласно техническому описанию MCX4121A-ACAT, аппаратная разгрузка транспорта адаптером устраняет необходимость участия ЦП в перемещении данных. Команда проверила совместимость с их существующим дистрибутивом Linux и оптикой SFP28, подтвердив, что экосистема MCX4121A-ACAT совместима и соответствует всем требованиям.
Результаты и преимущества: измеримое увеличение пропускной способности и снижение задержки
Тестирование после развертывания выявило драматические улучшения. Таблица ниже суммирует ключевые показатели производительности до и после миграции на решение MCX4121A-ACAT:
| Показатель | Устаревший 10GbE TCP | MCX4121A-ACAT (RoCE) | Улучшение |
|---|---|---|---|
| Средняя задержка (операции ввода-вывода 4KB) | 35 мкс | 2,1 мкс | Ниже в 16,6 раз |
| Использование ЦП (на 10 Гбит/с) | 32% | 4% | Снижение в 8 раз |
| Общая пропускная способность (два порта) | 18 Гбит/с | 49 Гбит/с | Выше в 2,7 раза |
Помимо сухих цифр, характеристики MCX4121A-ACAT привели к реальным операционным преимуществам. Задержка репликации распределенной базы данных снизилась более чем на 80%, что позволило использовать более агрессивные гарантии согласованности. IOPS при чтении/записи NVMe-oF удвоились, а ядра ЦП узлов хранения, ранее занятые обработкой сетевого стека, были перепрофилированы для фактических служб данных. Провайдер также отметил, что решение на базе сетевой карты Ethernet MCX4121A-ACAT снизило общую стоимость владения — потребовалось меньше узлов для достижения той же общей производительности.
Для организаций, оценивающих аналогичные модернизации, цена MCX4121A-ACAT позиционирует его как экономически эффективную альтернативу проприетарным решениям для межсоединений. Несколько дистрибьюторов теперь предлагают MCX4121A-ACAT для продажи с оптовыми ценами, что делает крупномасштабные развертывания RoCE все более доступными.
Резюме и перспективы: план для центров обработки данных с низкой задержкой
Это развертывание демонстрирует, что NVIDIA Mellanox MCX4121A-ACAT — это больше, чем просто обновление спецификаций, это фундаментальный инструмент для высокопроизводительных распределенных систем. Сочетая пропускную способность двух портов 25GbE с аппаратной разгрузкой транспорта RoCE, адаптер решает давнее противоречие между производительностью сети и эффективностью ЦП. Поскольку кластеры обучения ИИ, дезагрегированное хранилище и аналитика в реальном времени продолжают требовать более низкой задержки и более высокой пропускной способности, MCX4121A-ACAT предоставляет проверенный, готовый к производству путь вперед. Архитекторам сетей и ИТ-менеджерам, которым нужен надежный, высокопроизводительный серверный адаптер, больше не нужно искать, кроме этого мощного устройства ConnectX-4 Lx.

