NVIDIA представила архитектуру хранения данных BlueField-4 STX для ИИ-систем

Компания NVIDIA анонсировала модульную эталонную архитектуру BlueField-4 STX — решение, которое меняет правила игры в сфере хранения данных для искусственного интеллекта. Новая платформа предназначена для предприятий, облачных провайдеров и операторов дата-центров, стремящихся построить высокопроизводительные системы хранения, оптимизированные под специфические требования ИИ-нагрузок. В условиях, когда традиционные подходы к организации хранилищ демонстрируют узкие места, STX предлагает принципиально иную архитектуру, способную обеспечить скорость отклика, необходимую для работы современных ИИ-агентов.
Почему традиционные хранилища не справляются с задачами ИИ
Большинство современных дата-центров построены на базе хранилищ общего назначения, ориентированных прежде всего на ёмкость и стоимость владения. Такие системы отлично подходят для архивирования данных, резервного копирования или работы с файловыми сервисами. Однако задачи искусственного интеллекта предъявляют качественно иные требования: ИИ-модели нуждаются в доступе к информации в реальном времени, низкой задержке при чтении контекстной памяти и высокой пропускной способности для потоковой обработки данных.
Когда ИИ-агент запрашивает контекст для генерации ответа или дообучения модели, даже миллисекундные задержки в подсистеме хранения могут стать критическим фактором, снижающим общую производительность системы. Традиционные архитектуры, построенные вокруг центральных процессоров, вынуждены тратить значительные вычислительные ресурсы на управление вводом-выводом, что снижает эффективность работы GPU и увеличивает энергопотребление. Именно эти ограничения призвана устранить архитектура BlueField-4 STX, перенося функции обработки данных на специализированные блоки DPU.
Архитектура BlueField-4 STX: технологическая основа
В основе STX лежит модульный подход, позволяющий гибко масштабировать платформу под конкретные задачи. Ключевым компонентом является DPU NVIDIA BlueField-4 — программируемый процессор обработки данных, который берёт на себя функции сетевого взаимодействия, безопасности, сжатия и управления хранилищем, освобождая CPU и GPU для выполнения основных вычислительных задач.
DPU BlueField-4 и процессор Grace/Vera
BlueField-4 интегрирует Arm-совместимые ядра на базе архитектуры NVIDIA Grace/Vera, обеспечивая высокую производительность при низком энергопотреблении. В конфигурации предусмотрено 128 Гбайт оперативной памяти LPDDR5 для быстрой работы с метаданными и кэшированием, а также 512 Гбайт SSD для локального хранения критически важных данных. Такая комбинация позволяет обрабатывать запросы к хранилищу непосредственно на DPU, минимизируя задержки и разгружая основную вычислительную инфраструктуру. Для организаций, планирующих модернизацию серверного парка, актуальным решением станут серверы, совместимые с новыми DPU и поддерживающие высокие скорости обмена данными.
Сетевые возможности ConnectX-9 SuperNic
Архитектура STX использует сетевой адаптер NVIDIA ConnectX-9 SuperNic с пропускной способностью до 1,6 Тбит/с. Это обеспечивает беспрецедентную скорость передачи данных между узлами кластера, что особенно важно при распределённом обучении больших языковых моделей или обработке потоковых данных в реальном времени. Поддержка стандарта PCIe 6.0 с 48 линиями гарантирует минимальные задержки при взаимодействии между GPU, DPU и подсистемой хранения. При построении высокопроизводительной инфраструктуры критически важно учитывать совместимость сетевого оборудования — актуальные предложения по сетевому оборудованию позволяют создать надёжную основу для работы с архитектурой STX.
Программная платформа DOCA и AI Enterprise
Аппаратная часть STX дополняется программным стеком NVIDIA. Микросервисы NVIDIA DOCA предоставляют разработчикам инструменты для создания оптимизированных приложений, работающих непосредственно на DPU. Это включает функции шифрования, сжатия, репликации данных и управления политиками доступа без участия основного процессора. Платформа NVIDIA AI Enterprise обеспечивает готовый набор фреймворков и инструментов для развёртывания ИИ-решений в производственной среде, включая поддержку популярных фреймворков машинного обучения и средств мониторинга.
Преимущества STX: производительность и энергоэффективность
Согласно данным NVIDIA, архитектура STX демонстрирует в четыре раза более высокую энергоэффективность по сравнению с традиционными решениями на базе CPU. Это достигается за счёт специализации: DPU выполняет задачи управления данными с минимальными накладными расходами, тогда как GPU фокусируются на вычислениях, а CPU — на оркестрации процессов. Результат — снижение общего энергопотребления при одновременном росте производительности.
| Параметр | Традиционная архитектура (CPU-based) | Архитектура NVIDIA BlueField-4 STX |
|---|---|---|
| Задержка доступа к данным | Высокая (зависит от загрузки CPU) | Минимальная (обработка на DPU) |
| Пропускная способность | Ограничена шиной PCIe и CPU | До 1,6 Тбит/с через ConnectX-9 |
| Энергоэффективность | Базовый уровень | В 4 раза выше |
| Масштабируемость | Линейная, с ростом накладных расходов | Модульная, с сохранением производительности |
| Поддержка ИИ-нагрузок | Ограниченная | Оптимизированная для полного цикла ИИ |
STX предоставляет основу для создания универсального механизма обработки данных, ускоряющего полный жизненный цикл ИИ — от предобработки и обучения моделей до аналитики и инференса на базе агентов. Это особенно актуально для сценариев, где требуется постоянный доступ к большим объёмам контекстной информации, например, в RAG-архитектурах или системах реального времени.
Контекстная память CMX: первое внедрение в масштабе стойки
Первой практической реализацией архитектуры STX стала платформа NVIDIA CMX с контекстной памятью. Это решение расширяет доступную память GPU за счёт высокоскоростного хранилища, управляемого через DPU. CMX позволяет размещать в быстрой памяти не только веса моделей, но и большие наборы контекстных данных, что критически важно для работы современных больших языковых моделей.
Платформа выполнена в форм-факторе стойки и готова к интеграции в существующие дата-центры. Для компаний, рассматривающих развёртывание подобных решений, важны не только вычислительные узлы, но и надёжные rack-серверы, способные обеспечить стабильную работу при высоких нагрузках. При необходимости гибкой конфигурации под конкретные задачи могут быть рассмотрены и tower-серверы для пилотных внедрений или периферийных вычислений.
Экосистема партнеров и доступность решений
NVIDIA объявила о поддержке архитектуры STX со стороны ведущих производителей систем хранения и серверного оборудования. В список партнёров вошли: Cloudian, DDN, Dell Technologies, Everpure, Hitachi Vantara, HPE, IBM, MinIO, NetApp, Nutanix, VAST Data и WEKA. Это означает, что заказчики получат выбор из широкого спектра сертифицированных решений, адаптированных под различные сценарии использования.
Производством систем на базе STX займутся компании AIC, Supermicro и Quanta Cloud Technology (QCT), что гарантирует доступность платформ в различных ценовых сегментах и конфигурациях. Среди ранних внедренцев — облачные провайдеры и ИИ-компании: CoreWeave, Crusoe, IREN, Lambda, Mistral AI, Nebius, OCI и Vultr. Решения на базе STX станут доступны во второй половине 2026 года.
Для организаций, планирующих интеграцию новых технологий в существующую инфраструктуру, важно учитывать совместимость компонентов. Качественные комплектующие и профессиональная консультация помогают минимизировать риски при модернизации. При возникновении вопросов по подбору оборудования или конфигурации системы всегда можно обратиться за поддержкой через контакты официальных партнёров.
Практические рекомендации по внедрению архитектуры для ИИ
При планировании перехода на архитектуру, оптимизированную для ИИ, рекомендуется следовать нескольким ключевым принципам:
- Оцените текущие узкие места: проведите аудит производительности подсистемы хранения и сетевого взаимодействия под типичными ИИ-нагрузками.
- Определите требования к задержкам: для задач инференса в реальном времени критичны миллисекундные задержки, тогда как для обучения допустимы более высокие значения при условии высокой пропускной способности.
- Учтите масштабируемость: архитектура должна позволять наращивать производительность без полной замены инфраструктуры.
- Проверьте совместимость ПО: убедитесь, что используемые фреймворки машинного обучения поддерживают работу с ускоренными хранилищами через DOCA или аналогичные интерфейсы.
- Спланируйте энергопотребление: более высокая энергоэффективность STX позволяет снизить операционные расходы, но требует точного расчёта нагрузки на систему охлаждения.
Для хранения больших объёмов обучающих данных и результатов инференса целесообразно использовать специализированные системы хранения, совместимые с архитектурой STX и поддерживающие необходимые протоколы доступа.
Что такое архитектура NVIDIA BlueField-4 STX?
BlueField-4 STX — это модульная эталонная архитектура хранения данных от NVIDIA, построенная на базе DPU BlueField-4. Она предназначена для создания высокопроизводительных платформ хранения, оптимизированных под задачи искусственного интеллекта, обеспечивая низкие задержки, высокую пропускную способность и улучшенную энергоэффективность по сравнению с традиционными CPU-ориентированными решениями.
В чём ключевое преимущество STX перед традиционными хранилищами?
Основное преимущество — специализация: DPU берёт на себя задачи управления данными, сетью и безопасностью, освобождая CPU и GPU для вычислений. Это обеспечивает в 4 раза более высокую энергоэффективность, минимальные задержки доступа к данным и масштабируемость под растущие ИИ-нагрузки без пропорционального роста энергопотребления.
Какие компании уже поддерживают архитектуру STX?
Поддержку STX объявили ведущие вендоры систем хранения: Cloudian, DDN, Dell Technologies, Everpure, Hitachi Vantara, HPE, IBM, MinIO, NetApp, Nutanix, VAST Data и WEKA. Производством оборудования займутся AIC, Supermicro и QCT, а ранними внедренцами станут облачные провайдеры CoreWeave, Crusoe, Lambda, Mistral AI, Nebius и другие.
Когда станут доступны решения на базе STX?
Коммерческая доступность систем на базе архитектуры NVIDIA BlueField-4 STX запланирована на вторую половину 2026 года. Предварительные заказы и пилотные внедрения могут быть доступны для корпоративных клиентов через официальных партнёров NVIDIA.
Подходит ли STX для небольших ИИ-проектов?
Архитектура STX модульна и масштабируема, что позволяет адаптировать её под проекты разного масштаба. Для небольших внедрений можно начать с конфигурации на базе одного узла CMX, постепенно наращивая инфраструктуру по мере роста требований. Важно учитывать, что максимальная эффективность достигается при работе с распределёнными ИИ-нагрузками и большими объёмами контекстных данных.
Архитектура NVIDIA BlueField-4 STX знаменует собой важный этап в эволюции инфраструктуры для искусственного интеллекта. Перенося функции обработки данных на специализированные DPU, NVIDIA предлагает не просто ускорение отдельных операций, а принципиально новый подход к проектированию систем хранения. Для предприятий и провайдеров, стремящихся оставаться конкурентоспособными в эпоху генеративного ИИ, своевременная оценка и внедрение подобных решений может стать ключевым фактором успеха. По мере расширения экосистемы партнёров и появления коммерческих продуктов архитектура STX имеет все шансы стать новым стандартом для высокопроизводительных ИИ-инфраструктур.
Поделиться статьёй:
Об авторе

Серверное оборудование · Практик-универсал
Инженер по серверному оборудованию, 8 лет в профессии. Настраивал и чинил серверы Dell, HP и Huawei — от небольших офисов до нагруженных дата-центров. Пишет гайды, которые сам хотел бы прочитать, когда начинал.
Все статьи автора →Похожие материалы

AMD представила процессор Ryzen 9 9950X3D2 Dual Edition с двойным 3D V-Cache
Процессор AMD Ryzen 9 9950X3D2 Dual Edition с двойным 3D V-Cache и 208 Мбайт кеша повышает производительность в рендеринге и компиляции.

Сервер MSI CX171-S4056 1U на платформе AMD EPYC Turin: обзор для ЦОД и облачных инфраструктур
Сервер MSI CX171-S4056 1U на платформе AMD EPYC Turin: технические характеристики, сценарии применения и советы по интеграции в высокоплотные ЦОД и облака.

Intel выпустила процессоры Xeon 600 с 12–86 ядрами для профессиональных рабочих станций
Новые Intel Xeon 600 для рабочих станций: до 86 ядер, чипсет W890, память до 8000 МТ/с. Сравнение производительности и рекомендации по сборке системы.