Lenovo представила серверы для ИИ-инференса: ThinkSystem SR675i V3, SR650i V4 и ThinkEdge SE455i V4

Компания Lenovo официально анонсировала новые серверные решения, ориентированные на задачи искусственного интеллекта — в первую очередь, на инференс (вывод), а не обучение. Это стратегически важный шаг, отражающий смену фокуса рынка: если ранее большинство инвестиций шло в мощные кластеры для тренировки моделей, то сегодня компании всё чаще сталкиваются с необходимостью развертывания ИИ-моделей в реальных бизнес-процессах — от ритейла до телекоммуникаций и промышленности.
Новые продукты входят в линейку Lenovo Hybrid AI Advantage и включают три ключевые модели:
- ThinkSystem SR675i V3 — флагманский 3U-сервер на базе AMD EPYC с поддержкой до 8 GPU NVIDIA RTX PRO 6000 Blackwell;
- ThinkSystem SR650i V4 — универсальный 2U-сервер на Intel Xeon Granite Rapids, сочетающий ИИ-инференс и корпоративные рабочие нагрузки;
- ThinkEdge SE455i V4 — компактное решение для периферийных вычислений (edge inference) с защитой от экстремальных условий.
Все системы поставляются с предустановленным ПО для оптимизации инференса, что позволяет унифицировать данные из разных источников и ускорить внедрение ИИ в производственные процессы. Кроме того, Lenovo предлагает подписку TruScale и новые сервисы Hybrid AI Factory Services, включая консультации по развёртыванию и управлению ИИ-инфраструктурой.
Почему именно инференс? Тренды рынка ИИ-оборудования
Если в 2020–2023 годах основной спрос на серверы для ИИ был связан с обучением больших языковых моделей (LLM), то сейчас центр тяжести сместился в сторону развёртывания моделей в production. По данным IDC, к 2026 году более 60% инвестиций в ИИ-инфраструктуру будут направлены именно на инференс, а не на обучение.
Причины этого просты:
- Обучение — это единовременный процесс, тогда как инференс происходит постоянно и требует масштабируемости, низкой задержки и энергоэффективности.
- Бизнес хочет получать ROI от уже обученных моделей — например, через чат-боты, системы анализа изображений, прогнозирование спроса или автоматизацию call-центров.
- Рост edge-вычислений требует компактных, надёжных и энергоэффективных решений, способных работать вне дата-центров.
Lenovo отвечает на эти вызовы, предлагая не просто «железо», а комплексные решения — от оборудования до ПО и услуг. Это особенно важно для предприятий, которые не обладают глубокой экспертизой в области ИИ, но хотят его внедрять.
ThinkSystem SR675i V3: флагман для высокопроизводительного инференса
Сервер ThinkSystem SR675i V3 представляет собой 3U-систему, созданную для максимальной производительности при выполнении задач ИИ-вывода. Его основа — процессор AMD EPYC Turin 9535 (64 ядер / 128 потоков, 2,4 ГГц, TDP 300 Вт), который обеспечивает высокую пропускную способность памяти и I/O.
Ключевые характеристики:
- Память: до 1,5 ТБ DDR5-6400 (24 слота × 64 ГБ);
- Хранение: до 2× E3.S NVMe SSD по 3,84 ТБ (PCIe 5.0 x4) + до 2× M.2 NVMe SSD по 960 ГБ (PCIe 4.0 x4);
- Ускорители: до 8× NVIDIA RTX PRO 6000 Blackwell Server Edition;
- DPU: до 5× NVIDIA BlueField-3 (4×400G + 1×200G) для разгрузки сети и безопасности;
- Расширение: 6 слотов PCIe 5.0 x16 + 1 слот OCP 3.0 x8/x16;
- Питание: 4 блока питания Titanium 2300 Вт (горячая замена);
- Охлаждение: 5 вентиляторов с интеллектуальным управлением.
Важно: IPMI в этой модели недоступен — управление осуществляется через другие интерфейсы, что характерно для специализированных ИИ-платформ. Такая конфигурация идеально подходит для дата-центров, где требуется высокая плотность вычислений и минимальная задержка между CPU и GPU.
Этот сервер — выбор для крупных компаний, работающих с мультимодальными моделями, генеративным ИИ в реальном времени или системами компьютерного зрения с высокой частотой кадров.
ThinkSystem SR650i V4: баланс между ИИ и корпоративными задачами
Модель ThinkSystem SR650i V4 рассчитана на предприятия, которым нужна универсальная платформа, сочетающая ИИ-инференс и традиционные корпоративные рабочие нагрузки — ERP, базы данных, виртуализацию и т.д.
Основа — два процессора Intel Xeon Granite Rapids-SP 6530P (32C/64T, 2,3 ГГц, TDP 225 Вт), обеспечивающие отличную производительность в многопоточных задачах.
Конфигурация по умолчанию включает:
- Память: 512 ГБ DDR5-6400 (8×64 ГБ);
- GPU: 2× NVIDIA RTX PRO 6000 Blackwell Server Edition;
- Хранение: 2× U.2 NVMe SSD по 3,84 ТБ (PCIe 5.0 x4) из 8 возможных + RAID1 из 2× M.2 SATA SSD по 960 ГБ;
- Сеть: двухпортовый 25GbE-адаптер Broadcom 57414 (SFP28);
- Расширение: 6 слотов PCIe 5.0 x16 + 2 слота OCP 3.0;
- Питание: 2 блока Titanium 2700 Вт;
- Охлаждение: 6 вентиляторов или опциональная СЖО Neptune от Lenovo.
Наличие СЖО — важное преимущество для ЦОД с высокой плотностью размещения, где воздушное охлаждение становится неэффективным. Сервер также поддерживает горячую замену компонентов, что критично для 24/7-инфраструктур.
SR650i V4 — отличный выбор для банков, страховых компаний, логистических операторов и других организаций, которым нужно запускать ИИ-модели параллельно с традиционными ИТ-сервисами без создания отдельного кластера.
ThinkEdge SE455i V4: ИИ на периферии
Сервер ThinkEdge SE455i V4 — это ответ Lenovo на растущий спрос на edge-инференс. Устройство имеет компактный форм-фактор (2U, глубина всего 440 мм) и усиленную конструкцию, позволяющую работать в условиях, недоступных для стандартного оборудования.
Он сертифицирован для эксплуатации при температурах от -5 °C до +40 °C, устойчив к вибрациям и пыли — что делает его идеальным для размещения в магазинах, на заводах, в телеком-стойках или на нефтегазовых объектах.
Основные параметры:
- CPU: AMD EPYC Embedded 8534P (64C/128T, 2,3 ГГц, TDP 200 Вт);
- Память: 576 ГБ DDR5-4800 (6×96 ГБ);
- GPU: 2× NVIDIA L4 24 ГБ (PCIe 4.0 x16) — энергоэффективные ускорители для инференса;
- Хранение: 1× NVMe SSD 3,84 ТБ + 1× SATA SSD 960 ГБ;
- Сеть: двухпортовый OCP-адаптер Broadcom 57416 (10GbE);
- Расширение: до 2× PCIe 5.0 x16 + до 4× PCIe 4.0 x8 + 1× OCP 3.0;
- Питание: 2 блока Platinum второго поколения с горячей заменой.
IPMI отключён — управление осуществляется через другие механизмы, что типично для edge-устройств. NVIDIA L4 — это современные GPU с низким энергопотреблением, оптимизированные именно для вывода моделей, включая трансформеры и diffusion-модели.
Примеры использования:
- Анализ видео в ритейле для подсчёта посетителей и распознавания поведения;
- Контроль качества продукции на конвейере;
- Автоматизация обслуживания клиентов в банкоматах и терминалах;
- Локальная обработка данных в телеком-сетях 5G.
Программное обеспечение и сервисы: не только «железо»
Lenovo не ограничивается продажей оборудования. Все новые серверы поставляются с предустановленным ПО для оптимизации инференса, которое позволяет:
- Интегрировать данные из различных источников (IoT, CRM, ERP);
- Управлять жизненным циклом моделей;
- Мониторить производительность и энергопотребление;
- Обеспечивать безопасность данных на всех этапах.
Кроме того, компания предлагает:
- TruScale — подписка на ИИ-инфраструктуру по модели «оборудование как услуга» (Hardware-as-a-Service). Это снижает CapEx и позволяет масштабировать ресурсы по мере роста бизнеса.
- Hybrid AI Factory Services — комплексные консультации по проектированию, развёртыванию и управлению ИИ-системами. Включают аудит текущей инфраструктуры, рекомендации по выбору моделей и настройке pipeline’ов инференса.
Это особенно ценно для среднего бизнеса, который не может позволить себе штат ML-инженеров, но хочет использовать ИИ для повышения эффективности.
Сравнительная таблица: какой сервер выбрать?
| Параметр | ThinkSystem SR675i V3 | ThinkSystem SR650i V4 | ThinkEdge SE455i V4 |
|---|---|---|---|
| Форм-фактор | 3U | 2U | 2U (глубина 440 мм) |
| Процессор | AMD EPYC Turin 9535 (1 шт.) | Intel Xeon Granite Rapids 6530P (2 шт.) | AMD EPYC Embedded 8534P (1 шт.) |
| GPU | до 8× RTX PRO 6000 Blackwell | 2× RTX PRO 6000 Blackwell | 2× NVIDIA L4 |
| Память | до 1,5 ТБ DDR5-6400 | до 2 ТБ DDR5-6400 | до 1,5 ТБ DDR5-4800 |
| Хранение | E3.S + M.2 NVMe | U.2 NVMe + M.2 SATA | NVMe + SATA SSD |
| Сеть | BlueField-3 DPU (400G/200G) | 25GbE Broadcom | 10GbE Broadcom |
| Охлаждение | Воздушное | Воздушное / СЖО Neptune | Воздушное (усиленное) |
| IPMI | Нет | Да | Нет |
| Тип использования | ЦОД, HPC, ИИ-кластеры | Корпоративные ЦОД, гибридные нагрузки | Edge, ритейл, промышленность |
Как заказать оборудование Lenovo в России?
В России официальным партнёром Lenovo по серверному оборудованию выступает компания DellShop.ru, которая предлагает полный спектр решений для ИИ и корпоративной инфраструктуры.
На сайте доступны следующие категории:
- Серверы — включая rack и tower модели;
- Rack-серверы — для установки в стойку;
- Tower-серверы — для офисного размещения;
- Сетевое оборудование — коммутаторы, адаптеры, DPU;
- Системы хранения — SAN/NAS, гиперконвергентные платформы;
- Комплектующие — SSD, RAM, блоки питания и т.д.
Специалисты DellShop помогут подобрать конфигурацию под ваши задачи, организовать доставку и техническую поддержку. Также доступны консультации по развёртыванию ИИ-инфраструктуры «под ключ».
Часто задаваемые вопросы (FAQ)
Чем инференс отличается от обучения ИИ-моделей?
Обучение — это процесс «обучения» модели на больших наборах данных, требующий огромных вычислительных ресурсов и времени. Инференс (вывод) — это использование уже обученной модели для получения результатов по новым данным (например, распознавание объекта на фото). Инференс требует меньшей вычислительной мощности, но должен быть быстрым, энергоэффективным и масштабируемым.
Можно ли использовать эти серверы для обучения моделей?
Технически — да, особенно SR675i V3 с 8 GPU Blackwell. Однако они оптимизированы именно под инференс: имеют меньше памяти GPU, другую топологию соединений и ПО-стек. Для обучения лучше подходят специализированные кластеры с InfiniBand и большими объёмами VRAM.
Поддерживает ли оборудование российские условия эксплуатации?
Да. Все серверы сертифицированы для работы в климатических условиях РФ. ThinkEdge SE455i V4 дополнительно защищён от пыли, вибраций и перепадов температур, что критично для промышленных объектов и удалённых локаций.
Что такое TruScale и как он работает?
TruScale — это модель подписки от Lenovo, при которой вы платите за использование оборудования ежемесячно, как за облачный сервис. В стоимость входят оборудование, ПО, обновления и поддержка. Это снижает первоначальные затраты и позволяет гибко масштабировать ИИ-инфраструктуру.
Пошаговая инструкция: как внедрить ИИ-инференс в вашем бизнесе
Как выбрать и развернуть сервер для ИИ-инференса
- Определите тип задачи: edge (локальный вывод) или ЦОД (массовый инференс).
- Оцените требования к производительности, задержке и энергопотреблению.
- Выберите архитектуру: AMD EPYC (высокая пропускная способность) или Intel Xeon (совместимость с корпоративным ПО).
- Подберите количество GPU и тип накопителей (NVMe для скорости, SATA для ёмкости).
- Свяжитесь с официальным партнёром Lenovo для консультации и подбора конфигурации.
- Закажите оборудование с предустановленным ПО для инференса.
- Разверните сервер и подключите к существующей ИТ-инфраструктуре.
- Настройте мониторинг и оптимизацию через Lenovo Hybrid AI Factory Services.
Новые серверы Lenovo — это не просто обновление линейки, а стратегический ответ на запрос рынка: ИИ должен работать не в лаборатории, а в реальном бизнесе. Благодаря продуманной архитектуре, готовым конфигурациям и комплексной поддержке, компании могут быстро и безопасно внедрять ИИ-решения без необходимости строить собственную экспертизу с нуля.
Для тех, кто планирует модернизировать ИТ-инфраструктуру под задачи искусственного интеллекта, решения Lenovo в сочетании с поддержкой партнёров вроде DellShop открывают прямой путь к цифровой трансформации.
Поделиться статьёй:
Об авторе

Максим Ковалёв
Железо и характеристики / Режет маркетинговую лапшу
Эксперт по серверам, 10+ лет с железом Dell, HPE, Supermicro. Разбирает характеристики на «реально важно» и «маркетинг для прайса». Объясняет так, чтобы не пришлось гуглить каждое второе слово.
Насмотрелся на «мощные серверы», которые не тянут даже нормальную виртуализацию. Больше 10 лет работает с серверным железом: Dell, HPE, Supermicro — рейды, контроллеры, память, апгрейды и вечное «почему оно тормозит». В гайдах объясняет без занудства и птичьего языка: какой сервер реально нужен под 1С, базы или виртуалки, что в характеристиках важно, а что — маркетинг ради красивых цифр в прайсе. Пишет так, как объяснил бы коллеге в серверной: коротко, по делу и с примерами из практики.
Похожие материалы

Panmnesia представила чип-коммутатор Panswitch с поддержкой PCIe 6.4 и CXL 3.2 — новый этап в архитектуре ИИ-инфраструктуры
Panmnesia представила Panswitch — первый чип-коммутатор с поддержкой PCIe 6.4 и CXL 3.2 для масштабируемых ИИ-систем. Узнайте, как он меняет архитектуру дата-центров.

DeepX представила ИИ-ускорители DX-H1 V-NPU, DX-H1 Quattro и DX-M1 М.2
DeepX представила ИИ-ускорители DX-H1 и DX-M1 с до 100 TOPS и энергопотреблением от 5 Вт — решение для видеопроцессинга и edge-вычислений.

Nvidia Context Memory Storage Platform — новая архитектура хранения данных для масштабного ИИ-вывода
Nvidia Context Memory Storage Platform — новая архитектура хранения для масштабного ИИ-вывода с пятикратным ростом производительности и энергоэффективности.