Tenstorrent представила настольную ИИ-систему TT-QuietBox 2 с СЖО на базе RISC-V

Канадский инновационный стартап Tenstorrent официально анонсировал настольную рабочую станцию TT-QuietBox 2 — компактное, но чрезвычайно мощное решение для выполнения ресурсоёмких задач в области искусственного интеллекта. Новинка позиционируется как доступная альтернатива серверным кластерам: система способна поддерживать обучение и инференс больших языковых моделей с количеством параметров до 120 миллиардов. При этом устройство не требует специализированной серверной инфраструктуры — достаточно обычной электросети и рабочего стола. Это открывает новые возможности для исследовательских лабораторий, стартапов и инженерных команд, которым нужна высокая вычислительная плотность без капитальных затрат на ЦОД.
Архитектура Blackhole: RISC-V и Tensix в действии
Сердцем TT-QuietBox 2 являются четыре фирменных акселератора Tenstorrent Blackhole, построенных на открытой архитектуре RISC-V. Каждый модуль содержит 16 высокопроизводительных «больших» ядер RISC-V общего назначения и 120 специализированных ядер Tensix, оптимизированных для тензорных операций. Объём встроенной сверхбыстрой памяти SRAM на одном чипе достигает 210 Мбайт, а подсистема видеопамяти представлена 32 Гбайт GDDR6 с пропускной способностью 512 Гбайт/с. В совокупности конфигурация из четырёх ускорителей обеспечивает 64 ядра RISC-V, 480 ядер Tensix и 128 Гбайт видеопамяти с агрегированной пропускной способностью более 2 Тбайт/с.
Дополнительно система оснащена 256 Гбайт оперативной памяти DDR5, что позволяет эффективно работать с крупными датасетами и промежуточными результатами вычислений без частого обращения к дисковой подсистеме. Для сравнения, при подборе комплектующих для традиционной рабочей станции аналогичного класса потребовалось бы несколько дискретных решений и сложная система межкомпонентной синхронизации. TT-QuietBox 2 предлагает готовую, сбалансированную архитектуру «из коробки».
Важной особенностью платформы является полностью открытый программный стек. Разработчики получают доступ к инструментам компиляции, отладки и профилирования без лицензионных ограничений — это соответствует философии RISC-V и снижает зависимость от проприетарных экосистем. Поддержка популярных фреймворков, таких как PyTorch, ONNX и TensorFlow, обеспечивает бесшовную миграцию существующих проектов.
Производительность для больших языковых моделей
Пиковая вычислительная мощность TT-QuietBox 2 достигает 2654 Тфлопс в формате BlockFP8 — специализированном представлении чисел с плавающей запятой, оптимизированном для ИИ-нагрузок. На практике это означает возможность локального запуска и тонкой настройки моделей уровня Llama 3.1 70B (70 миллиардов параметров) со скоростью генерации 476,5 токена в секунду. Для контекста: это сопоставимо с производительностью небольших серверных кластеров на базе GPU предыдущего поколения, но при значительно меньшем энергопотреблении и уровне шума.
Система особенно эффективна в сценариях инференса — выполнения предварительно обученных моделей. Благодаря низкой задержке доступа к памяти и высокой параллельности ядер Tensix, TT-QuietBox 2 демонстрирует стабильную производительность даже при обработке длинных контекстов и сложных запросов. Это критически важно для разработки чат-ботов, аналитических агентов и систем поддержки принятия решений в реальном времени.
При масштабировании задач несколько станций могут быть объединены в кластер через стандартное сетевое оборудование с поддержкой высокоскоростных протоколов. Такая гибкость позволяет постепенно наращивать вычислительные ресурсы по мере роста проекта, избегая единовременных крупных инвестиций.
Применение в биоинформатике и научных расчётах
Помимо работы с языковыми моделями, TT-QuietBox 2 демонстрирует выдающиеся результаты в области вычислительной биологии. В качестве показательного примера производитель приводит задачу предсказания трёхмерной структуры белка с помощью модели Boltz-2. Один акселератор Blackhole формирует структуру из 686 аминокислот за 49 секунд — современный универсальный процессор справляется с аналогичной задачей примерно за 45 минут. Наличие четырёх независимых ускорителей позволяет параллельно моделировать несколько белковых структур, что ускоряет скрининг потенциальных лекарственных соединений и анализ мутаций.
Подобные вычисления традиционно выполнялись на специализированных серверах с GPU-ускорением, требующих выделенного помещения и квалифицированного обслуживания. TT-QuietBox 2 переносит эту мощность на рабочий стол исследователя, сокращая цикл «гипотеза — проверка — результат» и повышая оперативность научных открытий.
Для хранения промежуточных данных и результатов расчётов рекомендуется использовать быстрые NVMe-накопители. При организации долгосрочного архива имеет смысл интегрировать систему с внешними системами хранения, обеспечивая надёжность и масштабируемость инфраструктуры.
Практическая интеграция в рабочую среду
Несмотря на высокую вычислительную плотность, TT-QuietBox 2 спроектирована для эксплуатации в обычных офисных условиях. Система оснащена замкнутой системой жидкостного охлаждения (СЖО), которая эффективно отводит тепло от акселераторов при минимальном уровне шума. Питание осуществляется от стандартной розетки 220 В — нет необходимости в трёхфазном вводе или источниках бесперебойного питания промышленного класса.
Габариты устройства сопоставимы с компактным tower-сервером, что позволяет разместить его под столом или на полке без выделения отдельной серверной. При этом производительность сопоставима с решениями формата rack-серверов начального уровня, но без требований к монтажу в стойку и организации холодных/горячих коридоров.
В качестве операционной системы используется Ubuntu 24.04 LTS с долгосрочной поддержкой. Это обеспечивает совместимость с большинством инструментов разработки, контейнеризации (Docker, Podman) и оркестрации (Kubernetes). Открытый характер программного стека упрощает аудит безопасности и кастомизацию под специфические требования проекта.
Сравнение с традиционными решениями
| Параметр | TT-QuietBox 2 | Рабочая станция на GPU | Rack-сервер начального уровня |
|---|---|---|---|
| Пиковая производительность (ИИ) | 2654 Тфлопс (BlockFP8) | 800–1500 Тфлопс | 1200–2000 Тфлопс |
| Память GDDR6 | 128 Гбайт | 48–96 Гбайт | 64–128 Гбайт |
| Оперативная память DDR5 | 256 Гбайт | 128–256 Гбайт | 128–512 Гбайт |
| Энергопотребление | ~800 Вт | 1000–1500 Вт | 600–1200 Вт |
| Уровень шума | <35 дБ | 40–55 дБ | 50–70 дБ |
| Требования к помещению | Офисное | Офисное/серверное | Серверное |
| Ориентировочная стоимость | $10 000 | $12 000–$25 000 | $8 000–$20 000 |
Данные таблицы носят оценочный характер и могут варьироваться в зависимости от конкретной конфигурации и региона поставки. Для точного подбора оборудования под задачи вашего проекта рекомендуем обратиться за консультацией через форму на странице контактов.
Программная экосистема и совместимость
Tenstorrent предоставляет полностью открытый инструментальный набор для разработки под архитектуру Blackhole. Компилятор на основе LLVM, отладчик, профилировщик и библиотеки низкоуровневых операций доступны под лицензией Apache 2.0. Это позволяет инженерам не только использовать готовые решения, но и оптимизировать критические участки кода под особенности тензорных ядер.
Поддержка стандартов ONNX и TensorFlow Lite обеспечивает совместимость с моделями, обученными в других фреймворках. Для миграции проектов с GPU-платформ предусмотрена утилита автоматической конвертации графов вычислений с сохранением точности и производительности. Документация включает пошаговые руководства, примеры кода и готовые Docker-образы для быстрого старта.
Важным преимуществом является возможность запуска контейнеризированных рабочих нагрузок без модификации. Интеграция с Kubernetes позволяет управлять кластером из нескольких TT-QuietBox 2 как единым вычислительным ресурсом, распределяя задачи балансировщиком нагрузки и обеспечивая отказоустойчивость на уровне приложений.
Доступность и стоимость
Официальный старт продаж настольной ИИ-системы TT-QuietBox 2 запланирован на второй квартал 2026 года. Ориентировочная розничная цена составляет $10 000 без учёта налогов и доставки. Для корпоративных заказчиков и образовательных учреждений предусмотрены программы объёмного лицензирования и расширенной технической поддержки.
Учитывая высокий спрос на решения для локального развёртывания ИИ-моделей, рекомендуется заранее резервировать устройства через официальных партнёров. Специалисты помогут подобрать конфигурацию, согласовать сроки поставки и организовать пилотное внедрение в вашу инфраструктуру.
Для организаций, рассматривающих гибридные сценарии использования (локальная разработка + облачное масштабирование), актуальна интеграция TT-QuietBox 2 с существующими серверными мощностями. Такой подход позволяет оптимизировать совокупную стоимость владения и гибко распределять вычислительные ресурсы между этапами обучения и инференса.
Можно ли использовать TT-QuietBox 2 для обучения моделей с нуля?
Да, система поддерживает полное обучение моделей, однако наиболее эффективна она в сценариях дообучения (fine-tuning) и инференса. Для обучения моделей с нуля на датасетах свыше 100 ГБ рекомендуется использовать кластер из нескольких устройств или гибридную схему с облачными ресурсами.
Требуется ли специальная квалификация для обслуживания TT-QuietBox 2?
Базовая эксплуатация не требует узкоспециализированных навыков: установка драйверов, развёртывание контейнеров и запуск моделей выполняются через стандартные инструменты Linux. Для глубокой оптимизации кода под архитектуру Tensix желателен опыт работы с низкоуровневым программированием и тензорными вычислениями.
Совместима ли система с существующими пайплайнами MLOps?
Да, TT-QuietBox 2 интегрируется с популярными MLOps-инструментами: MLflow, Kubeflow, DVC. Открытый API и поддержка контейнеризации позволяют включать устройство в существующие процессы непрерывного обучения, тестирования и развёртывания моделей без изменения архитектуры пайплайна.
Каковы требования к электропитанию и охлаждению?
Система потребляет до 800 Вт в пиковой нагрузке и подключается к стандартной однофазной розетке 220 В. Встроенная СЖО обеспечивает эффективный отвод тепла при уровне шума ниже 35 дБ. Дополнительное охлаждение помещения не требуется, но рекомендуется обеспечить приток свежего воздуха в зоне размещения устройства.
Возможно ли масштабирование производительности в будущем?
Архитектура Tenstorrent поддерживает горизонтальное масштабирование: несколько TT-QuietBox 2 могут быть объединены в кластер через высокоскоростную сеть (10/25/100 GigE). Программный стек автоматически распределяет вычислительные задачи между узлами, обеспечивая линейный прирост производительности для параллелизуемых рабочих нагрузок.
Как интегрировать TT-QuietBox 2 в существующую ИТ-инфраструктуру
- Подключите устройство к электросети и локальной сети через порт 10/25 GigE. Убедитесь, что сетевое оборудование поддерживает Jumbo Frames для оптимизации передачи больших объёмов данных.
- Установите драйверы Tenstorrent и инструментарий разработки, следуя официальной документации для Ubuntu 24.04. При необходимости используйте предоставленные Docker-образы для изоляции среды.
- Настройте доступ к хранилищу данных: подключите локальные NVMe-диски или смонтируйте сетевые ресурсы через NFS/SMB. Для долгосрочного архива интегрируйте внешние системы хранения.
- Разверните модель или пайплайн с помощью поддерживаемого фреймворка (PyTorch, TensorFlow, ONNX). Используйте профилировщик для выявления узких мест и оптимизации загрузки ядер Tensix.
- При масштабировании добавьте дополнительные узлы в кластер и настройте оркестрацию через Kubernetes. Протестируйте балансировку нагрузки и отказоустойчивость перед запуском в продуктивную среду.
Появление настольной ИИ-системы TT-QuietBox 2 знаменует важный этап в демократизации высокопроизводительных вычислений. Сочетание открытой архитектуры RISC-V, специализированных тензорных ядер и продуманной инженерной реализации позволяет исследовательским командам и разработчикам получать серверный уровень производительности без инфраструктурных компромиссов. По мере роста спроса на локальное развёртывание ИИ-моделей подобные решения станут стандартом для проектов, где критичны задержка, конфиденциальность данных и гибкость развёртывания.
Для организаций, оценивающих переход на новые вычислительные платформы, ключевым фактором остаётся совокупная стоимость владения и скорость интеграции. Открытый стек Tenstorrent, совместимость с отраслевыми стандартами и возможность поэтапного масштабирования делают TT-QuietBox 2 привлекательным вариантом как для пилотных внедрений, так и для промышленной эксплуатации. При подборе оборудования под конкретные задачи рекомендуется провести бенчмаркинг на реальных рабочих нагрузках и проконсультироваться со специалистами по инфраструктурным решениям.
Поделиться статьёй:
Об авторе

Серверное оборудование · Практик-универсал
Инженер по серверному оборудованию, 8 лет в профессии. Настраивал и чинил серверы Dell, HP и Huawei — от небольших офисов до нагруженных дата-центров. Пишет гайды, которые сам хотел бы прочитать, когда начинал.
Все статьи автора →Похожие материалы

Американцы создали память, способную работать при 700 °C — для Венеры, реакторов и ИИ
Мемристоры для работы при 700 °C: как новая высокотемпературная память изменит ИИ-вычисления, космические миссии и серверные решения в экстремальных условиях.

Gigabyte X870E Aero X3D Dark Wood: материнская плата премиум-класса с отделкой под тёмное дерево для платформы AM5
Материнская плата Gigabyte X870E Aero X3D Dark Wood для AM5: VRM 20-фаз, DDR5-9000, PCIe 5.0, USB4, Wi-Fi 7. Детальный обзор и рекомендации по сборке.

Nvidia RTX PRO 4500 Blackwell Server Edition: однослотовый серверный GPU с 32 ГБ GDDR7 для ИИ-ускорения
Однослотовый серверный GPU Nvidia RTX PRO 4500 Blackwell SE с 32 ГБ GDDR7 и TDP 165 Вт для ускорения ИИ-инференса, аналитики и видеообработки в дата-центрах.