Высокоскоростная флеш-память для ИИ: SK hynix и SanDisk выводят HBF на новый уровень

Высокоскоростная флеш-память для ИИ: SK hynix и SanDisk выводят HBF на новый уровень

SK hynix и SanDisk объявили о запуске High Bandwidth Flash (HBF) — новой архитектуры флеш-памяти, ориентированной на задачи искусственного интеллекта и высокопроизводительных серверов. Проект нацелен на устранение узких мест хранения данных при обучении и выводе моделей, предлагая альтернативу традиционным NVMe-накопителям и оперативной памяти с более выгодным соотношением пропускной способности и стоимости.

Почему HBF важна для ИИ-инфраструктуры

Современные модели машинного обучения требуют огромных объемов данных и высокой скорости их обработки. Традиционные накопители NVMe и даже DRAM часто не успевают обеспечивать требуемую пропускную способность, особенно при развертывании крупных модельных конфигураций. HBF обещает заполнить этот провал: технология ориентирована на предоставление увеличенной полосы пропускания для флеш-памяти, что критично при параллельной работе многочисленных ускорителей и при обработке потоков тренировочных данных. В отличие от обычных SSD, HBF проектируется с фокусом на минимизацию латентности и увеличение количества одновременных подключений, позволяя серверам получать данные быстрее и с меньшими задержками.

Это особенно важно для рабочих нагрузок с высокой степенью параллелизма — например, тренировка больших нейронных сетей и обработка мультимодальных данных.

Технические особенности и преимущества

HBF сочетает в себе несколько ключевых решений, которые повышают её эффективность в задачах ИИ. Во-первых, архитектура оптимизирована для высокой пропускной способности на уровне интерфейсов и контроллеров, что уменьшает узкие места при чтении/записи больших массивов данных. Во-вторых, внимание уделено управлению параллельными запросами: система способна обрабатывать больше одновременных операций без значительного роста латентности. Производители также делают ставку на энергоэффективность и плотность хранения.

По сравнению с DRAM, флеш-память с HBF обеспечивает более выгодное соотношение стоимости и емкости, что делает её привлекательной для тех случаев, когда хранение больших наборов данных в оперативной памяти экономически нецелесообразно. Кроме того, HBF может выступать в роли буфера между хранилищем и оперативной памятью, разгружая последние при интенсивных рабочих нагрузках.

Интеграция с существующими решениями

HBF разрабатывается с учетом совместимости и простоты интеграции в существующие серверные экосистемы. Ожидается, что производители серверов и разработчики ПО смогут адаптировать свои платформы под новые характеристики памяти без радикальных изменений архитектуры. Это облегчает внедрение HBF в центры обработки данных и облачные среды, где требуется постепенное обновление компонентов.

Применение и перспективы

Применение HBF выходит за пределы исключительно тренировочных задач: технология полезна при инференсе на больших моделях, при потоковой аналитике, а также в сценариях с интенсивным доступом к данным, например, в системах рекомендаций и при обработке видео. Снижение затрат на хранение и повышение пропускной способности позволит организациям масштабировать свои ИИ-проекты быстрее и с меньшими капитальными затратами.

Что это значит для рынка

Появление HBF от лидеров отрасли, таких как SK hynix и SanDisk, может ускорить переход к более специализированным решениям хранения данных в ИИ-индустрии. Поставщики облачных услуг, центры обработки данных и крупные исследовательские лаборатории получат инструмент для снижения зависимости от дорогой DRAM и увеличения эффективности при работе с большими моделями. Конкуренция в сегменте высокопроизводительной памяти вероятно усилится, что приведет к дальнейшему снижению цен и появлению новых архитектурных подходов. В целом, High Bandwidth Flash представляет собой важный шаг на пути оптимизации хранения данных для ИИ: комбинация высокой пропускной способности, улучшенного управления параллелизмом и экономичной плотности емкости делает её перспективным компонентом серверных платформ нового поколения.