Представленные в 2022 году системы PowerMax 2500 и 8500 представляют собой следующее поколение семейства PowerMax. По своей сути PowerMax 2500 и 8500 имеют высокопроизводительную кластерную архитектуру, предназначенную исключительно для обработки огромных объемов операций хранения данных и данных из современных приложений. Четыре ключевых компонента кластерной архитектуры PowerMax — это вычислительные узлы; корпуса динамических носителей (DME); динамическая ткань, которая связывает элементы вместе; и внутреннее системное программное обеспечение PowerMaxOS 10. Архитектура кластеров PowerMax 2500 и 8500 обеспечивает следующие преимущества без необходимости использования дополнительного оборудования, программного обеспечения или лицензирования:
- Высокая надежность и отказоустойчивость: все узлы в PowerMax могут получать доступ к вводу-выводу приложений и предоставлять ресурсы для их обработки, что делает его по-настоящему общей системой, работающей в режиме «активный-активный». В случае сбоя узла операция отработки отказа не требуется, как в случае с активными/пассивными системами. PowerMaxOS 10 автоматически перенаправит операции ввода-вывода неисправного узла на другие узлы. Так как отработка отказа не требуется, нет необходимости настраивать устройство кворума для защиты от таких проблем, как «Split-brain».
- Простота: все вычислительные узлы и DME в системе PowerMax отображаются для пользователя как единое целое. Пользователю не нужно входить в систему для разделения отдельных узлов для управления или настройки системы PowerMax. Управление всей системой осуществляется с помощью пользовательского интерфейса Unisphere for PowerMax на основе HTML5 и/или REST API. Эти инструменты предоставляют простой в использовании интерфейс для управленческих действий и операций мониторинга, которые имеют решающее значение для нужд организации.
- Полностью автономная работа: PowerMaxOS 10 управляет всеми системными ресурсами автономно, непрерывно выполняя диагностику, а также очищая и перемещая данные внутри системы для максимальной производительности и доступности в режиме 24x7. Нет необходимости вручную настраивать балансировку нагрузки между узлами, так как PowerMaxOS 10 автоматически решает, какой узел будет обрабатывать входящие данные ввода-вывода, в зависимости от местоположения и доступности ресурсов.
- Прогнозируемая производительность и масштабируемость: по мере увеличения требований к вычислительным ресурсам вы можете «масштабировать» систему PowerMax, добавляя узлы без прерывания работы, чтобы обеспечить предсказуемое линейное увеличение производительности и вычислительной мощности. По мере увеличения требований к емкости можно детально масштабировать систему, используя приращения одного диска. Это позволяет PowerMax масштабироваться в соответствии с требованиями приложения, а не системной архитектуры. Архитектура также обеспечивает целостную масштабируемость программного обеспечения; PowerMax может поддерживать 64 тыс. устройств, представляемых хостом, более 65 миллионов моментальных снимков и 2 048 групп удаленной репликации с другими системами.
Вычислительные узлы, DME и программное обеспечение PowerMaxOS 10 обеспечивают основу для по-настоящему активного и общего решения для корпоративных центров обработки данных. Связующим звеном, которое связывает все эти компоненты воедино и позволяет PowerMax предоставлять эти преимущества клиентам, является внутренняя динамическая коммутационная сеть.
Динамическая коммутационная сеть PowerMax
Как PowerMax 2500, так и 8500 используют полную сквозную внутреннюю топологию NVMe-oF (Non-Volatile Memory Express over Fabrics) между вычислительными узлами и DME. Эти топологии NVMe-oF называются PowerMax Dynamic Fabric.
Основные элементы
Dynamic Fabric превращает вычислительные и серверные элементы хранилища в отдельные независимые конечные точки в большой внутренней структуре хранилища. Каждая конечная точка в этой структуре имеет два порта, при этом каждый порт подключен к физически изолированной структуре — структуре A или структуре B — для обеспечения избыточности. Эти отдельные конечные точки вычислений и хранилища можно поместить в общие пулы ресурсов, разделив хранилище и вычислительные ресурсы в системе. В этой архитектуре все конечные точки вычислительных узлов могут получить доступ ко всей общей памяти на всех других вычислительных узлах с помощью высокоскоростного протокола RDMA системы. Кроме того, все конечные точки вычислительных узлов могут получить доступ ко всем конечным точкам хранилища и твердотельным накопителям в DME с помощью высокоскоростного протокола NVMe-oF системы. Такой доступ ко всей общей памяти, конечным точкам хранения данных и твердотельным накопителям DME создает по-настоящему активную/активную и общую системную архитектуру. Такое дезагрегирование системы разделяет вычислительные ресурсы и хранилище, чтобы их можно было масштабировать и подготавливать независимо друг от друга в соответствии с требованиями приложений, а не в соответствии со строгими требованиями к архитектуре системы. Чтобы обеспечить эту общую несвязанную архитектуру, Dynamic Fabric предоставляет системе следующие ключевые элементы:
- Возможность разделения доступа к памяти между узлами
- Высокоскоростное взаимодействие между компонентами кластера
- Сквозная проверка согласованности данных на основе SCSI T10-DIF Protection Information, которая защищает от ошибочной передачи и повреждения данных
Разделяемая память
В системе PowerMax используется архитектура «активный/активный, общий доступ ко всему». Это включает в себя совместное использование содержимого памяти, когда каждый узел может получить доступ к данным в памяти другого узла. В PowerMax это делается с помощью удаленного прямого доступа к памяти (RDMA). RDMA — это возможность чтения и записи в память на внешнем вычислительном узле без прерывания обработки процессоров на этом узле. RDMA обеспечивает высокую пропускную способность и низкую задержку передачи данных между памятью двух вычислительных систем, что очень важно в высокопроизводительных кластерных вычислительных системах, таких как PowerMax. С помощью RDMA все узлы PowerMax могут получать доступ к содержимому памяти любого другого узла в системе, как если бы она была их собственной. Возможность доступа каждого узла к памяти других узлов с помощью RDMA превращает общую емкость кэша в системах PowerMax в по-настоящему общий пул ресурсов, называемый глобальным кэшем PowerMax.
Высокоскоростная соединительная матрица
Обмен данными PowerMax RDMA подвержен задержке коммутационной сети, что делает PowerMax системой неоднородного доступа к памяти (NUMA). Ключевое требование к глобальному кэшу PowerMax (и системам NUMA в целом) заключается в том, что коммутационная сеть, передающая межузловые соединения RDMA, должна иметь чрезвычайно низкую задержку и высокую пропускную способность. По этой причине PowerMax использует протокол InfiniBand (IB) в качестве основной коммутационной сети между узлами. IB — это коммутационная технология и набор протоколов, которые чаще всего используются в средах высокопроизводительных вычислений (HPC), таких как приложения Уолл-стрит для торговли в реальном времени и анализа рисков. Он используется в этих средах, потому что изначально обеспечивает:
- Высокоэнергоэффективная коммутационная сеть с высокой пропускной способностью и низкой задержкой: в PowerMax коммутационная сеть IB работает в режиме подключения, где одна линия может передавать 100 Гбит/с с MTU 2 МБ. Передача данных по одной линии более эффективно, чем передача данных по нескольким каналам меньшего размера, так как за один тактовый цикл передается больше данных, что требует гораздо меньше вычислительных ресурсов для передачи данных. Исследования показали, что при работе в подключенном режиме IB более чем на 70% более энергоэффективна на каждый отправленный байт, чем другие варианты коммутационной сети RDMA, такие как Ethernet: Evaluation Energy Efficiency of Gigabit Ethernet and Infiniband Software Stacks in Data Centers (исследование IEEE).
- Масштабируемость: IB может поддерживать десятки тысяч конечных точек коммутационной сети в плоской сети с одной подсетью. Таким образом, вы можете масштабировать дезагрегированную архитектуру PowerMax, добавляя независимые конечные точки вычислений и хранилища в структуру без необходимости добавлять дополнительные подсети и без дополнительных штрафов за задержку.
- Высокий уровень безопасности: протокол реализован аппаратно, а атрибуты связи настраиваются централизованно таким образом, чтобы программные приложения не могли получить контроль над ними и злонамеренно подделать или изменить эти атрибуты.
- Отказоустойчивость: передача данных RDMA может быть защищена с помощью информации о защите SCSI T10-DIF. Это позволяет обнаруживать повреждение данных из многих источников, а благодаря архитектуре резервирования PowerMax всегда можно сослаться на правильные данные.
Реализация
Используя RDMA и NVMe-oF с архитектурой IB Fabric, PowerMax Dynamic Fabric обеспечивает высокий уровень производительности, масштабируемости, эффективности и безопасности, которые требуются корпоративным клиентам. Реализация Dynamic Fabric для достижения этих результатов отличается в PowerMax 2500 и PowerMax 8500.
Система PowerMax 2500
PowerMax 2500 может масштабироваться до двух пар узлов. Каждая пара узлов поставляется с собственным разъемом PCIe DME с прямым подключением. Ключевой архитектурной частью PowerMax 2500 Dynamic Fabric является использование технологии PCIe multihost. В случае PowerMax 2500 мультихост PCIe позволяет обоим узлам совместно использовать внутренний адаптер хост-канала (HCA) PCIe IB 100 Гбит/с, создавая высокоскоростную коммутационную матрицу между узлами для связи RDMA с низкой задержкой. Для передачи данных между узлами и подключаемыми к ним модулями PCIe DME используется 32-канальная матрица NVMe/PCIe x32.
Конфигурация Dynamic Fabric на PowerMax 2500 позволяет системе обеспечить производительность и масштабируемость в компактном корпусе. Это обеспечивает более высокий уровень эффективности, поскольку PowerMax 2500 может хранить до 7 раз больше емкости в половине пространства стойки (более 4 ПБ в 5U) по сравнению с PowerMax 2000 предыдущего поколения. Наряду с компактным дизайном, 2500 поддерживает полный набор разнообразных служб данных для открытых систем, мейнфреймов, файловых и виртуальных сред.
Сервер PowerMax 8500
PowerMax 8500 Dynamic Fabric — это коммутируемая коммутационная сеть NVMe/IB со скоростью 100 Гбит/с на линию, которая используется для всех соединений RDMA и передачи данных NVMe. Это отличается от PowerMax 2500, где данные NVMe передаются от узла к подключенному к PCIe DME с использованием NVMe/PCIe. В PowerMax 8500 каждый вычислительный узел и хранилище DME обрабатываются как уникальные конечные точки в структуре, что позволяет добавлять их в структуру независимо друг от друга, обеспечивая при этом доступ ко всем остальным конечным точкам. Системные узлы и DME полностью дезагрегированы и динамически подключены, что позволяет масштабировать вычислительные ресурсы до восьми пар узлов и масштабировать хранилище до восьми DME, обеспечивая более 18 ПБэ в одной системе.
Еще одним отличием от Dynamic Fabric в PowerMax 8500 является использование интеллектуальных модулей DME. DME подключаются к коммутационной сети NVMe/IB с помощью двух плат управления каналами (LCC), каждая из которых имеет два порта IB 100 Гбит/с. Каждая плата LCC имеет собственный блок обработки данных (DPU) NVIDIA BlueField, позволяющий выполнять критически важные функции управления хранилищем, такие как разгрузка коммутационной сети. LCC с их DPU, по сути, превращают каждый PowerMax 8500 DME в уникальную подсистему хранения данных NVMe с двумя контроллерами в коммутационной сети.
Заключение
Dynamic Fabric — это то, что позволяет PowerMax 2500 и 8500 функционировать как настоящая архитектура «активный/активный» для корпоративной системы хранения данных. С помощью этой нативной архитектуры клиенты могут:
- Обеспечить высокий уровень отказоустойчивости и отказоустойчивости без необходимости использования дорогостоящего дополнительного оборудования и программного обеспечения
- Удовлетворить требования к рабочим нагрузкам с меньшим энергопотреблением и меньшим количеством ресурсов
- Вертикальное и горизонтальное масштабирование без ручного вмешательства для балансировки нагрузки или других операций кластеризации серверной части, которые выполняются автоматически PowerMaxOS
Dynamic Fabric является ключевым компонентом, который обеспечивает соединения с низкой задержкой и высокой пропускной способностью, необходимые для связи RDMA между узлами, а также для обширной обработки данных NVMe и перемещения между узлами и DME в системе. Dynamic Fabric является основой PowerMax 2500 и 8500. Это позволяет системам обеспечивать производительность, безопасность, эффективность и масштабируемость, необходимые для современного центра обработки данных.
Товары
- Комментарии