Компания Supermicro, Inc., поставщик комплексных ИТ-решений для ИИ, облака, хранения данных и 5G/Edge, представил готовый к развертыванию центр обработки данных с жидкостным охлаждением для ИИ, рассчитанный на облачные решения, которые вместе с вычислительными блоками SuperCluster компании, оптимизированными под программную платформу NVIDIA AI Enterprise для разработки и развертывания генеративного ИИ, ускоряют внедрение генеративного ИИ предприятиями различных отраслей. Вместе с системами Supermicro высотой 4U с жидкостным охлаждением недавно представленные NVIDIA графические процессоры Blackwell могут полностью использовать производительность каждого процессора 20 петафлопс при выполнении рабочих нагрузок ИИ и демонстрируют в 4 раза более высокую производительность при обучении ИИ и в 30 раз более высокую производительность при использовании для анализа, чем предыдущие графические процессоры, с дополнительным снижением затрат. В соответствии со своей стратегией «первый на рынке», Supermicro недавно анонсировала полную линейку продуктов на основе архитектуры NVIDIA Blackwell для новых систем NVIDIA HGX™ B100, B200 и GB200 Grace Blackwell Superchip.
«Supermicro сохраняет отраслевое лидерство в области создания и развертывания решений для ИИ с жидкостным охлаждением масштаба стоек, — сказал Чарльз Лян (Charles Liang), президент и генеральный директор Supermicro. — Центры обработки данных с жидкостным охлаждением могут быть практически бесплатными и приносить клиентам дополнительную выгоду за счет постоянного снижения потребления электроэнергии. С помощью программного обеспечения NVIDIA AI Enterprise наши решения оптимизируются для клиентов в разных отраслях, и мы предлагаем глобальные производственные мощности, имеющие эффективность мирового класса. В результате мы можем сократить время поставки готовых кластеров с жидкостным или воздушным охлаждением с системами NVIDIA HGX H100 и H200, а также решениями B100, B200 и GB200, которые скоро появятся. Наши решения жидкостного охлаждения масштаба стоек, от холодных пластин до распределительных блоков (CDU) и градирен, могут обеспечить снижение текущего энергопотребления центра обработки данных до 40 %».
На выставке COMPUTEX 2024 компания Supermicro представила свои будущие системы, оптимизированные под графические процессоры NVIDIA Blackwell, включая систему с воздушным охлаждением высотой 10U и систему с жидкостным охлаждением высотой 4U на основе NVIDIA HGX B200. Кроме того, Supermicro предложит систему высотой 8U с воздушным охлаждением на основе NVIDIA HGX B100 и стойку Supermicro NVIDIA GB200 NVL72, содержащую 72 взаимосвязанных графических процессора, объединенных коммутаторами NVIDIA NVLink Switch, а также новые системы NVIDIA MGX™, поддерживающие графические процессоры NVIDIA H200 NVL PCIe и недавно анонсированную архитектуру NVIDIA GB200 NVL2.
«Генеративный ИИ приводит к обновлению всего вычислительного стека — новые центры обработки данных будут использовать для ускорения графические процессоры и будут оптимизированы под ИИ, — сказал Дженсен Хуанг (Jensen Huang), основатель и генеральный директор NVIDIA. — Компания Supermicro разработала передовые решения для ускоренных вычислительных и сетевых решений NVIDIA, позволяющие оптимизировать глобальные центры обработки данных стоимостью триллион долларов для эпохи ИИ».
Быстрое развитие больших языковых моделей и непрерывное появление новых моделей с открытым исходным кодом, таких как Llama-3 компании Meta и Mixtral 8x22B компании Mistral, делают современные модели ИИ более доступными для предприятий. Необходимость упростить инфраструктуру ИИ и обеспечить доступность наиболее экономичным способом имеет первостепенное значение для поддержки нынешней головокружительной скорости революционного изменения ИИ. Созданная специально для облачного ИИ платформа SuperCluster компании Supermicro устраняет разрыв между присущим облаку удобством мгновенного доступа и портативностью, используя ПО NVIDIA AI Enterprise, позволяющее беспрепятственно перемещать проекты ИИ из пилотной среды в производственную среду любого масштаба. Это обеспечивает гибкость выполнения в любом месте с безопасно управляемыми данными, включая автономные системы или локальные крупные центры обработки данных.
При том что предприятия разных отраслей быстро экспериментируют с вариантами применения генеративного ИИ, Supermicro тесно сотрудничает с NVIDIA для обеспечения плавности и гибкости перехода от экспериментов и пробного использования приложений ИИ к развертыванию в производственной среде и крупномасштабному ИИ в центре обработки данных. Этот результат достигается за счет оптимизации на уровне стоек и кластеров с помощью программной платформы NVIDIA AI Enterprise, обеспечивающей плавный переход от первоначального исследования к масштабируемой реализации ИИ.
Управляемые службы требуют компромисса при выборе инфраструктуры, обмене данными и управлении стратегией генеративного ИИ. Микрослужбы NVIDIA NIM, входящие в состав NVIDIA AI Enterprise, позволяют использовать управляемый генеративный ИИ и преимущества развертывания моделей с открытым исходным кодом без недостатков. Универсальная среда выполнения анализа этого ПО с микросервисами ускоряет развертывание генеративного ИИ на основе самых разных моделей, от моделей с открытым исходным кодом до базовых моделей NVIDIA. Кроме того, NVIDIA NeMo™ позволяет разрабатывать пользовательские модели с курированием данных, расширенной настройкой и генерацией с расширенными возможностями поиска (RAG) для корпоративных решений. В сочетании с системами SuperCluster от Supermicro, готовыми для использования ПО NVIDIA AI Enterprise, набор средств NVIDIA NIM обеспечивает самый быстрый путь к масштабируемому, ускоренному развертыванию генеративного ИИ в производственной среде.