8 декабря 2019
Новую веху в сегменте ИИ-кластеров масштаба 1000 PFLOPS открывают Huawei и PCL
29 ноября этого года компания Huawei и исследовательская организация Peng Cheng Laboratory (PCL) совместно представили 1-ю фазу проекта создания Peng Cheng Cloud Brain II, положив официальное начало процессу формирования ИИ-кластеров масштаба 1000 petaFLOPS (PFLOPS). Это событие ознаменовало достижение важной вехи в научно-исследовательской сфере отрасли вычислительных технологий Kunpeng. В основе Cloud Brain II лежит ИИ-кластер Huawei Atlas 900, функционирующий на базе процессоров Huawei Kunpeng и Ascend. Atlas 900 обеспечивает Cloud Brain II мощный вычислительный потенциал, оказывая поддержку базовым процессам исследований и изысканий в области искусственного интеллекта, включая разработку технологий компьютерного зрения, естественного языка, автономного вождения, умного транспорта и смарт-здравоохранения. На сегодняшний день вычислительная мощность Peng Cheng Cloud Brain составляет 100 PFLOPS. К следующему году этот показатель планируется увеличить до 1000 PFLOPS и выше.
«В сентябре этого года компания Huawei представила стратегию двухпроцессорных вычислений Kunpeng + Ascend. Вдохновленные этой концепцией, мы стремимся предоставлять миру максимальный вычслительный потенциал. Мы также представили самый быстрый в мире обучающий ИИ-кластер Atlas 900», — прокомментировал старший вице-президент компании и глава департамента облачных и ИИ-продуктов и сервисов Huawei Хоу Цзиньлун (Hou Jinlong).
«Сегодня мы с большой гордостью сообщаем, что Atlas 900 был выбран для реализации проекта Peng Cheng Cloud Brain II. Он станет фундаментом для новой разработки. Cloud Brain II представляет собой передовую платформу для исследований в области искусственного интеллекта. В рамках этого проекта PCL собрала впечатляющую команду ученых и специалистов по ИИ. Наша компания присоединяется к PCL, чтобы вместе возглавить процесс научных изысканий в новом интеллектуальном мире», — добавил он.
Г-н Хоу также подчеркнул: «Сегодня мы приступаем к 1-й фазе разработки Cloud Brain II. Уверен, что наши совместные усилия в самом ближайшем будущем позволят создать решение с вычислительной мощностью на уровне 1000 PFLOPS. И мы убеждены, что Cloud Brain II станет ведущей мировой платформой для ИИ-исследований».
Президент департамента интеллектуальных вычислений Huawei Майкл Ма (Michael Ma) отметил: «Наша компания создает платформу для ИИ-вычислений Atlas на базе процессоров Ascend, предоставляя широкий спектр модулей, плат, граничные станции, ИИ-серверы и кластеры. Наша комплексная ИИ-инфраструктура охватывает все сегменты цепочки «облако-граничная область-устройство», поддерживая полномасштабный процесс формирования логических выводов и глубинного обучения».
«Наш флагманский продукт Atlas 900 олицетворяет собой предел возможностей ИИ-вычислений в сегодняшнем мире. Сочетание Atlas 900 и Cloud Brain II откроет новую главу для ИИ-кластеров с мощностью в 1000 PFLOPS и раскрывает превосходный вычислительный потенциал для ускоренной интеллектуальной трансформации различных отраслей промышленности и бизнеса», — добавил г-н Ма.
Peng Cheng Cloud Brain — ключевой технологический центр в сфере искусственного интеллекта. Он предоставляет платформу для базовых научных исследований в области передовых технологий ИИ. На сегодняшний день, вычислительная мощность платформы составляет 100 PFLOPS, но уже в следующем году в рамках проекта Cloud Brain II этот показатель планируется повысить до 1000 PFLOPS.
Созданием Cloud Brain II — совместное детище PCL и Huawei. ИИ-кластер Atlas 900 на базе процессоров Huawei Kunpeng и Ascend обеспечивает ему превосходный вычислительный потенциал. Лаборатория PCL работает над созданием технологий Cloud Brain с мощностью в 1000 PFLOPS.
ИИ-кластер Atlas 900 «унаследовал» все технологические «ноу-хау», наработанные компанией Huawei за последнее десятилетие. Состоящий из тысяч ИИ-процессоров Ascend 910 комплекс осуществляет обучение модели классификации изображений ResNet всего за 59,8 сек. — на 10 секунд быстрее предыдущего мирового рекорда с такими же показателями точности. Мощный вычислительный потенциал Atlas 900 оказывает значительную поддержку научным исследованиям и созданию технологических инноваций, в частности в сферах изучения космоса, прогнозирования метеорологических условий, автономного вождения, а также разведки и добычи нефти. Преимущества и возможности Atlas 900:
Высокая вычислительная мощность: Сочетая в себе тысячи ИИ-процессоров Ascend 910, кластер демонстрирует производительность на уровне 256-1024 PFLOPS при половинной точности (FP16), что сопоставимо с вычислительной мощностью 500 000 ПК. Конструкция с СнК объединяет возможности ИИ-вычислений, общих вычислительных операций с функционалом I/O, заметно повышая эффективность процесса обучения.
Высокоскоростная кластерная сеть: поддерживает три типа скоростных сетевых интерфейса: Huawei Cache Coherence System (HCCS), PCIe 4.0 и 100G RoCE, сокращая задержку градиентной синхронизации на 10-70%, что, в свою очередь, обеспечивает качественный скачок в эффективности обучения моделей. Инновационный алгоритм интеллектуальной коммутации iLossless позволяет осуществлять обучение всего трафика сети в режиме реального времени с нулевыми пакетными потерями и сквозной задержкой на уровне микросекуннд.
Максимальное отведение тепла: в кластере Atlas 900 на уровне аппаратного шкафа используется замкнутая адиабатическая система, обеспечивающая коэффициент жидкостного охлаждения свыше 95% при эффективности энергопотребления системы (PUE) менее 1,1 (идеальный показатель PUE составляет 1,0).
На сегодняшний день, компания Huawei представила целый спектр продуктов на базе ИИ-процессоров Ascend 910 и 310, включая ИИ-кластеры Atlas 900 и Atlas 800, граничную ИИ-станцию Atlas 500, ускорительную плату Atlas 300 и модуль ИИ-ускорителя Atlas 200. Комплексный портфель решений Atlas обеспечивает высокую вычислительную мощность для обучения модулей и формирования логических выводов во всех сценариях цепочки «облако-граничная область-устройство».
В будущем Huawei планирует нарастить инвестиции и масштабы разработки инноваций в инфраструктурной области, создавая новые процессоры, операционные системы и базы данных для вычислительной отрасли Kunpeng, предоставляя интеллектуальные вычислительные технологии для Peng Cheng Cloud Brain и стремительно расширяя спектр прикладных сценариев применения ИИ-технологий.