4 февраля 2019 г.

Увеличить
Рик Купман, технический руководитель подразделения HPC и AI по региону ЕМЕА бизнес-группы ЦОД Lenovo
Увеличить
Капелла Torre Girona, в которой размещается суперкомпьютер MareNostrum4
Увеличить
Примерно 3,5 тыс. вычислительных нод в здании капеллы смонтированы в отгороженном от её основного объёма пространстве для повышения эффективности теплоотвода.

Широко распространённые ЦОДы корпоративного класса призваны решать важные, но вместе с тем сравнительно узкие, частные задачи. Высокопроизводительные вычислительные системы вроде суперкомпьютера MareNostrum4, который специалисты Lenovo смонтировали в старом церковном здании в испанской Барселоне, обладают мощью, достаточной для того, чтобы справляться с поистине глобальными проблемами.

На первый взгляд может показаться, будто разделение вычислительных кластеров на системы корпоративного класса (enterprise) и высокопроизводительные (high-performance computing, HPC) несколько искусственно. Действительно, ведь и те, и другие строятся на базе однотипных процессоров, снабжаются схожими по производительности подсистемами оперативной памяти, накопителями и т, п.

На деле же разница есть, и довольно существенная. Проявляется она прежде всего в качестве и скорости соединений между отдельными узлами компьютерной системы (нодами). Для ЦОДов энтерпрайз-класса характерны каналы связи между отдельными серверными шкафами (и внутри каждого шкафа) пропускной способностью в считанные гигабиты в секунду. Внутри отдельной ноды вычисления могут идти с весьма высокой производительностью, но обмен информацией между нодами идёт с относительно невысокой скоростью.

Для подавляющего большинства задач корпоративного класса это совершенно не проблема. Унифицированные и сравнительно недорогие межсерверные соединения обеспечивают ЦОДу дополнительное преимущество: лёгкость масштабирования и обширные возможности виртуализации на базе всего доступного парка «железа». Однако целый класс всё более актуальных задач требует от вычислительных средств не только высокой производительности каждой отдельной ноды, но и чрезвычайно скоростного обмена данными между ними.

Прежде всего подобные требования выдвигают задачи обработки массивов больших данных, машинного обучения, искусственного интеллекта. С конца 2014 г., когда Lenovo приобрела бизнес IBM по разработке и выпуску х86-серверов, компания активно развивает направление НРС. По оценке Intersect360 Research, в 2018 г. глобальный рынок НРС-технологий и услуг достиг 36 млрд долл., увеличившись на 7,6% по сравнению с предшествующим годом.

На ближайшую пятилетку среднегодовые темпы прироста этого рынка оцениваются не менее чем в 4,2%, причём главным его двигателем станут потребности заказчиков в реализации всё новых проектов глубокого машинного обучения. Находить применение подобные проекты будут в самых разных отраслях, от фармакологии и ракетостроения до нефтегазовой сферы, климатологии и предиктивного анализа покупательских предпочтений.

В конце января 2019 г. европейское представительство Lenovo пригласило журналистов профильных изданий региона ЕМЕА в Барселону, где в суперкомпьютерном центре (Barcelona Supercomputing Center, BSC) развёрнута НРС-система MareNostrum4 производительностью 13,7 ПФлопс (трлн операций в секунду) на базе 3,5 тыс. вычислительных нод Lenovo ThinkSystem SD530. Система размещена на территории Политехнического университета Каталонии в здании выведенной из церковного обихода капеллы Torre Girona начала XX века. Это на данный момент второй по производительности в Европе и 13-й в мире суперкомпьютер, который используют для расчётов в областях наук о земле, медицины и биоинженерии, астрофизики и физики плазмы, материаловедения, нанотехнологий и т. п.

В последние годы НРС-системы всё более распространяются по миру по мере того, как заказчики начинают полнее осознавать их превосходство — в определённых областях применимости, разумеется, — по сравнению с привычными энтерпрайз-решениями. По оценке Intersect360 Research, только одна Lenovo в период с 2015 по 2018 г. нарастила на 8,5% количество именованных (вроде барселонской MareNostrum4) НРС-инсталляций своей разработки по всему миру. Доступ к высокопроизводительным компьютерным системам для решения задач оптимизации постепенно становится для самых различных отраслей бизнеса таким же жизненно важным ресурсом, как доступ к электроэнергии или банковскому кредитованию.

Обновлённый в 2017 г. BSC по праву носит название красивейшего в Европе суперкомпьютерного центра. Правда, пальму первенства в плане дружественного отношения к природе у него не так давно отобрал германский Leibniz-Rechenzentrum (LRZ, 19,5 ПФлопс, № 8 в глобальном списке суперкопьютерова «Топ500»), который благодаря новейшей технологии водяного охлаждения Lenovo Neptune экономит до 45% энергии по сравнению с инсталляцией той же производительности, снабжённой классическим воздушным теплоотводом. Но к 2020 г. и BSC планируется модернизировать и расширить, разместив новые серверные стойки в расположенном поблизости от капеллы служебном здании. Мощность обновлённого каталонского суперкомпьютера будет превосходить нынешнюю примерно в 20 раз, тогда как энергопотребление благодаря жидеостной системе охлаждения останется на разумном приемлемом уровне.

В ходе визита в BSC мы получили возможность пообщаться с Риком Купманом, техническим руководителем подразделения HPC и AI по региону ЕМЕА бизнес-группы ЦОД Lenovo, и задать ему ряд вопросов, связанных с суперкомпьютерными системами в целом, их практическими приложениями для рынка, а также с развитием этого сегмента вычислительных средств в России и мире.

CRN/RE: Почти 5 лет назад бизнес высокопроизводительных компьютерных систем (HPC) и серверов IBM был приобретён компанией Lenovo. Как это отразилось на канале поставок HPC? Как с тех пор менялся этот канал?

Рик Купман: Я три десятка лет до того проработал в IBM, так что переход под знамёна Lenovo происходил на моих глазах и с моим непосредственным участием. Могу сказать, что это не было поглощение одного бизнеса другим, — скорее, органичная интеграция. Соответственно, существовавший на тот момент в IBM канал, который имел дело с НРС, был встроен в более развитый, динамичный канал Lenovo. И это стало для моего подразделения большим преимуществом: в частности, потому, что значительно улучшилось положение с доступностью всевозможных «железных» компонентов для высокопроизводительных систем. Ассортимент, сроки поставки, качество — всё это изменилось в лучшую сторону.

Но самое важное, на мой взгляд, что в обновлённом канале поставок ощутимо сократилось время ожидания заказов для конечных клиентов. Совершенствование в этом отношении продолжается: на различных рынках по всему миру канал поставок Lenovo в последние несколько лет уверенно входит в первую пятёрку-семёрку по качеству и скорости реакции на запросы заказчиков.

Учитывая, какие продукты поставляет наше подразделение — а это высокопроизводительные системы суперкомпьютерного класса с приложениями искусственного интеллекта и машинного обучения, — добиться такого результата было непросто. Хочу отметить, что мы и сами используем собственные разработки — тот же самый ИИ на мощной аппаратной платформе — для оптимизации своего же канала поставок, для дальнейшего повышения качества обслуживания клиентов и взаимодействия с партнёрами.

И это, на мой взгляд, очень хорошо как для нас самих, так и для наших партнёров, и для крупных заказчиков, которым мы поставляем оборудование напрямую. Оптимизированный канал поставок повышает предсказуемость сроков исполнения заявок, насколько бы крупными (или, напротив, скромными по объёмам) те ни были. Конечному клиенту чрезвычайно важно знать, что заказанную систему в полностью готовом к работе сконфигурированном виде он получит, скажем, не позже чем через 6 суток после оформления заявки.

CRN/RE: С каждым годом всё больше клиентов делают выбор в пользу облачных инфраструктурных решений, отказываясь от локальных высокопроизводительных систем. Как такая перемена в предпочтениях отражается на бизнесе Lenovo в области HPC и AI?

Р. К.: На протяжении последних 2-3 лет мы наблюдаем, как всё больше заказчиков действительно перемещают часть вычислительных задач в облако. Но по большей части это довольно ограниченный круг задач, перенос которых на облачные серверы не высвобождает локально какие-то невероятные вычислительные ресурсы. В то же время я вижу — по опыту взаимодействия с каналом, — что спрос на НРС-решения уверенно растёт, как и запросы на производительность приобретаемых для локальной установки систем.

Дело тут вот в чём: есть задачи, которые требуют пусть серьёзных, но строго ограниченных сверху вычислительных ресурсов. Например, мощности в 3-5 серверных нод. И такие задачи без труда переносятся в облако. Совершенно другое дело, когда задача допускает масштабирование в огромных пределах: когда, в зависимости от вводных, для её решения может потребоваться от 5 единиц до 1 тысячи нод.

В этом случае — чтобы получить результат за приемлемое время — важно обеспечить не только доступ к нужному количеству нод, но и гарантированно высокую скорость обмена данными между всеми ними. То есть — минимальные задержки при передаче данных между отдельными нодами. Облачные сервисы с их развитой виртуализацией попросту не готовы гарантировать необходимо низкий уровень задержек, хотя само по себе увеличение числа доступных нод для них проблемы, как правило, не представляет.

Для огромного спектра задач, к решению которых привлекают НРС-системы, большие (миллисекундные) задержки при обмене данными между нодами недопустимы. Вот почему мы в Lenovo предлагаем клиентам, которые по тем или иным причинам не разворачивают у себя высокопроизводительные серверные решения, НРС как услугу. В настоящее время в ЕМЕА у нас 2 таких инсталляции, в Швеции и Великобритании. Это своего рода облачный (точнее, доступный через облако) суперкомпьютер, ноды которого гарантированно соединены между собой сверхскоростными магистралями, а их доступное клиенту количество с лёгкостью масштабируется в зависимости от потребностей.

Главная особенность такого решения, в отличие от типичного для сегодняшнего рынка облачного провайдера, как раз в том, что НРС как услуга гарантирует высочайшую скорость обмена данными между отдельными арендуемыми заказчиком нодами. Обычное облако с его развитой виртуализацией подобных гарантий предоставить не может, даже если формально вычислительная мощь отдельных его нод точно такая же, как у нашего сервиса. Иными словами, для задач с широким диапазоном масштабирования — для которых на несколько недель в году, скажем, заказчику потребуется тысяча нод вместо повседневных пяти, — обычные облачные сервисы не подходят. Тогда как предлагаемый нами вариант «НРС как услуга» — вполне.

CRN/RE: Такие высокопроизводительные системы, как и суперкомпьютерный центр Lenovo в Барселоне, — проекты, безусловно, уникальные по вычислительным возможностям. А каков типичный диапазон мощностей для НРС-решений Lenovo?

Р. К.: О, он весьма широк. Когда заказчику требуется поистине уникальное сверхмощное решение, мы как правило работаем с ним напрямую — и создаём в точности отвечающую его запросам инсталляцию. Менее масштабные НРС-проекты, которые реализуются через партнёров, могут включать по 3, по 5 вычислительных нод или более.

Здесь как раз многое зависит от бизнес-партнёра Lenovo: чем выше его финансовые возможности, чем более серьёзные финансовые риски он готов на себя принять, тем с более крупными заказчиками НРС-систем он в состоянии работать. Речь идёт о заказах объёмами до 5, максимум — 10 млн долларов США. На наш взгляд, перекладывать ответственность за ещё более крупные проекты исключительно на партнёра было бы неверно. И если заказчику требуется высокопроизводительная система от примерно полутора десятков до нескольких тысяч нод, мы чаще всего работаем с ним напрямую.

CRN/RE: Между НРС и «просто» высокопроизводительными компьютерными системами корпоративного класса есть принципиальная разница. Встречались ли в практике Lenovo случаи, когда заказчик изначально ориентировался на построение стандартного дата-центра, а затем уже в ходе реализации проекта приходил к выводу, что ему всё-таки требуется НРС? Или наоборот?

Р. К.: Чаще всего клиент с самого начала очень чётко представляет себе, какие именно вычисления будет производить на заказываемом оборудовании — и, соответственно, какого типа система ему необходима. НРС-решения отличаются повышенной плотностью вычислительных мощностей и непревзойдённой эффективностью, тогда как enterprise-оборудование более гибко и универсально.

Типичный сервер корпоративного класса размещается в корпусах высотой 1U или 2U и допускает значительную расширяемость в плане конфигурации: установку довольно обширного массива накопителей, например, или PCI-плат. Для НРС главное — плотность вычислительной мощности: в стандартном корпусе высотой 2U размещаются, как правило, целых четыре ноды. Так что в зависимости от того, что именно заказчику изначально нужно — высокая гибкость корпоративных серверов или же максимальная скорость обмена данными между нодами, — он и ориентируется на те или иные решения.

Обычно это сводится к тому, какого класса задачи собирается решать заказчик на приобретаемом оборудовании. Если сравнительно однотипные, но требующие сверхвысокой производительности, — это как раз случай НРС. Если же более разнообразные и не столь критичные к вычислительным ресурсам, — тогда разумнее выбирать серверные решения корпоративного класса. Безусловно, мы в Lenovo проводим консультации с заказчиками с самых ранних этапов проработки проекта, и всегда готовы подсказать, какое именно оборудование в том или ином случае подойдёт оптимальным образом.

CRN/RE: Что определяет в итоге путь, которым заказчик получает доступ к НРС-решениям Lenovo — прямые продажи или посредничество канального партнёра? Вы уже упоминали о стоимости решения, есть ли ещё какие-либо критерии?

Р. К.: Всё в каждом конкретном случае определяется индивидуально. В наибольшей степени имеет значение, как самому заказчику удобнее действовать. Если он обращается через партнёра, этот партнёр получает от нас всю возможную поддержку в плане проработки проекта, подбора оборудования, фиксирования его цены и т. п. Другое дело, если партнёр сам приходит и говорит, что есть на примете такой вот интересный и масштабный проект, однако в плане финансового обеспечения его, партнёра, ресурсов недостаточно, чтобы гарантировать поставку.

В этом случае мы заключаем так называемый prime-контракт: партнёр по-прежнему ведёт этот проект и вместе с заказчиком и с нами работает над его воплощением, однако финансовые гарантии предоставляет и финансовые риски несёт уже Lenovo, — и выручка между нами и партнёром делится, соответственно, иным образом, чем в ситуации рядовой канальной поставки. В любом случае, мы не стремимся выдавливать собственных партнёров с рынка и вырывать у них их рук даже самые выгодные контракты. Мы понимаем важность канала и ценим те отношения между партнёрами и их клиентами, которые в итоге обеспечивают нас всё возрастающим потоком заказов.

CRN/RE: Как организован канал продаж НРС-оборудования Lenovo в России?

Р. К.: По тем данным, что у меня есть, у нас в России 4 или 5 бизнес-партнёров. Помимо того, мы исполняем целый ряд крупных прямых контрактов с различными заказчиками, от государственных структур до нефтегазовых компаний, предприятий аэрокосмической отрасли, научных и образовательных учреждений и т. п. Львиная доля поставок нашего НРС-оборудования в Россию приходится именно на канал. Мы поддерживаем партнёров всеми доступными способами, от финансового обеспечения крупных сделок до технических консультаций и обучения специалистов на местах.

CRN/RE: Как сегодня развивается бизнес НРС-решений Lenovo в России?

Р. К.: Всегда есть возможности для роста; всегда можно добиться большего, я считаю. Но в целом динамика позитивная. В последнее время темпы роста несколько замедлены, поскольку на протяжении 2-3 лет поставки Lenovo НРС в Россию увеличивались особенно бурными темпами: можно сказать, мы в какой-то мере стали жертвами собственного же успеха. НРС-рынок в России в целом приближается к насыщению.

Становится чрезвычайно важно, чтó вендор способен предложить каналу и конечному заказчику в плане совершенствования уже развёрнутых решений и работы на перспективу с использованием новейших, ещё более передовых технологий. Здесь, я уверен, Lenovo проявляет себя с наилучшей стороны. В частности, мы постоянно совершенствуем энергоэффективность своих НРС-систем, сокращаем их углеродный след.

Один только перевод дата-центра на водяное охлаждение способен сократить потребление энергии на 40-50%. Мы разрабатываем не только ЦОДы целиком, но и собственные автономные стойки с водяным охлаждением, которые возможно устанавливать в стандартное окружение дата-центра и использовать наряду с другим оборудованием. И в плане энергосбережения российский рынок, должен сказать, представляется одним из наиболее перспективных: с учётом не самых высоких среднегодовых температур организовать «даровой» теплоотвод в окружающую среду от радиаторов водяных систем охлаждения на большей части территории России проще, чем в значительной части прочих стран региона ЕМЕА.

Источник: Максим Белоус, crn.ru