11 февраля 2021 г.

За время пандемии вопрос о том, надо ли бизнесу инвестировать в накопление и глубокую аналитику данных, окончательно сошёл с повестки дня даже для самых завзятых скептиков. Те, кто остаётся на плаву и даже умудряется расти в реалиях экономических неурядиц, достигают этого в немалой степени благодаря эффективной работе с большими информационными потоками. Данные в средних и крупных компаниях хранят на СХД, объёмы этих данных день ото дня растут, — значит, сегмент систем хранения процветает?

Так, да не так

В начале декабря IDC опубликовала данные по мировому рынку брендовых (ОЕМ) корпоративных СХД за третий квартал. И данные эти на первый взгляд противоречат очевидному росту потребности в хранилищах информации: объём рассматриваемого сегмента ИТ-рынка сократился за год на 1,4%, до 6,8 млрд долл. США. Более того, во II кв. 2020 г. спад оказался ещё более глубоким, — на целых 5,0% год к году.

Картина несколько меняется, если учесть неуклонное сокращение себестоимости условного 1 Тбайт данных за счёт поступательного удешевления как традиционных магнитных жёстких дисков, так и полупроводниковых накопителей. За III кв. 2020 г. суммарная ёмкость поставленных в мире ОЕМ СХД выросла до 18,9 Эбайт, — на 9,6% больше, чем за тот же период годом ранее. Предшествующий квартал в этом плане тоже показал неплохой рост, — на 5,1% год к году.

В денежном исчислении наиболее позитивные результаты демонстрировал рынок СХД, целиком построенных на флэш-накопителях (all-flash arrays, AFA). Отгрузки этих устройств выросли в III кв. на 0,5% год к году, до 2,7 млрд долл. (это 40% от всей долларовой ёмкости мирового рынка СХД за квартал). Кварталом ранее рост поставок AFA был ещё более впечатляющим, — на 7,7% относительно II кв. 2019-го. В то же время и гибридные СХД, и системы на жёстких дисках в деньгах демонстрировали спад различной степени интенсивности.

Получается, основанные на флэш-накопителях СХД и заказчиками востребованы в достаточной степени, и для канала наиболее привлекательны по причине своей достаточно высокой цены. Но ведь и AFA бывают разные. Для актуальных сегодня бизнес-задач — требующих не просто скоростной обработки внушительных массивов данных, но и эффективной машинной аналитики, и гибких возможностей масштабирования — подойдёт далеко не каждая система хранения.

Объективности ради

Каким вообще образом хранятся данные на СХД? Известны три основных типа размещения информации: блочный, файловый и объектный. Блочный — самый, пожалуй, простой в реализации; недаром он реализован для магнитных лент и жёстких дисков. Информация (скажем, записываемый на накопитель файл) разбивается на фрагменты-блоки фиксированной длины, а драйвер накопителя обеспечивает затем операционной системе и приложениям возможность доступа непосредственно к необходимой информации. По блочному принципу организовано хранение и в SAN.

Файловый принцип хранения — это представление всех записываемых на хранилище данных в виде иерархической структуры файлов и папок. Драйвер для взаимодействия с файловым устройством оперирует именно этими абстракциями высокого уровня, что упрощает для клиентских приложений поиск и использование нужных данных. По файловому принципу чаще всего организуются сетевые хранилища NAS.

Наконец, объектные хранилища отличаются от файловых и блочных так называемой «плоской» организацией адресного пространства. Здесь нет никакой иерархии папок — только объекты (файлы) с уникальными идентификаторами, позволяющими обращаться к ним напрямую. Чтобы отыскать нужный идентификатор в большом «плоском» пространстве за разумное время, необходимо высочайшее быстродействие СХД на самом нижнем, аппаратном уровне. Вот почему объектные хранилища чаще всего реализуются если не на AFA, то уж по крайней мере на гибридных системах.

Объектные СХД наилучшим образом масштабируются — как раз потому, что «плоское» адресное пространство не составляет труда поступательно расширять хоть до бесконечности. Эти же СХД отлично подходят для организации хранения неструктурированых данных: всё равно никакой иерархии с переходом по древам каталогов в них изначально не предусмотрено. Потому для задач накопления и обработки больших данных, для их быстрой и эффективной аналитики объектные хранилища — самый верный выбор. Что и подтверждается использованием именно объектных СХД для организации таких облачных информационных сервисов планетарного масштаба, как Facebook или DropBox.

Нужно больше AFA

В современных условиях заказчики, встающие на пути цифровизации своих ключевых бизнес-процессов, всё чаще сталкиваются с необходимостью работать именно с неструктурированными данными. Сведения о просмотрах карточек товаров в Интернет-магазинах, информация о перемещении флота грузовиков между складами и конечными точками выгрузки, многие сотни часов записей с камер наблюдения филиалов розничной сети по всему городу, — всё это примеры поступающих непрерывным потоком данных без какой-либо наперёд заданной структуры. Суметь точно и быстро извлечь из этих потоков имеющую реальную ценность информацию — значит повысить эффективность своего бизнеса, сократить издержки и опередить конкурентов.

И хотя гибридные (а тем более чисто дисковые) СХД по цене заметно привлекательнее, чем AFA, наиболее дальновидные заказчики по всему миру уже начинаю хотя бы задумываться о миграции критичных для бизнеса приложений на системы хранения, целиком построенные на флэш-накопителях. Об этом свидетельствует опубликованное недавно исследование, которое по заказу Scality SA проводила компания Enterprise Strategy Group (ESG).

Опрос охватил 205 ИТ-профессионалов со всего света, принимающих ответственные решения об организации данных на коммерческих предприятиях с числом сотрудников 1000 чел. и более. Среди этих предприятий 95% активно используют СХД для размещения (в основном неструктурированных) данных суммарной ёмкостью более 1 Пбайт, а 43% — более 25 Пбайт. Динамика увеличения объёмов сохраняемых данных в среднем по выборке составляет 34% ежегодно, — иными словами, каждые два с половиной года эти объёмы удваиваются.

Исследование ESG выявило, что принятие объектных AFA как ключевого для бизнеса инструментария пока всё-таки находится ранней стадии. Объектные хранилища данных с хотя бы частичным использованием флэш-накопителей применяют 95% участника опроса, но только 23% из них располагают хотя бы одним AFA. Однако есть и позитивный тренд: среди респондентов, которые пока не эксплуатируют AFA, 83% намереваются дать этой технологии шанс (по крайней мере — предметно изучить обеспечиваемые ею преимущества) в ближайшие 12 месяцев.

Универсальный ответ

С чем же связана столь высокая готовность заказчиков испробовать в деле не самые дешёвые (особенно в сравнении с чисто дисковыми СХД) системы AFA? В основном — с практическим опытом, порой довольно горьким, полученным в разгар пандемии COVID-19 и спровоцированных ею ограничительных мер. Порой вынужденно форсированная цифровизация, если она проводилась на не адекватной новым вызовам аппаратной базе, частенько оборачивалась потерями вместо ожидаемых прибылей. 77% опрошенных ESG объяснили свой интерес к AFA именно резким ростом рабочих нагрузок на имевшуюся до начала коронакризиса инфраструктуру.

Подобный интерес пока ещё не эксплуатирующих AFA компаний подогревается историями успеха их более прогрессивных коллег. Среди тех, кто уже использует хотя бы одно объектное хранилище на базе all-flash, 28% склонны рассматривать его воздействие на актуальные бизнес-процессы в своей организации как «коренным образом определяющее» (в отчёте использован термин game changer), а ещё 49% свидетельствуют о «значительности» этого воздействия.

Перечисляя важнейшие для себя достоинства объектных AFA, респонденты чаще всего упоминали следующие:

  • оптимизация разработки приложений,
  • ускорение развёртывания решений машинного обучения и искусственного интеллекта,
  • усовершенствование работы платформ бизнес-аналитики,
  • общий рост производительности ИТ-инфраструктуры предприятия,
  • одновременное со всем вышеперечисленным снижение ТСО инфраструктуры (за счёт более высокой по сравнению с HDD механической надёжности флэш-накопителей, сниженного потребления ими энергии и т. п.).

Исследователи отмечают, что объектные AFA находят сегодня применения в таких различных отраслях рынка, как доставка потокового видеоконтента, аналитика больших данных, хранение и обработка медицинских изображений (цифровых образов с рентгеновских аппаратов, КТ, МРТ и т. п.), резервирование бизнес-критичных данных корпоративного уровня. Объектные AFA оказываются незаменимыми для решения задач на краю больших облаков, для накопления и аналитики данных от масштабных инсталляций Интернета вещей, для локальной разработки приложений (DevOps). Словом, это чрезвычайно привлекательный продукт для продвижения в канале — и привлекательность его будет лишь расти по мере того, как всё больше заказчиков начнут осознавать необходимость масштабировать накопление неструктурированных данных и ускорить процессы их обработки.

Источник: Максим Белоус, crn.ru