23 октября 2020 г.

Александр Малинин

В непростых условиях пандемии компании всех размеров стараются сохранить бизнес. Для этого многие предприятия обращаются к методам массового автоматизированного анализа данных, или DataOps. Почему именно DataOps — путь к успеху в условиях современной экономики данных?

До 68% данных, доступных предприятиям, сегодня не используются. Об этом говорят результаты исследования, проведенного компанией IDC при поддержке Seagate Technology. Полученные данные опубликованы в отчете, озаглавленном Rethink Data: Put More of Your Business Data to Use («Эффективное использование бизнес-данных»). Упомянутый показатель, с одной стороны, свидетельствует о том, сколько предприятия теряют, а с другой — указывает на уникальную возможность для бизнеса. Использовать ее необходимо именно сейчас, когда, как отмечается в отчете, средний ежегодный рост корпоративных данных составляет 42%, как в периферийных системах, так и в магистральных сетях.

Безусловно, не все данные имеют одинаковую ценность. Приведем следующую аналогию: как рацион влияет на ваше здоровье? Ценность калорий, полученных в результате употребления зеленого салата или семги, не такая же, как питательная ценность рафинада. Из какого источника поступают калории, имеет значение. Точно так же ценность данных в составе обновления устаревшего программного продукта не аналогична ценности данных, касающихся только что зарегистрированного патента на изобретение; в одних наборах данных содержится меньше полезных сведений, чем в других.

Ценность данных зависит не только от источника, специфики и формата, но и от внешних факторов. В их числе — бизнес-цели компании, владеющей данными; ограничения, которые клиент наложил на использование данных, законодательство, регулирующее использование данных, и т. д. Все перечисленные факторы необходимо принять во внимание, чтобы можно было классифицировать данные и обеспечить их применение.

Постоянная полезная отдача

Для современных предприятий работа с данными — необходимое условие успеха. В компаниях, активно работающих с данными, хорошо знают, как их использовать максимально эффективно и с наименьшими затратами. Данные являются самым ценным активом таких предприятий. Очевидно, что чем их больше накапливает, например, производитель автомобилей-роботов, тем больше из этих данных можно извлечь полезных сведений. Между тем, в более традиционных отраслях к данным относятся как к «неизбежному злу», обеспечивая управление и необходимую защиту для предотвращения рисков и соблюдения требований регуляторов. При этом на все перечисленные процессы стараются тратить как можно меньше денег. Однако при подобном подходе упускается истинная ценность данных — как актива, который способен приносить пользу постоянно.

Предприятия, не прошедшие цифровую трансформацию, будут проигрывать в конкурентной борьбе. По данным издания Harvard Business Review, в среднем более 70% сотрудников имеют безосновательный доступ к данным, а аналитики 80% времени тратят только на поиск и подготовку данных. При этом регулярно случаются утечки данных, распространяются ошибочные наборы данных, а в компаниях для работы с данными нередко используются технологии, которые не отвечают современным требованиям. Поэтому сегодня вопрос о том, проводить ли цифровизацию компании, уже не стоит — необходимо только решить, как это сделать.

Можно вспомнить, что поскольку этим вопросом не озаботились в свое время в индустрии такси, вышло так, что ее захватили Uber, Lyft и другие операторы мобильных приложений. Противоположный пример — американская компания Looker, разработчик ПО бизнес-аналитики. Она сумела бросить вызов старожилам индустрии систем обработки данных, предложив масштабируемую платформу, которая позволяет всем пользователям организации получать постоянный поток информации, имеющей практическую ценность. В феврале 2020 года стартап Looker, который на тот момент существовал всего 8 лет, был приобретен компанией Google за 2,6 млрд долл.

Процесс глобальной цифровой трансформации, ускорившийся из-за пандемии, будет продолжаться, ведь технологии помогают решать самые сложные проблемы человечества. В качестве актуального примера можно привести проект поиска средств для лечения COVID-19 с помощью платформы распределенных вычислений Folding@home. Разумеется, данные могут использоваться и в преступных целях. И тем не менее технологии, применяемые в сфере медицины, связи и во многих других областях, гораздо чаще помогают решать проблемы, чем создают новые.

Как DataOps помогает извлекать пользу из данных

Что необходимо компании, чтобы оседлать волну цифровой трансформации, а не быть ею смытой? Чтобы заставить данные работать, владельцам предприятий предстоит решить 5 основных задач. Согласно опросу Rethink Data, это задачи следующие: обеспечение пригодности к использованию собранных данных; внедрение средств управления хранением данных; организация сбора необходимых данных; обеспечение безопасности данных и предоставление доступа к разрозненным данным.

Около 1500 руководителей предприятий из разных стран мира, принявших участие в опросе Rethink Data, подчеркнули, что решить все эти задачи можно путем внедрения методов DataOps. Согласно определению IDC, DataOps — это практика обеспечения связи между создателями данных и их потребителями. Аналитики компании Gartner, в свою очередь, описывают DataOps как центр сбора и распространения данных, который обеспечивает контролируемый доступ к системам обработки информации о клиентах и результативности маркетинга, сохраняя конфиденциальность и целостность данных с соблюдением ограничений их использования.

Большинство респондентов отметили, что DataOps имеет для них огромное значение, однако полноценное внедрение соответствующих процессов провели только в 10% организаций. DataOps в первую очередь подразумевает проведение в организации обучения работе с данными, а также классификации их по типам и определения назначения различных наборов данных. Задача при этом — уточнить, какие именно сведения организации требуется извлекать из данных. Кроме того, необходимо внедрение соответствующих технологий, в том числе средств автоматизации и виртуализации, которые помогут обнаруживать нужные данные и обеспечат доступ к ним. Конечная цель — избавиться от информационного болота и создать живые озера данных, наполненные полезными для компании сведениями.

Важно подчеркнуть, что внедрение DataOps всегда приводит к улучшению результатов в бизнесе. Среди преимуществ, которые обеспечивает DataOps, — повышение лояльности клиентов, увеличение выручки и чистой прибыли, экономия расходов, снижение текучки кадров и не только.

Таким образом, DataOps — это не только инструмент цифровой трансформации, но и механизм, который помогает выжить в конкурентной борьбе. Однако не стоит просто отдавать внедрение на откуп отделу ИТ. Во внедрении методик DataOps должны участвовать все топ-менеджеры компании и ее владельцы. Кроме того, возможно, понадобится специально ввести должность директора по данным (chief data officer).

Техническая реализация DataOps имеет колоссальное значение, причем соответствующее внедрение можно провести относительно легко — понадобится участие опытного архитектора ИТ-систем и внедрение средств виртуализации. Существует ряд готовых руководств, которыми можно воспользоваться, например доклад компании DataKitchen The Seven Steps of DataOps («Семь этапов внедрения DataOps») и The Definitive Guide to DataOps («Исчерпывающее руководство по DataOps») компании StreamsSets. Все необходимые технические средства можно приобрести — останется лишь ввести их в эксплуатацию.

Несколько сложнее будет решить проблемы там, где важен человеческий фактор. Чтобы внедрение DataOps прошло успешно, в организации необходимо провести тщательную разъяснительную работу по поводу цели нововведений. И в любом случае сегодня никак нельзя игнорировать пользу, которую DataOps может принести предприятию.

Источник: Александр Малинин, глава российского представительства Seagate