Окончание. Начало здесь

Корпоративные данные следует резервировать — в том числе в облаке, с применением провайдерских сервисов резервного копирования (Backup as a Service, BaaS) и аварийного восстановления данных (Disaster Recovery as a Service, DRaaS). Насколько велика востребованность таких облачных сервисов у российских заказчиков?

Сберечь и сохранить

«Востребованность, безусловно, есть, — признаёт Егор Филиппов, владелец продуктовой линейки Машин больших данных Скала^р (Группа Rubytech). — Средний бизнес активно использует Backup as a Service и Disaster Recovery as a Service в публичных облаках, потому что это быстрее и дешевле, чем строить свою резервную площадку. Enterprise-сегмент подходит к этому осторожнее — облако используется в основном для резервного копирования и как внешний DR-контур, но не как основной контур хранения критичных данных. Ключевой вопрос здесь — гарантии безопасности: сохранность данных и контроль доступа к ним, включая каналы связи с облаком».

«Важно понимать, — продолжает эксперт, — SLA, предоставляемые провайдерами, регламентируют лишь доступность сервиса, но не дают гарантий сохранности данных. Такие меры, как репликация и геораспределение, эффективно защищают от инфраструктурных сбоев и минимизируют риски потери данных из‑за отказов оборудования. Однако они не обеспечивают автоматического решения проблемы доступа к данным — например, в случаях кибератак, ошибок конфигурации или юридических ограничений. Единственная реальная гарантия — это шифрование данных на стороне заказчика, учитывая особенность самих данных и управление ключами вне облака».

Спрос на облачный бэкап и аварийное восстановление в России за последний год сильно вырос, — об этом говорит Александр Зенькович, руководитель направления хранилищ данных и больших данных «ДАР» (входит в ГК «КОРУС Консалтинг»): «Основная причина — рост киберугроз и атак шифровальщиков. Но чтобы пользоваться такими услугами, необходимо соблюдать ряд требований — от юридических, с прописанными SLA по финансовым обязательствам провайдера за доступность данных, до технических, связанных с возможностью реализовать шифрование данных на стороне клиента перед отправкой (Client-side encryption). Кроме того, важно соблюдать требования по сертификации площадок согласно положениям ФСТЭК о работе с персональными данными (152-ФЗ) и КИИ. Также важно работать в формате мультиоблачности: использовать два независимых облака, поскольку это исключает риск vendor lock-in и повышает отказоустойчивость».

«Да, бэкапы в облаке, судя по запросам партнёров, востребованы, — соглашается Вигель Антонов, директор технического центра Merlion. — Российский облачный рынок, по оценкам аналитиков, растёт где-то на 30% в год, сегмент BaaS (Backup-as-a-Service) — приблизительно с такой же скоростью или даже немного быстрее. В enterprise-сегменте пока более популярны западные решения, но их все труднее обновлять и поддерживать, поэтому растёт доля отечественных продуктов, особенно в сегменте базовых и средних задач».

По свидетельству Андрея Кузнецова, генерального директора ООО «РуБэкап» (входит в «Группу Астра»), рынок демонстрирует ежегодный прирост на 30% и более: «С долей отечественных решений около 50%, особенно после атак вирусов-шифровальщиков в 2024–2025 годах. Провайдеры предлагают гарантии сохранности чувствительных данных через аттестаты ФСТЭК/ФСБ по 152-ФЗ, шифрование и изоляцию в мультиоблачных средах».

«Спрос на BaaS и DRaaS у российских заказчиков заметно растёт, — подтверждает Никита Гладких, руководитель AIOps-платформы Artimate, — причём уже не как на „дополнительную опцию“, а как на часть стратегии киберустойчивости и непрерывности бизнеса. Этому способствуют сразу несколько факторов: рост объёмов данных, гибридизация инфраструктуры и участившиеся атаки шифровальщиков».

ИИ спешит на помощь

Как широко применяются российскими заказчиками средства искусственного интеллекта для задач накопления, сжатия и анализа сохраняемых данных? Помогают ли уже ИИ-инструменты существенно снизить объёмы «сырых» данных, оперативно извлекая из них значимую для бизнеса информацию прямо по мере накопления? Или же полный отказ от сохранения «сырых» данных, пусть и манящий значительным сокращением расходов, не представляется сколько-нибудь адекватной стратегией в обозримой перспективе?

Егор Филиппов уточняет, что ИИ, хотя уже и применяется при работе с данными, подходит далеко не для всех задач: «Сегодня его активно используют на этапе обработки и анализа данных, однако данный инструмент не заменяет базовый слой хранения данных, который по‑прежнему необходим для надёжного и долгосрочного размещения информации. Есть практики, где ИИ помогает снижать объёмы; например, при потоковой обработке часть данных отфильтровывается, агрегируется или дедуплицируется еще на этапе загрузки данных в хранилище. Это действительно уменьшает нагрузку на систему хранения. Фактически, это оптимизация хранилища данных, которые загружают в КХД для дальнейшего анализа. При этом полный отказ от хранения сырых данных в реальных проектах не практикуется: они остаются источником истины и нужны для аудита, переобучения моделей и проверки. Поэтому в архитектуре ничего принципиально не меняется: сырые данные сохраняются, просто уходят в более дешёвый слой хранения, а ИИ используется поверх них, чтобы быстрее извлекать ценность».

ИИ всё шире, по свидетельству Никиты Гладких, привлекают к интеллектуальной обработке корпоративных данных: «Для классификации, поиска аномалий, дедупликации, извлечения значимых сигналов и ускорения аналитики. Бизнес всё активнее инвестирует в ИИ и масштабирует инфраструктуру под такие задачи, что показывает переход от экспериментов к прикладным сценариям, в том числе в логике AIOps. Но полный отказ от хранения „сырых“ данных в обозримой перспективе я бы считал слишком рискованной стратегией. Современные платформы данных по-прежнему исходят из того, что raw-слой нужен: для перепроверки гипотез, аудита, расследования инцидентов, дообучения моделей и переноса части аналитики из „горячего“ контура в более дешёвое хранение. Поэтому реалистичный путь сейчас — не отказываться от сырья вообще, а удешевлять его хранение: сжимать, дедуплицировать, переносить в дешёвые слои и одновременно использовать ИИ для раннего выделения действительно значимой для бизнеса информации».

«Российские заказчики активно внедряют ИИ для задач накопления, сжатия и анализа данных, — подтверждает Андрей Кузнецов, — особенно в финансах, ритейле и госсекторе, где это уже снижает объёмы хранения за счёт автоматизированной экстракции бизнес-ценных инсайтов. ИИ-инструменты действительно позволяют оперативно извлекать значимую информацию из „сырых“ данных по мере их поступления, но полный отказ от хранения исходных объёмов рискован из-за регуляторных нужд, таких как аудит, compliance и потенциальных будущих сценариев анализа».

Как уточняет Александр Зенькович, на данный момент ИИ действительно не применяется для «сжатия» данных: «ИИ-инструменты можно использовать для „умного“ архивирования: алгоритмы определяют редко используемые данные и автоматически переносят их в „холодные“, дешёвые хранилища — тем самым снижая TCO (стоимость владения). Полный же отказ от сохранения „сырых“ данных (Raw Data) в пользу обработанных агрегатов видится тупиковым путём: история развития аналитики показывает, что завтра могут понадобиться те признаки, которые сегодня кажутся лишними. Удалять „сырые“ данные — значит лишать компанию фундамента для обучения будущих ИИ-моделей».

«Популярность искусственного интеллекта для анализа корпоративной информации растёт, — отмечает Руслан Сутягин, директор департамента систем хранения данных OCS. — Однако на данном этапе российские заказчики, скорее, накапливают опыт и обучают ИИ-модели. Говорить о практическом применении технологии пока всё же рано».

Источник: