Компьютерной памяти никогда не бывает достаточно; тем более сегодня, когда цифровизация становится для бизнеса нормой — а для успешной цифровизации необходимо хранить и обрабатывать значительные массивы данных. Проведённое OCS исследование показывает, что объёмы корпоративных данных у российских заказчиков растут внушительными темпами, при этом возможностей расширять ИТ-инфраструктуру on-premises всё меньше: память и процессоры в глобальном дефиците, кредитные средства по-прежнему дороги. Что же чаще выбирают сегодня в этой связи российские клиенты: инвестировать в собственное «железо», полностью перебазироваться в облака — либо сочетать два эти подхода?

При всём богатстве выбора

«Если говорить именно про текущую практику, — замечает Егор Филиппов, владелец продукта „Машина больших данных Скала^р“, Группа Rubytech, — то массового ухода в публичные облака нет. Крупные заказчики продолжают делать ставку на собственную инфраструктуру — либо в классическом виде, либо в формате частного облака. Это связано с требованиями ИБ, регуляторов рынка, а также необходимостью полного контроля над корпоративными данными. В настоящее время заказчики переводят ИТ‑инфраструктуру в облачную модель, внедряя виртуализацию, автоматизацию и сервисное управление ресурсами. На практике многие компании предпочитают строить частное облако „у себя“ — на собственных мощностях, чтобы сохранить контроль над данными и соответствовать внутренним политикам безопасности. Однако анализ реальных проектов показывает: почти все крупные заказчики в итоге приходят к гибридному решению, сочетающему частное облако, собственную инфраструктуру и публичные сервисы для гибкости и масштабирования».

«Гибридная облачная модель, — продолжает эксперт, — применяется в ключевых отраслях с учётом специфики требований и задач. В банковском секторе ядро корпоративных хранилищ данных и отчётность сохраняются on‑prem. При этом тестовые среды, аналитические витрины и ML‑задачи переносятся в облако, что существенно снижает капитальные затраты на оборудование — особенно под пиковые нагрузки. В ритейле критически важные операционные данные, такие как транзакции и аналитика, остаются локально, тогда как сложные расчёты — например, прогнозирование спроса или оптимизация ассортимента, — выполняются в облачной среде, где проще масштабировать вычислительные мощности. В телекоме обработка потоковых данных ведётся on‑prem из‑за жёстких требований к задержкам (latency), а исторические массивы данных и задачи аналитики выносятся в облако для удобной и экономичной обработки».

erid:

Егор Филиппов, владелец продукта «Машина больших данных Скала^р», Группа Rubytech:

Объемы корпоративных данных ежегодно растут, а расширять ИТ-инфраструктуру становится все сложнее. Каждое расширение превращается в отдельный проект — с простоем на время работ и риском не угадать с мощностью: можно заложить слишком мало или переплатить за «запас», который в итоге не понадобится. Выигрывает не тот, у кого больше мощностей, а тот, кто умеет масштабироваться предсказуемо — без простоев и сюрпризов с производительностью. Именно эту задачу решают Машины больших данных Скала^р от Группы Rubytech: программно-аппаратные комплексы (ПАК), которые поставляются готовыми к работе и разворачиваются в ИТ-инфраструктуре заказчика за несколько дней.

Внутри — проверенный на совместимость стек технологий больших данных и российское серверное оборудование. Архитектура горизонтального масштабирования позволяет наращивать мощность пошагово: добавляете узел — и прирост производительности близок к линейному, без скрытых узких мест и простоя на реконфигурацию. Решение одинаково эффективно справляется и с пакетной обработкой петабайтных массивов, и с потоковой аналитикой в реальном времени.

ПАК отвечает основным требованиям к безопасности и регуляторике. Данные не покидают периметр заказчика, контроль доступа и аудит встроены в платформу. Все компоненты комплекса включены в реестры Минцифры и Минпромторга, а ключевое функциональное ПО сертифицировано ФСТЭК России — для организаций с жесткими требованиями импортонезависимости это обязательное условие.

Машины Скала^р уже работают в банках, телекоме и ритейле — там, где данных особенно много, нагрузки непредсказуемы, а цена простоя измеряется миллионами рублей. В финорганизациях они обеспечивают аналитические хранилища и ML-задачи при строгом соблюдении требований регулятора, в телекоме — обрабатывают потоковые данные с минимальными задержками, в ритейле — помогают прогнозировать спрос и управлять ассортиментом, не вынося чувствительные данные из контура компании.

Реклама ООО «СКАЛА-Р», ИНН: 9717098243

Вот и по словам Андрея Кузнецова, генерального директора ООО «РуБэкап» (входит в «Группу Астра»), российские коммерческие заказчики в условиях дефицита оборудования и дорогих кредитов чаще всего выбирают гибридный подход к ИТ-инфраструктуре, сочетая on-premises с облачными решениями: «Полный переход в облака или инвестиции только в собственное „железо“ встречаются реже из-за регуляторных требований и необходимости контроля над критическими данными. Гибридная модель доминирует, это позволяет оптимизировать затраты и справляться с ростом объёмов данных, особенно с учётом новых требований».

Ссылаясь на опыт своей компании, Александр Зенькович, руководителя направления хранилищ данных и больших данных «ДАР» (входит в ГК «КОРУС Консалтинг»), подтверждает, что на рынке наиболее популярен гибридный подход: «В гибридном подходе есть очевидные преимущества. Прежде всего, особенно если говорить о ML или тяжёлых разовых расчётах, выгоднее арендовать мощности в облаке (например, Yandex Cloud, VK Cloud, Cloud.ru), чем закупать серверы, которые 80% времени будут простаивать. Второй важный момент — это безопасность „ядра“ системы: чувствительные мастер-данные остаются в закрытом контуре (обеспечивая тем самым сохранность и соблюдение требований к ИБ), а в облако выносятся витрины данных или анонимизированные выборки. И ещё одно преимущество — скорость Time-to-Market: современные облака позволяют разворачивать платформу данных за дни и не тратить месяцы на поставку и настройку собственного „железа“».

«Перед внедрением того или иного решения, — говорит Вигель Антонов, директор технического центра Merlion, — многие партнёры приходят к нам со своими заказчиками, чтобы проверить на демостендах или оборудовании, выданном в самостоятельное тестирование, конкретные сценарии: „российский сервер + облачный бэкап“ или „старое импортное железо + новое российское ПО“. Исходя из запросов партнёров, интересующих их сценариев тестирования, большинство российских заказчиков сегодня выбирают гибридную модель, сочетание двух подходов облачного и on-premises. Обычно нагрузка распределяется так:

  • Критичные системы (ERP, расчёты, чувствительные данные) оставляют на своём „железе“, поскольку требования по безопасности и скорости отклика не всегда позволяют уйти в облако.
  • Пиковые нагрузки, бэкапы и архивы уводят в облака — это дешевле и быстрее, чем расширять on-premises в условиях дефицита „железа“ и дорогих кредитов. Ну и, конечно, в облаках развёртывают тестовые площадки, под них тем более не имеет смысла покупать ПО и оборудование.

При этом есть и компании, которые обрабатывают всё полностью на своём оборудовании — это в основном вопрос безопасности и регуляторных требований. Только облаками пользуются, в основном, компании предоставляющие некритичные сервисы и стартапы, которым нет смысла капитально вкладываться, поскольку бизнес может и „не взлететь“. Но основной тренд, судя по нашей статистике, — это переход на гибридные модели».

Как подчёркивает Руслан Сутягин, директор департамента систем хранения данных OCS, объёмы облачного размещения ограничиваются в основном политикой безопасности или требованиями законодательства и лишь во вторую очередь — стоимостью услуг: «Полного отказа от расширения корпоративного парка оборудования мы не видим, однако спрос стал снижаться вместе с ростом цен на носители и готовые системы хранения данных (СХД)».

«По моему опыту, — заявляет Никита Гладких, руководитель AIOps-платформы Artimate, — сегодня у российских заказчиков доминирует гибридный подход. Критичные системы, чувствительные данные и стабильные предсказуемые нагрузки чаще оставляют в собственном контуре, а задачи, где важны скорость запуска, эластичность, быстрый рост или тестирование новых сервисов, выносят в облако».

Прикладная аналитика

Данные мало сохранить: из них ещё нужно извлечь информацию, важную для ведения бизнеса. Как должно быть организовано локальное аналитическое хранилище данных, чтобы обеспечивать отказоустойчивость, информационную безопасность, эффективность работы аналитических систем — и реально ли сегодня построение таких хранилищ на аппаратной основе исключительно российского производства?

По справедливому замечанию Егора Филиппова, аналитическое хранилище данных (сегодня, правда, чаще используют термин «корпоративное хранилище данных», КХД) — это уже не одна система, а целая платформа: «В неё входят аналитическое ядро, слой хранения, потоковая обработка, инструменты управления данными. Ключевой принцип — горизонтальное масштабирование. Данные распределяются по узлам и обрабатываются параллельно, благодаря чему система масштабируется линейно, сохраняя стабильно высокий и прогнозируемый уровень производительности и надёжности. Чтобы система работала стабильно, при проработке архитектуры учитываются такие факторы, как организация репликации и зеркалирование данных, управление ресурсами и нагрузкой, а также полноценный ИБ-контур. В связи с требованием импортонезависимости компании все чаще строят такие платформы на российском оборудовании, которое по надёжности и производительности вплотную приблизилось к мировым аналогам».

«Локальное аналитическое хранилище сегодня разумно строить не как один большой монолит, — размышляет Никита Гладких, — а как многослойную платформу данных: отдельный слой для хранения „сырья“ и истории, отдельный контур для быстрых SQL-запросов и витрин, плюс каталог данных, контроль качества, разграничение доступа, аудит, резервирование и репликация. Построение таких решений на российском стеке уже реально: рынок показывает примеры полностью российских облачных и инфраструктурных связок, в том числе на базе серверов, СХД и сетевого оборудования Yadro. Но для самых тяжёлых высоконагруженных сценариев рынок пока сам признаёт ограничения: отечественные поставщики ещё не всегда закрывают все потребности крупных заказчиков, особенно по „тяжёлому“ сегменту производительности».

Руслан Сутягин указывает на то, что для хранения корпоративной информации бизнес, как правило, применяет трёхуровневую систему: «Первый уровень рассчитан на „горячие“ данные, которые используются активнее всего. Их размещают на быстрых флэш-массивах с разными вариантами дублирования — синхронной и асинхронной репликацией и др. Для менее востребованной информации компании выбирают носители помедленнее, однако с возможностью быстрого поиска и доступа. Редко используемые данные, такие как архивы и бэкапы, хранятся на ленточных накопителях или решениях типа virtual tape library (VTL). На сегодняшний день с использованием только российского оборудования можно реализовать первые два уровня хранения информации. Что касается аналитики, многое зависит от парка оборудования, внедрённого программного обеспечения и политики безопасности компании. Одни организации работают с „горячими“ данными, другие создают „закрытые“ контуры с необходимой для анализа информацией. Требования к аппаратной составляющей будут определяться бизнес-задачами компании».

«В отношении организации локального аналитического хранилища, — уточняет Вигель Антонов, — требования к отказоустойчивости, безопасности и производительности в этой сфере стандартные для enterprise-уровня и устоялись уже давно. Это значит: кластерная архитектура, резервирование компонентов, разграничение доступа и шифрование, плюс оптимизация решения в целом под аналитические запросы. По поводу исключительно российского „железа“ — картина неоднородная, сильно зависит от задач и их масштаба:

  • Серверы — уже вполне готовы. Российские производители (YADRO, „Аквариус“, AMUR и другие) предлагают надёжные серверные платформы, которые закрывают большинство типовых и даже высоконагруженных задач. Мы видим это по росту интереса заказчиков и по результатам наших тестов, прогресс за последние пару лет действительно существенный.
  • В сегменте СХД базовые и средние задачи российское оборудование уверенно решает, на нём вполне можно строить файловые хранилища, системы виртуализации и резервного копирования.
  • Если же говорить о high-end сегменте, где нужны сверхвысокая производительность (миллионы IOPS), поддержка протокола NVMe-oF, работа с ИИ-нагрузками, то по этому направлению российские вендоры ещё догоняют передовые западные и китайские решения. По оценкам экспертов, российские СХД закрывают примерно 80% потребностей рынка — но пока не самые сложные 20%».

Современное аналитическое хранилище строится не как классический DWH, а как Data Lakehouse-платформа, где объединяются процессы хранения и обработки, — на это обращает внимание Александр Зенькович: «Такой подход позволяет аккумулировать опыт реализации облачных систем, оптимизировать стоимость проекта, а также применять современные подходы к обработке и хранению данных. При этом бизнес получает такие преимущества, как отказоустойчивость за счёт распределённой архитектуры и репликации, отсутствие единой точки отказа и безопасности за счёт разграничения доступа (RBAC/ABAC), шифрования и мониторинга. Дополнительно повышаются производительность (разделение storage/compute, масштабируемые кластеры) и управляемость, так как появляются понятные метаданные, внедряется методология Data Governance, используется каталог данных. Построение хранилищ исключительно на российском „железе“ выглядит реализуемой задачей, но с оговорками. Возможны ограничения по производительности вычислений, критична правильная архитектура и оптимизация ПО и чаще используется комбинированный подход (российское аппаратное обеспечение + open source стек). При этом на отечественном рынке хорошо развивается бизнес ПАК-решений, которые призваны устранить эти сложности, подготовив общее решение с улучшенным взаимодействием аппаратной и программной составляющих».

«Локальное аналитическое хранилище данных организуется в многоуровневой кластерной архитектуре с репликацией, — разъясняет Андрей Кузнецов, — чтобы обеспечить отказоустойчивость, безопасность и эффективность OLAP-запросов. Сегодня такое хранилище реально построить исключительно на российском оборудовании, хотя могут встречаться отличия в сравнении с импортными аналогам в высоконагруженных сценариях».

Окончание следует


Источник: