Что такое концепция доступности данных с точки зрения ИТ-специалиста? Основными используемыми показателями являются RPO (recovery point objective) и RTO (recovery time objective).

RPO определяет допустимую потерю данных. То есть информационная система должна обеспечивать защиту данных от потери выше приемлемого уровня. RTO определяет допустимое время восстановления данных. То есть информационная система должна обеспечивать возможность восстановления своей работы в приемлемый срок.

Чем меньше показатели RPO и RTO при потере данных, тем меньшее время простоя сервиса обеспечивает решение по защите, тем дороже такая защита стоит. Достаточно сильно на эти показатели влияет не столько программная часть решений по резервному копированию информации, сколько аппаратная. Именно поэтому в описанном ниже кейсе было использовано оборудование Hewlett Packard Enterprise (HPE). Благодаря высочайшей производительности решения HPE позволяют укладываться в отведенное время резервного копирования, а также соблюдать соглашения о скорости восстановления данных.

Восстановление работоспособности сервиса и восстановление данных — это две связанные между собой вещи, которые почти всегда не могу жить друг без друга. В большинстве случаев неприемлемо восстановить работу сервиса, потеряв при этом все накопленные данные. RPO и RTO являются важными показателями, используемыми в соглашении об уровне обслуживания (Service Level Agreement, или SLA)

Рассмотрим кейс системного интегратора СОНЕТ по обеспечению требуемых показателей RPO/RTO для непрерывности бизнеса компании ООО «АБИ Молл».

О заказчике

ООО «АБИ Молл» успешно развивается на территории Владимирского региона уже более 11 лет. Основными направлениями деятельности компании являются девелопмент и управление коммерческой недвижимостью. На момент начала работ ключевым проектом компании являлся торговый комплекс «Мегаторг». Это один из крупнейших торговых объектов Владимирской области, играющий значительную роль в жизни людей и города. Основной проблемой для крупного бизнеса компании является отсутствие системы резервного копирования с прогнозируемым временем восстановления, что ведет к рискам остановки ключевых сервисов в случае аварии, простоя, неминуемой потери прибыли и снижению уровня репутации.

Исходные условия

На момент входа основными уязвимыми местами у заказчика являются сервисы СУБД и инфраструктурные сервисы. Настроена классическая схема: одиночный сервер, LFF диски, Microsoft System Center Data Protection Manager 2012 (без R2) который собирает резервные копии непосредственно с инфраструктуры. Из-за ограничений системы на создание дополнительных заданий невозможно настроить задания на хранение, например, ежечасных, ежемесячных или годовых копий. Хранилище данных в следствие отсутствия дедупликации/компрессии используется нерационально. Резервные копии создаются достаточно долго, восстановления данных тоже требует значительного времени, что ведет к прямым потерям бизнеса из-за непрогнозируемых по времени простоев.

Решение задачи

После презентации уязвимых мест и обсуждения вариантов их устранения с заказчиком мы пришли к выводу, что текущая система резервного копирования не отвечает современным требованиям бизнеса и подлежит модернизации. Далее мы определили ключевые сервисы, которые планируется защищать в будущем проекте: типовые офисные системы, связанные с бухгалтерией и бюджетированием, система электронного документооборота в которой реализованы все бизнес процессы, связанные со стройкой. Это большие объемы данных с интенсивными изменениями, и время простоя является критичным и очень важным.

Мы предложили заказчику демо, чтобы понять, как новое решение по резервному копированию будет увязано с текущей инфраструктурой, и параллельно выбрать подходящие ему решения. Систему резервного копирования можно рассмотреть, как 2 компонента: софтовый стек и аппаратные решения, на которых он будет работать. Практически сразу мы остановились на решении Veeam как отвечающем всем требованиям проекта и обладающем необходимой функциональностью. Далее, поскольку вмешался COVID, мы развернули виртуальный HPE StoreOnce (который практически ничем не отличается от физического), провели демо, согласовали показатели RPO и RTO, определились с тем, что заказчик хочет видеть у себя в инфраструктуре, и приступили к реализации технического задания и обучению сотрудников.

Результаты проекта

После внедрения и запуска проекта время создания полной резервной копии сократилось с более чем 6 часов до 4-х, при этом практически не оказывается влияния на информационные сервисы. Инкрементные резервные копии, которые делаются на протяжении дня, стали создаваться за минуты без влияния на production. Показатель RPO определен и для ключевых сервисов компании составляет не более 1 часа. Показатель RTO минимизирован практически до минут за счет возможности использования Veeam Instant Recovery и запуска виртуальных машин непосредственно из хранилища резервной копии и их дальнейшей фоновой миграции в production среду. Также значительно повысилась эффективность хранения данных в хранилище резервных копий. Эффективность хранения за счет использования Veaam и HPE StoreOnce в качестве системы резервного копирования стала составлять примерно 7:1. Причем этот показатель будет расти, если будет расти количество резервных копий за счет очень мощного алгоритма дедупликации данных HPE StoreOnce.

Статья на правах рекламы