23 декабря 2022 г.

Александр Красников

Лет 10 назад в разгар новогодней ночи еще можно было не дозвониться до друзей и близких, но с тех пор операторы научились справляться с большой нагрузкой. Как архитектура сетей связи стала сверхпрочной и какие средства используют провайдеры для предотвращения сбоев, рассказывает Александр Красников, технический директор «Телфин».

Времена, когда в праздники было сложно дозвониться до родных и близких, давно прошли. Ещё в нулевых, набрав абонента в новогоднюю ночь, можно было столкнуться с тем, что соединение не устанавливается. Такое узкое место было у мобильных сетей связи в силу особенностей их архитектуры: покрытие мобильных сетей состоит из «сот», привязанных к базовым станциям. Если на одну базовую станцию приходится нагрузка выше максимальной, а именно это и происходит, когда дозвониться пытаются все одновременно, связь сбоит.

Однако мобильные компании решают эту задачу за счет перехода к стандарту сетей 4G, разделению сетей на слои и интеллектуального управления трафиком. У фиксированных операторов ситуация совсем иная: другие сети и другие технологии обеспечивают работу стационарных телефонов. Самым стойким и проверенным решением проблемы являются услуги интернет-доступа и сервисы, которые работают поверх сети. IP-телефония также относится к этому сегменту.

Факторы риска

Преимущество сетевых услуг связано с тем, что в интернете отсутствует изолированная инфраструктура. Здесь существуют точки обмена трафиком, в том числе международные узлы. Однако не стоит забывать о том, что отключение одного такого узла может произойти как по воле случая, так и в результате преднамеренных действий злоумышленников.

Возможно, старожилы помнят, как в 2014 году один незадачливый строитель в Финляндии перерубил кабель, и социальная сеть «ВКонтакте» в Европе просто перестала работать. Несмотря на то, что инцидент был достаточно быстро исчерпан, специалисты еще раз убедились, что одна из главных задач в сегменте интернет-услуг — поддержание связности сети между операторами.

Вообще не стоит забывать о различных факторах, которые влияют на работоспособность сетевой инфраструктуры: это погодные условия (жара может, к примеру, отключить дата-центр, но это случается редко), а также суточные колебания нагрузки, к которым системы давно могут быть адаптированы. Задача операторов состоит в том, чтобы грамотно рассчитать предельные нагрузки в часы пик и не допускать кризисных ситуаций вовсе. Это повышает лояльность пользователей независимо от каких-либо событий или временных рамок.

Надёжность по формуле 2N

В современном телекоме любой сбой — событие из ряда вон, потому что все усилия компаний направлены на их предотвращение. Если риски рассчитаны правильно и инфраструктура заложена под них с большим запасом прочности, крупных сбоев в работе сетей случаться не должно.

Одна из стандартных схем резервирования оборудования в телекоме, как и в других чувствительных к работе IT отраслях, например, в банковской, описывается формулой «2N». Она означает, что у каждого компонента инфраструктуры есть его полный дублер, который включается в работу сети в случае неисправности основного оборудования. Это происходит бесшовно и на работе сети никак не сказывается: абоненты не могут заметить таких нюансов — и не замечают.

Кроме того, крайне важно управлять инфраструктурными рисками. Телеком-инфраструктура должна обладать большим запасом производительности и надежности: все оборудование компании, поддерживающее работоспособность сервисов, должно быть распределено не менее чем между тремя дата-центрами. Тогда даже полное отключение одного из них никак не скажется на работоспособности сети и клиентах.

Ни Новый год, ни распродажи наподобие Черной пятницы, ни другие подобные события, когда сегмент корпоративной телефонии находится в зоне повышенных нагрузок, не влияют на стабильность и качество сервисов. Многие телеком-компании сталкивались со всплесками потребления услуг их клиентами. Например, после рекламных размещений на телевидении число телефонных обращений в определенной компании могло увеличиваться в 10 раз и более. Инфраструктура должна легко справляться с такими всплесками за счет резерва мощности и производительности оборудования.

Кроме того, желательно настроить автоматическую перемаршрутизацию голосовых вызовов и резервирование направлений по операторам-партнерам, которые предоставляют доступ к телефонной сети общего пользования. По каждому направлению и маршруту лучше иметь как минимум три альтернативных маршрута, через которых можно направить вызовы клиентов. Поэтому даже авария у одного из операторов, которая потенциально могла бы привести к полной недоступности сервисов и услуг связи у традиционных операторов, для клиентов IP-телефонии проходит прозрачно и незаметно, потому что трафик автоматически начинает уходить через альтернативный маршрут. Динамическая маршрутизация делает этот процесс незаметным для клиентов в случае возможных сбоев в нашей или партнерской сети.

Кто не спит в праздники

Еще один интересный момент связан с поддержанием работоспособности сетей в выходные и праздничные дни: каким образом он осуществляется, когда все собрались дома за праздничным столом?

У компаний телеком-отрасли должна работать мощная система по мониторингу работоспособности сервисов, которая непрерывно отслеживает состояние сети по большому количеству параметров. Система предупреждает о любых критичных моментах до того, как они наступают: дежурные администраторы получают такие уведомления в SMS-сообщениях, через Telegram и по e-mail. Об особенно критичных ситуациях сообщения поступают по телефону через систему голосового информирования: это может случиться, если важные параметры выходят за рамки предельных значений.

Необходимо стараться не доводить ситуацию до аварийной и исправлять ее еще до того, как клиенты заметят какие-то неполадки. Для этого при необходимости могут быть добавлены дополнительные вычислительные мощности в соответствующий кластер или проведена оптимизация производительности ресурсов. Такой мониторинг работает 24/7 вне зависимости от даты на календаре.

Если резюмировать все вышесказанное, то можно сказать, что абоненты, как корпоративные, так и частные, могут быть абсолютно спокойны: надежность телеком-сервисов на сегодняшний день стремится к 100%.

Источник: Александр Красников, технический директор «Телфин»