20 августа 2025 г.

Компании накапливают огромные объемы информации, часто не осознавая, какие возможности скрываются в этих цифровых хранилищах. Современные технологии ИИ позволяют переосмыслить накопленные данные и превратить их из балласта в ценный ресурс для развития бизнеса.

Представьте, что в вашей компании хранятся терабайты данных, которые казались просто архивным материалом — исторические финансовые отчеты, многочисленные версии документов, фотографии и видео. Еще недавно это все выглядело как цифровой груз, который приходится поддерживать по регламенту. Но в современном мире все меняется: архивы превращаются в кладезь информации, которая может дать мощный толчок бизнесу, если к ней подойти с новыми инструментами и правильным подходом.

Почему старые данные становятся новым источником ценности

Крупные компании копят огромные массивы информации, не всегда понимая их потенциал. При этом можно выделить два типа исторических данных. Первый — это структурированный материал, который целенаправленно собирался для ключевых бизнес-задач, например, финансовые или операционные показатели. Второй — данные, накопившиеся скорее стихийно из-за ручных процессов: архивы документов, записи транзакций, логи мониторинга.

Именно второй тип часто остается без должного внимания, хотя может стать источником неожиданных открытий и помочь по-новому взглянуть на традиционные хранилища корпоративной информации. Соединение этих данных с современными инструментами аналитики и ИИ дает поразительные результаты.

Импортозамещение и переосмысление хранилищ

В последние годы многие организации столкнулись с необходимостью переносить свои хранилища данных на отечественные платформы. В этой гонке выиграли те, кто заранее позаботился о каталогизации и документировании. Такие компании уже завершили проекты миграции и теперь активно развивают свои информационные системы.

А что остальные? Те, кто развивал свои хранилища хаотично и не уделял внимания документации, сейчас тратят месяцы на простое описание существующих структур данных. Однако даже в этом случае накопленная техническая информация становится ценным ресурсом — ИИ помогает формировать такие описания, проводить их классификацию и готовить рекомендации по миграции.

С какими типами данных можно работать

Код и программные библиотеки

Отдельного внимания заслуживают фонды алгоритмов, программ и библиотеки кода. Вся эта информация отражает практику разработки прикладных систем в организации и может использоваться генеративными моделями для создания нового кода.

Что это дает? Вместо абстрактного решения задачи компания получает полноценный пакет документов, включающий код с комментариями, пояснения и рекомендации по интеграции в текущую среду. Организации с грамотно выстроенными библиотеками кода могут гораздо быстрее внедрять ИИ-инструменты для разработки и выпускать больше прикладных решений.

Особенно ценны детальные спецификации, постановки задач и технические задания — они служат основой для запросов к системам генерации кода на базе больших языковых моделей. Функциональные и нефункциональные требования превращаются в отправную точку для создания программ на любом языке. Вполне вероятно, что эта информация будет полезна не только сейчас, но и в будущем, а роль разработчика ПО изменится — он станет в большей степени бизнес-аналитиком, чем кодером.

Документация и управление знаниями

Базы закупочной документации также часто требуют упорядочивания. В одном из проектов для крупной промышленной компании мы провели индексацию такой базы и внедрили быстрый поиск с использованием графовой базы данных. Результат поразил заказчика — теперь документы находятся мгновенно, тогда как раньше на поиск уходило несколько часов.

Кроме того, мы реализовали проект по смысловой группировке по номенклатуре товаров и услуг с применением генеративного ИИ. Это позволило связать все документы и закупочные позиции — от технического задания и контракта до закрывающих актов. Таким образом, стало возможным проследить полную историю закупок, поставок и оказания услуг без долгих ручных поисков.

При подготовке бумаг на закупку и работе с поставщиками возникает множество версий документов. Раньше их сравнение проводилось вручную — сотрудники просматривали два варианта документа, выискивая отличия. Сейчас вся эта работа проходит с использованием ИИ.

В результате многочисленные версии документов из источника проблем превратились в ценную историю о внесении изменений. По отзывам клиентов, работа в юридическом департаменте крупной компании ускорилась в пять раз, при этом отделы бухгалтерии и закупок также отметили большой прирост в скорости обработки документов.

Многие организации накопили большие объемы информации на внутренних порталах и в базах знаний — вопросы и ответы, типовые документы, регламенты и прочие справочные материалы. Обычно таких систем несколько, каждая со своим поисковым механизмом, работающим по собственной логике.

Цифровые ассистенты на базе больших языковых моделей позволяют подключить все эти источники и моментально находить нужные ответы с учетом всего массива данных. Мы создавали помощников для сотрудников по кадровым, административным и другим вопросам — это заметно упростило адаптацию новых работников.

Технические данные и поддержка

Это особенно актуально для ИТ-поддержки. Искусственный интеллект помогает решать большинство проблем без участия специалистов, запоминает предыдущие решения и дает рекомендации, когда без человека не обойтись. В одном из крупных банков такая система помогла сократить время обработки тикетов в несколько раз.

Логи информационных систем часто воспринимались как ненужный балласт, особенно когда данные устаревали. Однако инструменты интеллектуального анализа событий активно учатся на исторических данных и позволяют заранее предупреждать о возможных проблемах.

Эффект от такого подхода впечатляет: если раньше среднее время предупреждения с помощью стандартных методов составляло всего 4 минуты, то сейчас у администраторов есть целых 20 минут на предотвращение аварийной ситуации. Это принципиально иной уровень управления рисками.

Фото- и видеоархивы

Фото- и видеоаналитика также помогает обнаруживать повреждения или нарушения на исторических данных. Запомнился случай, когда сотрудник страховой компании для проверки возможностей системы использовал снимки автомобиля 20-летней давности — алгоритм точно нашел все повреждения.

Такие системы особенно востребованы на этапе предстрахового осмотра, помогая уменьшить объем ручного труда и точнее выявлять все дефекты. Старые архивы фотографий и видео из хранилища превращаются в активный инструмент для обучения и проверки современных алгоритмов.

Где данные бесполезны

Потенциально бесполезными могут быть только те массивы информации, которые никак не связаны с бизнесом компании, либо материалы, из которых невозможно извлечь никакой смысл из-за их фрагментарности или отсутствия контекста.

Но таких данных обычно меньшинство. Практика показывает, что при правильном подходе даже самые, казалось бы, бесперспективные архивы могут стать источником ценных идей и решений. Главное — взглянуть на них по-новому, вооружившись современными инструментами анализа и обработки, а также соблюдать все требования к защите персональных данных и другие требования регуляторов.

В цифровую эпоху старые данные становятся новым конкурентным преимуществом — ресурсом, который при умелой добыче и переработке дает мощный импульс развитию бизнеса и открывает неожиданные горизонты. Вопрос лишь в том, готовы ли компании увидеть это богатство и научиться им пользоваться.

Источник: Александр Чулапов, руководитель отдела центра стратегического развития Т1 ИИ (входит в ИТ-холдинг Т1)