5 декабря 2013 г.

Станислав Семененко, Роберт Фариш, Александр Прохоров, IDC
В ноябре российское представительство аналитической компании IDC провело в Москве конференцию Big Data and Business Analytics Forum 2013, в  которой участвовали более 150 руководителей ИТ-отделов компаний-заказчиков и системных интеграторов.

Как отметил Роберт Фариш, глава представительства IDC в России и СНГ, тематика «Больших данных» сравнительно недавно появилась в перечне исследований IDC. Это связано с  существенным ростом объемов данных, накапливаемых как в компаниях, так и вне их (в социальных сетях и публичных облаках), что породило сам термин Big Data. В то же время компании начинают все чаще обращаться к «Большим данным», пытаясь на основе их анализа найти новые решения для развития своего бизнеса.

По оценке IDC, на мировом рынке объем генерируемых и накапливаемых данных увеличивается со скоростью более 60% в год и к 2020 г.  может достичь 40 тыс. экзабайт. Причем информация, сосредоточенная  вне корпоративной среды, занимает  до 80% общего объема данных.

Как сообщил аналитик IDC Александр Прохоров, компания исходит из того, что информация, ценная для бизнеса, постоянно извлекается и используется. Например, накапливаемые компаниями данные о рынке, о клиентах, юридические и финансовые сведения  анализируются и могут быть эффективно использованы в таких критически важных бизнес-приложениях как CRM, EDW, ERP.  При этом, по оценке IDC, технологии и архитектуры нового поколения все чаще используются для экономичного извлечения ценности из разноформатных данных большого объема путем быстрого захвата, обработки и анализа данных.

Александр Прохоров пояснил, что в мировом масштабе IDC рассматривает рынок «Больших данных» как некую экосистему, которая складывается из затрат на создание инфраструктуры (включая облачную), на организацию (очистка, обогащение, интеграция) данных в различные виды БД, на средства аналитики, приложения и средства принятия решений, ориентированные на разные вертикальные отраслевые сегменты. Плюс к этому услуги по внедрению и сопровождению таких решений.

«Если в 2012 г. расходы на “Большие данные” оценивались в 8,1 млрд. долл., то к 2016 г., по нашим прогнозам,  они увеличатся  почти в четыре раза, до 23,8 млрд. долл. При этом мы полагаем, что наибольшие темпы роста в денежном выражении (в среднем до +53% в год) продемонстрируют такие компоненты корпоративных ИТ-систем как СХД, а также инфраструктура облаков (до +51%), где  также постоянно накапливаются разнообразные, подчас неструктурируемые данные.

Зато доля услуг заметно сократится (-21%), что связано с применением решений “под ключ”, которые могут быть перенесены в облака, облачные провайдеры смогут обеспечивать большую часть таких сервисов», - сказал он.

По мнению IDC, в настоящее время в России рынок «Больших данных» только зарождается. Есть несколько десятков проектов, которые находятся либо в стадии пилотного тестирования, либо в начальной стадии внедрения. Поэтому аналитики оценивали лишь масштабы работ по созданию и внедрению ПО для хранилищ данных – это порядка 340 млн. долл., из которых около 100 млн. долл. приходится на ПО SAP, а совокупные объемы затрат Oracle, Microsoft, IBM составляют  около 240 млн. долл.

Как сказал Станислав Семененко, руководитель отдела Microsoft по продаже платформы приложений, в России, как и в мире, наибольший интерес к бизнес-аналитике «Больших данных» проявляют крупные телеком-операторы, коммерческие банки и страховые компании, большие  розничные продавцы и госструктуры.

«У Microsoft в России есть целый ряд пилотных проектов по применению аналитики “Больших данных” в таких компаниях, к этому  их подталкивает усиливающаяся конкуренция. Многие технологии переходят в облака, в том числе бизнес-аналитика. В то же время развитие технологий “Больших данных” связано с развитием Интернета, мобильной связи и тенденцией “консьюмеризации”  ИТ», - сообщил Станислав Семененко.

Он также отметил, что банки, телеком и розничная торговля занимаются такими проектами потому, что  работают с большим числом клиентов, использующих Интернет. Причем усилия таких заказчиков по внедрению аналитики данных поддерживают системные интеграторы, которые в свою очередь накапливают опыт работы с «Большими данными».

По мнению Станислава Семененко, вслед за первыми сотнями наиболее крупных заказчиков к этим технологиям придут тысячи средних, которые пока не готовы инвестировать в бизнес-аналитику «Больших данных». Они будут осваивать эти технологии по мере появления готовых решений и по мере усиления конкуренции на рынке. Те компании, которые  ограничатся небольшим объемом бизнес-информации, на основе которой они принимают решения сегодня,  в конце концов окажутся неконкурентоспособными.

Его выводы подтвердила Екатерина Лозовая, директор компании – системного интегратора «Терн»: «Мы длительное время сотрудничаем  с крупными заказчиками, они вынуждены  работать с аналитикой – внедряют средства прогнозирования, моделирования, которые позволяют найти неочевидные закономерности. Они начинают понимать за счет чего могут повысить свои доходы, а  где сократить расходы. Основная проблема заключается в том, чтобы накопленную информацию почистить, преобразовать так, чтобы получить сопоставимые данные. Например, наша компания еще в 2001 г. начала работать с банком “ВТБ24”, который  на основе системы анализа клиентов, получил новый инструмент для своей бизнес-деятельности. Мы помогли банку на основе анализа накопленной им информации исключить дублирование данных и найти средства противодействия мошенничеству.

Александр Яковлев, менеджер Fujitsu по продуктам системы UNIX и СХД обратил внимание на необходимость изменения ИТ-инфраструктуры для обработки «Больших данных». Он напомнил, что один из первых проектов по сбору и обработке «Больших данных» был реализован в ходе  экспериментов на адронном коллайдере: там  установлены тысячи датчиков, информацию с которых нужно собирать и обрабатывать.

«Сегодня эта технология выходит на качественно новый уровень, и лавинообразный рост данных повышает требования к производителям СХД, которые все чаще используют дедупликацию данных, превращая ее из “нишевой”, используемой для резервного копирования, в широко распространенную в online-хранилищах. В частности, разработчики Fujitsu применили ее в последних моделях дисковых СХД, что дало возможность параллельно обрабатывать как аналитические запросы, так и промышленные БД, с которыми постоянно работают предприятия и которые являются критически важными для их бизнеса», - пояснил он.

Бизнес-аналитика «Больших данных» распространяется на те отрасли, где анализ большого количества плохо структурированных данных позволяет реализовать новые бизнес-решения, помогающие  значительно увеличить  оборот, доходы и прибыль. Так, Fujitsu уже реализовала несколько проектов с интернет-магазинами и с традиционной крупной розницей, в результате которых аналитика «глубинных» слоев информации за короткий срок позволила заказчикам на десятки процентов увеличить прибыльность и обороты.

Александр Яковлев отметил, что если бюджета на внедрение передовых технологий не хватает, то компании могут реализовывать в рамках единых решений сумму технологий, дающих необходимый эффект - использовать и дедупликацию, и новейшие дисковые хранилища, и хранение на лентах, которые в свою очередь позволят за короткое  время с помощью средств бизнес-аналитики генерировать новые решения для бизнеса.

В свою очередь Борис Буланов, руководитель направления «Решения для телекоммуникационных компаний» компании Informatica, эксперт по Big Data, отметил одно из существенных препятствий на пути внедрения технологий «Больших данных» и бизнес-аналитики: «Не хватает  так называемых data-scientists, то есть специалистов в области математической статистики (позволяет выявлять взаимосвязи между различными факторами), хорошо разбирающихся в бизнесе. Если это страховая или финансовая компания, то он должен знать условия ее работы, способы обслуживания клиентов, законодательство. И, конечно, такой специалист должен понимать, какую информацию и откуда может компания получать. Именно такие специалисты могут формулировать новые, нетрадиционные задачи бизнес-аналитики и проекты. Они  очень нужны, но в корпоративной среде их мало».

«Значение таких специалистов  весьма велико, - считает он. - Ведь ценность “Больших данных”  заключается в том, чтобы собрав воедино всю информацию, которой располагает компания, с помощью data-scientists соединить возможности технологий с  бизнесом и сформировать новые подходы к анализу данных, построить новые модели их взаимосвязей  и тем самым найти пути решения нетривиальных бизнес-задач», - подчеркнул он.

Однако, как отметил Александр Прохоров, в настоящее время российские вузы не  готовят  специалистов в области технологий «Больших данных» и data-scientists, для этого, возможно,  необходимо создать новое  специализированное  учебное заведение.

Борис Буланов обратил внимание участников конференции на развитие «Интернета вещей», когда различные технологические системы и устройства снабжаются большим числом датчиков, непрерывно передающих информацию в ЦОДы, где она и анализируется. Например, показатели датчиков  на теле человека позволяют кардинально изменить методы диагностики и лечения в медицине. Дополняя его, Станислав Семененко сказал, что аналогичным образом, используя данные с датчиков, можно совершенствовать электроэнергетику, условия работы транспорта в городах, планировать развитие городской инфраструктуры и т.д.

Источник: Владимир Смирнов, CRN/RE