10 лучших продуктов 2012 года для работы с большими данными

16 января 2013 г.

В 2012 г. «большие данные» превратились из модного термина в полноценную отраслевую тенденцию - или даже самостоятельную отрасль - если судить по количеству продуктов для обработки больших данных, выпущенных как начинающими, так и известными ИТ-вендорами.

Верный признак зрелости технологии больших данных - количество важных версий «2.0», выпущенных в 2012 г. такими компаниями, как Datameer, DataStax, Hadapt, Karmasphere и MapR Technologies.

Компания Gartner подсчитала, что в 2012 г. большие данные принесут ИТ-отрасли 28 млрд. долл. Это не удивительно, если учесть резко возросший объем информации, хранимой в ИТ-системах во всем мире. По оценкам, в 2012 г. он достиг 2,7 зеттабайт (2,7 млрд. терабайт), и потребность в технологии сбора, хранения, управления и анализа данных стала очень насущной.

Мы публикуем список лучших продуктов для работы с большими данными, выпущенными в продажу в 2012 г.

10. Dataguise DgHadoop

Выполнение требований законодательных актов к конфиденциальности данных может оказаться трудной задачей, поскольку Hadoop собирает данные из разнообразных источников, а не только корпоративных баз. При сосредоточении такого большого количества разнообразных данных в одной системе возрастает риск кражи информации или ее непреднамеренного раскрытия.

В июне компания Dataguise выпустила, по ее утверждению, первое в отрасли приложение для защиты конфиденциальности данных и оценки риска корпоративного уровня для Hadoop. Программа DgHadoop оценивает соответствие законодательным актам и обеспечивает централизованную защиту данных, чтобы удовлетворить требования нормативных актов к конфиденциальности и одновременно сократить затраты.

9. Cloudera Impala

Благодаря распространенности Apache Hadoop и связанных технологий и служб, Cloudera - вероятно, наиболее авторитетная из компаний, работающих с большими данными. Но это не мешает ей разрабатывать весьма привлекательные новшества.
В октябре Cloudera выпустила механизм запросов в реальном времени для Hadoop под названием Impala, с помощью которого на платформе Cloudera Enterprise (предназначена для управления огромными объемами данных) можно выполнять как операции реального времени, так и пакетные операции с любым типом структурированных и неструктурированных данных. Impala управляет данными, сохраненными в файловой системе Hadoop Distributed File System (HDFS) и базе данных Hbase. А новая программа Cloudera Enterprise RTQ (Real-Time Query) располагает необходимым инструментарием, чтобы управлять Cloudera Impala в производственной среде.

В июне Cloudera выпустила версию Cloudera Enterprise 4.0. В декабре компания получила 65 млн. долл. для финансирования новых проектов и продолжает разработку продуктов.

8. Hortonworks Data Platform 1.0

Стартап Hortonworks начала свою деятельность в июне 2011 г. и в течение года представил несколько предварительных версий Hortonworks Data Platform (HDP), дистрибутива платформы Apache Hadoop. В июне 2012 г. представитель компании объявил, что долгожданная версия 1.0 программы доступна для всех.

В 2012 г. интерес к Hadoop был огромен, но работать с открытым продуктом чрезвычайно трудно. Компания Hortonworks окружила Hadoop своей собственной инфраструктурой управления данными; службами управления, мониторинга, интеграции метаданных и данных. А уровень поддержки клиентов - такой же, как у привычных коммерческих продуктов.

7. Zettaset Orchestrator v5

Zettaset Orchestrator автоматизирует установку и управление Hadoop. В начале 2012 г. на конференции RSA компания Zettaset представила инициативу (под названием «SHadoop» означающем Secure Hadoop - безопасный Hadoop), чтобы устранить уязвимые места, которые, по заявлению представителей компании, существуют во всех дистрибутивах открытого продукта Apache Hadoop.

Orchestrator v5 обеспечивает новые возможности управления доступом, политиками, соответствием законодательным актам и рисками, улучшая управляемость и безопасность кластера Hadoop. Программа совместима со стандартами Lightweight Directory Access Protocol (LDAP) и Active Directory; располагает инструментарием для централизованной настройки конфигурации, ведения журналов и аудита; механизмом управления на основе ролей для улучшения проверки подлинности и доступа пользователей.

6. Google BigQuery

Используя накопленный опыт обработки гигантских объемов данных, компания Google выпустила Google BigQuery, облачный программный продукт, с помощью которого компании могут анализировать данные в реальном времени. В ноябре 2011 г. была представлена тестовая версия службы для разработчиков. В ее основе - технология, используемая компанией для исследования своих собственных данных. В мае 2012 г. служба стала доступна всем, кто хотел  бесплатно использовать ее для хранения и анализа данных объемом до 100 Гбайт. Сверх этого предела компания взимает 12 цент/Гбайт за хранение объемом до 2 Тбайт и 3,5 цент/Гбайт за анализ данных.

5. Mortar Data

Для работы с Hadoop требуются немалые технические знания. Mortar Data предоставляет облачную службу на основе языка программирования Python и технологии Apache Pig для анализа огромных наборов данных. В результате Hadoop становится доступнее для более широкой аудитории программистов. О Mortar Data стало известно весной 2012 г. В долгосрочных планах нью-йоркской компании - сотрудничество с партнерами в области технологии, чтобы дополнить платформу Mortar Data бизнес-аналитикой и передовыми функциями мониторинга.

4. Retention Science

Компания Retention Science, основанная в 2011 г. и официально начавшая свою деятельность в июле 2012 г., разработала «механизм профилирования клиентов», маркетинговую платформу на основе больших данных, с помощью которой интернет-компании смогут анализировать огромные объемы данных.

Приложения помогут компаниям, специализирующимся на интернет-коммерции, прогнозировать, насколько цена отражается на спросе и соответственно строить рекламные мероприятия, определять уровень отношений с каждым клиентом, укреплять их и создавать стимулы для клиентов, активных в социальных сетях. Компания из Санта-Моники (штат Калифорния) сотрудничает  с MuckerLab, компанией-инкубатором технологий из Лос-Анджелеса.

3. DataSift

Компания DataSift официально выпустила свой продукт в конце 2011 г., но в 2012 г. всеобщее внимание было  привлечено к программному продукту компании для сбора и анализа мощного потока данных, генерируемых такими социальными сайтами, как Twitter и Facebook.

DataSift предоставляет программу, с помощью которой компании могут определять сложные фильтры на основе таких критериев, как местоположение, пол и даже эмоциональное отношение, чтобы сортировать миллиарды социальных взаимодействий.

В 2012 г. компания из Сан-Франциско подписала договор с Twitter, который предоставит DataSift доступ к архиву твитов до января 2010 г. для исследований рынка. А в сентябре продукт был выпущен специально для отрасли финансовых услуг.

2. Qubole

Компания Qubole проектирует платформу «автомасштабирования» для анализа и обработки больших данных. Цель компании - предоставить облачные службы Hadoop и Hive, которые скрывают от пользователя все сложности инфраструктуры, исключая необходимость проектировать, развертывать и управлять собственными кластерами Hadoop. В результате у разработчиков и аналитиков будет больше времени, чтобы сосредоточиться на проектировании запросов и анализе данных.

Технология пока не доступна для всех желающих: в июне 2012 г. компания Qubole из Маунтин-Вью (штат Калифорния) вышла из скрытого режима и набирает специалистов по бизнесу и данным для организации программы начального доступа к ее технологии.

Основатели компании, Ашиш Тусу м Джойдип Сен Сарма, участвовали в построении инфраструктуры данных Facebook и разработке  Hadoop. Они также создали  Apache Hive, открытую  систему для хранения данных.

1. Platfora

Компания-стартап Platfora работала в скрытом режиме до октября 2012 г., представила свою размещаемую в памяти программу бизнес-аналитики для непосредственного анализа данных в Hadoop без необходимости строить сложное (и дорогое) хранилище данных или традиционный источник данных. «В действительности, это начало конца хранилища данных», - заявил в интервью основатель и главный управляющий Platfora Бен Уэртер.

Это довольно смелое утверждение. Но компании Platfora по силам произвести переворот в способах управления большими данными для целей аналитики. Программа преобразует исходные данные в Hadoop в размещаемую в памяти интерактивную бизнес-аналитику для виртуализации, панелей мониторинга и исследовательской аналитики. Она совместима со всеми дистрибутивами Hadoop, в том числе Cloudera, Hortonworks, MapR и Amazon Web Services.

Источник: Рик Уайтинг, CRN/США

Печать Печать без изображений Все новости и статьи

Успех в партнерстве

Curator

Дмитрий Ткачев, CURATOR: «Наше главное преимущество — в том, что партнёру с нами легко»

Компанию CURATOR мы уже представляли весной 2025 г., — тогда её глава рассказал в интервью нашему изданию о принципах работы вендора, о его канальной политике и о перспективах развития избранного направления бизнеса …

ICL Техно

ICL Техно: между «крепче стали» и гибкостью

«Стали крепче!» — лаконичный слоган XII мультивендорного форума ICL Partner Connect в 2025 г. приобрел особое значение. Это не просто констатация успехов в импортозамещении, но и, что гораздо важнее, демонстрация реальной готовности к дальнейшей напряженной борьбе за достижение технологического суверенитета.

Curator

Дмитрий Ткачев, Curator: «Чем дольше с нами клиент, тем больше зарабатывает партнёр»

О принципах работы компании, её канальной политике и перспективах развития избранного ею направления бизнеса изданию IT Channel News рассказывает генеральный директор Curator Дмитрий Ткачев.

Промопрограммы

NETLAB, Defender

Время новых открытий от Defender!

1 июня — 31 июля

MERLION, Астра

АСТРАномическая выгода

18 мая — 30 сентября

АБСОЛЮТ ТРЕЙД, Patriot

Золотой запас бонусов

1 июля — 7 августа

Кадровые изменения

М.Видео: Светлана Бородихина

ПАО «М.Видео» объявляет о назначении Светланы Бородихиной на должность директора по персоналу Компании.

Postgres Professional: Артём Галонский

Postgres Professional усиливает управленческую команду: новым генеральным директором назначен Артём Галонский.

Фото- и видеорепортажи

TERA IT Distributor (Тера)

Бизнес, экспертиза и гастрономия: TERA подводит итоги масштабной серии региональных партнерских встреч

Nerpa (Нерпа), OCS Distribution

Nerpa и OCS совместно с партнёрами выпустили ладожских нерп в естественную среду обитания

Опрос

Новости ИТ-бизнеса и статьи

Технический заказчик в строительстве сохраняет ключевую роль, несмотря на цифровизацию и развитие ИИ

Несмотря на активную цифровизацию строительной отрасли, институт технического заказчика в ближайшие годы не только сохранит свою актуальность, но и …

5 ИИ-инструментов, на которых я как CEO реально работаю каждый день (и 5 ловушек, в которые попал сам)

Мировой рынок AI уже перевалил за 235 млрд долларов и удвоится к 2028 году, но почти две трети компаний до сих пор не вынесли AI за пределы пилотов …

Парадокс наставничества: почему в ИТ-отрасли обучение других — кратчайший путь к развитию и лидерству

В ИТ-индустрии сложился устойчивый миф: наставничество — это «социальная нагрузка», которую опытный инженер берёт на себя из альтруизма или по …

Gartner назвала лидеров гонки поставщиков ИИ-полупроводников

Аналитическая компания Gartner определила производителей, которые сегодня занимают лидирующие позиции в наиболее важных сегментах рынка …

Якоря или паруса: готовы ли партнёры в российском ИТ-канале к моновендорности? Часть II

В чём с точки зрения интегратора заключаются риски работы с многовендорными «зоопарками» для заказчиков — с учётом, опять-таки, вполне очевидных …

Аналитика

20 лучших региональных ИТ-компаний 2025

IT Channel News публикует результаты 18-го исследования лучших региональных ИТ-компаний. В этот раз, в отличие от предыдущих рейтингов, мы представляем не 25, а 20 победителей.

25 лучших российских системных интеграторов 2025

IT Channel News публикует результаты очередного исследования «25 лучших российских системных интеграторов» и представляет победителей 2025 года.

25 лучших региональных ИТ-компаний 2024

IT Channel News публикует результаты очередного — уже 17-го! — исследования «25 лучших региональных ИТ-компаний» и представляет победителей 2024 года.

Новые ИТ-продукты

ADO

Электровелосипеды ADO для партнёров diHouse

Астра

«Группа Астра» и BAUM-Inform расширяют возможности использования отечественных технологий

A4Tech

A4Tech Fstyler: новые беспроводные мыши для тихой и комфортной работы

Истории успеха

1С-Рарус

«1С Рарус на 15% ускорил обработку заказов в группе компаний «Римера»

Защита, виртуализация и сети: Галэкс продлил партнерский статус «НумаТех»

Как компания «Штурм» подняла прибыль, снизила трудозатраты и автоматизировала маркировку