24 июня RedLab обрела новый статус, объявив о выпуске модуля расширения (DataBlade) «Русский текст» для СУБД Informix Universal Server. Таким образом компания присоединилась к сообществу независимых разработчиков ПО, работающих над расширением возможностей этой объектно-реляционной СУБД (на сегодня их насчитывается более трех десятков).

«Русский текст» — это первый модуль DataBlade, созданный в нашей стране. «Архитектура Universal Server позволяет обойти ограничения, характерные для реляционных СУБД», — сказал профессор Руслан Смелянский, генеральный директор RedLab. «Мы рады, что российские разработчики оценили возможности нашего нового продукта, — заметил Ховард Залкин, менеджер Informix по маркетингу Web-технологий в странах Восточной Европы. — Мы считаем, что Universal Server — это продукт, который будет определять развитие технологий управления данными в течение следующего десятилетия».

Полгода назад, пытаясь опередить соперников на рынке высокопроизводительных СУБД, Informix решилась на отчаянный шаг — предоставить независимым разработчикам ПО доступ к «святая святых» — ядру СУБД. Программистам Informix удалось объединить собственные продукты и технологии компании Illustra, приобретенной в конце 1995 г., несмотря на то, что многие аналитики и конкуренты высказывали сомнения в возможности создания объектно-реляционной СУБД на базе программных продуктов Informix.

Тем не менее этот шаг коренным образом изменил равновесие сил на рынке высокопроизводительных СУБД, а также распределение доходов между фирмами — разработчиками СУБД и поставщиками ПО управления данными. Если раньше последние были вынуждены создавать свои, порой весьма специфичные продукты на базе собственных СУБД или в виде прикладных программ для более мощных СУБД, то теперь они получили возможность продвигать их на глобальных рынках как часть СУБД Informix.

Возможности модуля «Русский текст»

  • Поиск заданного слова во всех словоформах.
  • Построение запросов произвольной степени сложности.
  • Обработка логических операторов (AND, OR, NOT).
  • Поиск по заданному шаблону.
  • Нечеткий поиск.
  • Обработка операторов расстояни и соседства.
  • Обработка документов, представленных в различных форматах.
  • Настройка на лексику заказчика.
  • Формирование «стоп-списка».
  • Обновление словаря.

Независимые разработчики не замедлили воспользоваться шансом. Сегодня насчитывается более 100 различных DataBlade, среди которых есть средства для обработки видео- и аудиоданных, изображений, специальной финансовой информации и проч. «Universal Server обеспечивает почти неограниченные возможности расширения, — сказал Ховард Залкин. — Решение проблемы создания нового типа данных или добавления в СУБД новых функций сводится к подключению необходимого количества моделей DataBlade».

Пакет «Русский текст» представляет собой систему полнотекстового поиска, предназначенную для обработки больших объемов информации. «В этом программном продукте были реализованы алгоритмы, созданные на факультете вычислительной математики и кибернетики МГУ», — отметил г-н Смелянский. «Обычно функции полнотекстового поиска встраиваются во внешнюю по отношению к СУБД прикладную программу, что отрицательно сказывается на производительности, — сказал Залкин. — С другой стороны, «оформление» подсистемы поиска в виде модуля DataBlade позволяет ее увеличить». По оценкам разработчиков, быстродействие созданного ими модуля составляет 3—5 Мбайт текста в секунду.

По словам представителей компании, с выпуском модуля «Русский текст» Informix Universal Server становится единственной СУБД, для которой в полном объеме решена задача полнотекстового поиска в русскоязычных документах. «Informix — это первая СУБД, которая обеспечивает возможность полноценной обработки русского языка на уровне морфологического анализа», — сказал Ховард Залкин. Впрочем, конкуренты Informix оспаривают это утверждение. «Еще в 1993 г. для СУБД Oracle появился практически аналогичный программный продукт TextRetrieval. В частности, он был установлен в Институте США и Канады, — отметил Владимир Беляев, технический директор корпорации LVS. — Кроме того, высокая производительность — это далеко не все, что требуется заказчикам». Недостатки подхода, избранного Informix, — это естественное продолжение его достоинств. Подключение модулей расширения непосредственно к ядру СУБД повышает производительность, но снижает надежность. Поскольку и модули DataBlade, и ядро СУБД функционируют в одном адресном пространстве, крах одного из модулей может привести к «падению» всей СУБД. Актуальность этой проблемы отчасти нивелируется благодаря программе сертификации модулей Datablade, однако вероятность отказа все же остается. Именно на это указывают соперники Informix. «Технология «картриджей данных», реализованная в Oracle8 (в России объявление этой СУБД состоялось 1 июля), обеспечивает значительные возможности расширения в сочетании с надежностью, — сказал Николай Зезюлинский, руководитель отдела по работе с партнерами российского представительства Oracle. — Сегодня мы ведем переговоры с рядом российских разработчиков».

Еще более категоричными оказались представители Sybase. «Практика показывает, что крупные корпорации обычно настороженно относятся к новым технологиям, — сказал Михаил Грачев, менеджер московского филиала корпорации. — Sybase всегда была открытой системой, которая позволяет при необходимости дополнить СУБД самыми разными функциями, а интерфейс OpenServer/OpenClient существует уже много лет».

Впрочем, продукт RedLab в нынешнем своем виде — это скорее платформа для дальнейших разработок. Остается неясно только, привлекут ли внимание системных интеграторов новые возможности Informix. С одной стороны, «решение о выборе той или иной платформы обычно зависит от пожеланий заказчика, — заметил Владимир Беляев, — и сегодня мы уже не так жестко «привязаны» к какой-то конкретной СУБД, как несколько лет назад». С другой... «Большинство серьезных фирм—разработчиков ПО занимаются, как правило, одной платформой. Решение о выборе той или иной СУБД принимается в результате анализа как технологических характеристик СУБД, так и рыночной позиции компании-поставщика, — сказал Александр Миронов, вице-президент «АйТи» по исследованиям и разработкам. — Для комплексных прикладных программ применяются не только стандартные инструментальные средства, но и собственный инструментарий команд разработчиков».

Так или иначе, «для распространения модуля «Русский текст» будут задействованы каналы сбыта обеих компаний», — сказал г-н Смелянский. — На базе нашего продукта VAR’ы могут строить самые разнообразные прикладные системы, и сегодня мы видим большой интерес к подобным разработкам».