Coredge Logik My Edition 2
Coredge Software
Оттава
www.coredge.com

Пакет Logik 2.0 компании Coredge — простой в использовании инструмент, который организует неструктурированные данные в логические библиотеки. Logik автоматически извлекает ключевые фразы или темы из документов, систематизируя их без участия конечных пользователей. Процесс отличается высокой динамичностью и гибкостью.

В Coredge считают, что выработкой правил классификации, на основе которых формируются родительские и дочерние связи между документами, должна заниматься главным образом программа, а не человек. Инженеры Тест-центра согласны, что в динамичной среде это может быть оправдано. Однако точность работы Logik зависит от первоначальных фраз, введенных конечными пользователями в библиотеку. В случае ввода слов с несколькими значениями, например, таких, которые могут быть глаголом или существительным, программа часто неверно выполняет классификацию. Для расширенного поиска можно наряду с темами также использовать и фильтры. Создание тем и фильтров легко осуществляется через административный интерфейс.

Программа отображает библиотеку на дисплее в виде дерева в левой панели окна. Папки библиотеки представляют собой взаимосвязанные темы и организованы в соответствии с первоначальными фразами, введенными пользователями. Их можно легко перемещать в другие папки. При изменении положения папки все родительские и дочерние взаимосвязи между фразами автоматически обновляются.

Чтобы помочь пользователям решить, какой документ просмотреть, Logik выводит краткое содержание документов, составленное на основе первых 30 тем, обнаруженных в документе. Программа не формирует краткое содержание на основе всех тем. При открытии документа его темы выделяются на экране подсветкой. ПО Logik интегрируется с Microsoft Word, Excel и PowerPoint, так что документы можно добавлять прямо в библиотеку одним нажатием клавиши. Кроме того, предусмотрены средства интеграции с Microsoft Outlook и Internet Explorer. После завершения поиска в Web программа выполняет синтаксический анализ результатов для создания краткого содержания просмотренных страниц и извлекает все ключевые темы, связанные с каждой HTML-страницей.

Logik может также выявить экспертов по определенным темам, позволяя установить, кто работал над документами или группой документов по данной тематике. Программа также способна выполнять простой перевод Web-страниц с иностранных языков. После перевода можно запускать описанный выше процесс извлечения тем и классификации страницы. Документы системы Logik можно прикреплять к сообщениям электронной почты или вставлять в другие документы, за исключением программ Excel и PowerPoint.

IBM Lotus Discovery Server 2.0.1
IBM
www.lotus.com/km

Пакет Discovery Server фирмы Lotus полностью автоматизирует управление знаниями и документами и является наиболее всеобъемлющим решением в этом обзоре. Программа отслеживает всю информацию, необходимую для повседневной работы пользователей.

Данные из многочисленных источников, таких как электронная почта, файл-серверы, базы данных и платформы коллективной работы, сохраняются автоматически без вмешательства пользователя (IBM называет эти данные «путеводными знаками»).

На основе «путеводных знаков» Discovery Server строит краткую сводку знаний и обязанностей пользователя. Более того, пакет создает профили пользователей на базе документов, которые они просматривают и пишут, а также отслеживает персональную информацию, такую как предпочтения, навыки, образование и должностные обязанности.

Все эти данные включаются в профиль пользователя, который хранится в системе и используется в качестве критериев поиска. Отслеживаются также профили, созданные с помощью продуктов других фирм, таких как ERP-система PeopleSoft и каталог Active Directory компании Microsoft.

Discovery Server имеет встроенный механизм для работы с метриками, который вычисляет вероятность соответствия на основе всех критериев поиска, после чего механизм поиска выводит список документов, упорядоченных по убыванию этого значения. Группирование по предмету или категориям — только часть структурирования результатов анализа.

Пакет формирует также краткое содержание документов, в которое включаются три наиболее значимых предложения из каждого документа.

Синтаксический анализатор пакета Discovery Server снабжает все документы метками и сокращает слова до корня, уменьшая, таким образом, объем текста для последующего поиска. Выполняется также сравнение слов с помощью встроенного тезауруса, который можно корректировать, например добавить специальные отраслевые термины. Механизм работы с правилами осуществляет классификацию документов по предметным областям. Предусмотрены также классификаторы на основе правил, которые позволяют организовать результаты в желаемом виде. Как правило, наиболее ценные документы выводятся на первой странице.

Пакет не только выводит результаты поиска, но и указывает на присутствие других пользователей в Сети. Если щелкнуть по пиктограмме активного пользователя, на экране появляется ряд предложений для связи с другими пользователями — можно послать мгновенное сообщение или электронную почту, совместно поработать с приложением или даже просмотреть их профиль.

Непрерывно отслеживая предпочтения пользователя, пакет может сам предложить ему интересные темы. Если пользователя они не устраивают, он может просто удалить их из своего профиля. Можно также провести более тщательный поиск на основе близости к предпочтениям, а не просто в рамках указанной темы. Система хранения профилей и непрерывный мониторинг обеспечивают эффективную работу механизма выявления неявно сформулированных знаний.

Inxight
SmartDiscovery 3
Inxight Software

Пакет SmartDiscovery компании Inxight представляет собой многоуровневый сервер, который классифицирует неструктурированный текст из электронной почты, документов различных форматов, баз данных и управляет его использованием. Пакет может импортировать любую систему классификации, написанную в формате XML.

SmartDiscovery включает специальные модули обработки текста, способные анализировать более 25 языков в их собственном синтаксисе. К наиболее трудным языкам относятся арабский, фарси, иврит, русский и корейский. Все языковые модули можно подключать к программе без какой-либо доработки.

Используемую компанией технологию обработки запросов на естественном языке разрабатывал исследовательский центр PARC фирмы Xerox в течение более 20 лет.

Синтаксический анализатор может обрабатывать слова различных языков быстрее, чем обычные средства синтаксического анализа, имеющиеся в продаже. Он выполняет анализ слов без выделения их основы и вне зависимости от размеров разрастающейся базы знаний.

SmartDiscovery Server включает программу извлечения ключевых слов, которая сразу после установки выявляет в документах фразы определенных типов, такие как даты и географические названия. К примеру, программа может найти такие ключевые слова, как «suite», «Corp.» или «Minister», которые укажут на адрес, название компании или имя и должность человека.

Анализатор включает также встроенные индексы совместных вхождений существительных (т. е. тесно связанных сочетаний существительных), которые можно извлекать и связывать с ключевыми словами. К примеру, поиск по ключевому слову «масло» может извлечь названия различных видов растительного масла и привязать к результатам родственные фразы, такие как цены на масло и объемы производства.

Правила, которым следует анализатор при выявлении фраз, не входят ни в какую систему классификации и не могут изменяться. Пакет сам строит индексы поиска и создает ассоциации на основе внутреннего набора правил в своей базе знаний. Вместе с новыми версиями пакета компания выпускает более обширные наборы выражений и правил, позволяющие расширить базу знаний анализатора и спектр выявляемых им фраз.
SmartDiscovery включает инструмент визуализации данных под названием Star Tree, который используется для просмотра или изменения категорий системы классификации.

Чтобы найти категории, связанные с темой поиска, пользователи могут обратиться не только к поисковому механизму, но и к функции Star Tree. Механизм поиска и функция визуализации находятся на одной и той же HTML-странице и хорошо дополняют друг друга. Инженеры Тест-центра нашли, что SmartDiscovery предлагает самый интуитивно понятный подход к поиску по сравнению с другими пакетами в данном обзоре. Его модуль, формирующий систему классификации, также впечатляет. На базовом тесте, без использования исходной классификации, он смог извлечь общие существительные из списка документов и создать ряд категорий и связанных подкатегорий.

Open Text Livelink 9.1
Open Text
www.opentext.com

Пакет Livelink компании Open Text включает несколько инструментов управления знаниями и платформу коллективной работы. Управление контентом, документами и записями — наиболее важные функции управления знаниями. Livelink также объединяет функции документооборота и автоматизации бизнес-процессов, интегрируя программы и корпоративные приложения других фирм.

Администратор может импортировать систему классификации из XML-файла либо создать ее «с нуля». Когда классификации или категории вводятся в программу, создается профиль, который охватывает все правила, использованные для извлечения ключевых фраз. Кроме того, правила могут быть явно заданы пользователями. Livelink обеспечивает доступ к профилям, так что правила в запросах на поиск могут формировать критерии для извлечения фраз.

Результаты поиска можно дополнять явной оценкой пользователей, чтобы помочь им точнее выбирать документы. Система оценки применяется и к тем пользователям, которые просматривают документы, так что результаты поиска включают также имена тех, кто интересовался той же темой. Таким образом, можно найти экспертов или людей с общими интересами. По сути, программа обеспечивает форму пассивной доставки неявно сформулированных знаний.

Для поиска можно использовать логические выражения, ключевые фразы, запросы на естественном языке и метаданные из документов. Кроме того, Livelink способен создать на основе фраз, извлеченных из документа, его краткое содержание, которое можно включать в поиск как отдельный элемент. Существует возможность выполнять поиск сразу по нескольким репозиториям, в том числе принадлежащим некоторым другим пакетам управления документами и контентом, в частности Documentum. Пакет позволяет использовать широкий спектр атрибутов и комбинаций поиска, поэтому нет никаких ограничений на задание правил. К примеру, для поиска можно ввести ключевую фразу вместе с именем автора документа.

Livelink включает также запатентованную функцию поиска по запросу на естественном языке, возможности которой выходят за рамки традиционных алгоритмов нечеткого поиска. Благодаря этой функции программа может определить, где в репозитории знаний следует проводить поиск. Так, если пользователь ищет документы, написанные определенным автором, то поиск будет проводиться только по документам этого автора.

Функция установит даже типы документов и ограничит поиск соответствующими файлами.

Livelink осуществляет управление потоком данных на основе модели структурированных полномочий, которой подчиняются все результаты поиска и классификация контента.

Текущая версия Livelink не включает функций управления системой классификации и каких-либо визуальных средств просмотра данных в виде дерева. Компания планирует интегрировать Livelink с инструментом визуализации данных другого поставщика.