Web-узлы все чаще заменяют телефон. Услугами Web-узлов пользуются как потребители, например, в поисках нужных товаров, так и предприятия в своей производственной деятельности.

Некоторые поставщики интерактивных систем речевой связи (IVR — interactive voice response) и распознавания речи пытаются применить в Web принцип самообслуживания, используемый в обычной телефонии. «Заказчикам нужен определенный уровень общения, — говорит Марк Фланаган, президент компании Brooktrout Software. — Голос остается неотъемлемой частью ведения бизнеса». Brooktrout Software поставляет на рынок электронной коммерции интерактивную систему речевой связи Show N Tel. Во второй половине 2000 г. фирма планирует выпустить систему Show N Tel 5.0. Она обеспечит передачу голоса по протоколу IP и будет совместима с расширяемым языком разметки XML.

Компания Speech Works International представила летом систему SpeechSite, выпуск которой запланирован на осень и которая, как сообщил Марк Холтхауз, старший вице-президент фирмы по технологиям и производственной деятельности, оснащена средствами для распознавания голоса, что позволит абонентам обращаться за информацией, которую обычно ищут на Web-узлах с помощью обычного речевого запроса.

«Люди, делающие бизнес на услугах в области телефонной связи, теперь имеют возможность продавать более высокодоходные приложения более широкому кругу заказчиков», — добавил он. Минимальная стоимость системы SpeechSite составляет 50 тыс. долл.

Свою новинку в этой области недавно продемонстрировала и компания IBM. Очередная версия ПО для распознавания голоса ViaVoice работает на платформе Macintosh компании Apple Computer. Ее поставки должны начаться еще в этом году, однако цена пока не объявлена. Ожидается, что ViaVoice обеспечит речевое редактирование документов и подготовку сообщений электронной почты.

Специалисты российских компаний, работающих на рынке компьютерной телефонии (КТ), отмечают, что технологии распознавания речи уже нашли применение, хотя и ограниченное. Основная проблема заключается в надежности распознавания.

Поставки систем, способных распознавать тысячи слов, начались несколько лет назад, однако их широкое применение сталкивается с рядом технических ограничений. Одно из них — необходимость предварительной настройки на особенности произношения конкретного пользователя. Но даже в этом случае 100%-ное распознавание не гарантировано. Поэтому в КТ такие решения не используются. Обычно разработчики применяют системы, надежно распознающие несколько десятков определенных команд, которые абонент должен произносить четко и без запинок. Это позволяет организовать диалог абонента с системой КТ в том случае, если аппарат абонента не обеспечивает работу в тоновом режиме. Технологии синтеза речи хорошо отработаны и широко используются в системах КТ.