8 июня 2011 г.

Компания ABBYY подвела итоги участия  в международном проекте IMPACT (IMProving ACcess to Text, «улучшая доступ к тексту») – масштабном мероприятии, инициированном Европейской комиссией для преобразования европейского печатного наследия в цифровые ресурсы.

ABBYY участвует в проекте с 2008 года, предоставляя программное обеспечение для оптического распознавания символов (Optical Character Recognition, OCR). За 3 года интенсивной работы компания получила возможность воплотить накопленный опыт в своих продуктах, реализуя в них передовые технологии распознавания текста.  

Консорциум IMPACT объединяет 26 организаций, среди которых национальные и региональные европейские библиотеки, научно-исследовательские институты и технологические партнеры. В ходе проекта все участники получили возможность делиться друг с другом своими знаниями и опытом, а ИТ-компании – разрабатывать инновационные средства для улучшения технологий оптического распознавания символов.

Эти решения помогают оцифровывать исторические тексты, напечатанные до XX века. Важно, что электронные копии документов не подвержены старению и, кроме того, могут быть одновременно доступны для миллионов исследователей и читателей в любой точке мира, где есть Интернет. Уже к концу 2011 года ожидаются значительные результаты в открытии доступа к полученным цифровым материалам.

ABBYY играет в проекте важную роль – программное обеспечение компании используется для оптического распознавания текста документов, набранных старинными шрифтами. В процессе работы с важными историческими материалами из коллекции ведущих европейских библиотек специалисты компании значительно улучшили технологии предварительной обработки и анализа структуры документов. Это позволило добиться более точного распознавания символов.

Специалисты ABBYY в тесном сотрудничестве с участниками других организаций  решают технологические задачи, характерные для таких крупномасштабных проектов, как оцифровка библиотечных фондов. Благодаря этому взаимодействию национальные библиотеки получают возможность преобразовывать оригиналы старинных документов в электронный вид, осуществлять в цифровых копиях поиск по тексту, а также создавать на различных языках мира собственные электронные словари.

«Раньше нам не всегда удавалось качественно распознать текст или преобразовать данные в формат XML, особенно когда приходилось работать со старинными книгами, журналами и газетами, – отмечает Али Конте (Aly Conteh), член Исполнительного совета проекта IMPACT, руководитель программы Британской национальной библиотеки по преобразованию печатных текстов в цифровой формат. – Участие в IMPACT открыло нам доступ к передовым технологиям распознавания, в том числе предоставляемым компанией ABBYY. Эти решения позволили нам и другим участникам проекта эффективно обрабатывать документы, качество которых ранее оставляло желать лучшего».

«Оцифровка печатного интеллектуального наследия Европы не только помогает сохранить его для будущих поколений. Так мы сможем открыть доступ к этому информационному массиву для миллионов исследователей, студентов и простых читателей по всему миру, – объясняет Андрей Исаев, директор департамента технологических продуктов ABBYY. – Это благородная цель, и мы рады возможности принимать в этом участие совместно с другими организациями, воодушевленными этой идеей».

ABBYY имеет опыт участия и в других успешных европейских научно-исследовательских проектах по масштабному преобразованию текстов в цифровой формат. В рамках проекта METAe компания разработала FineReader XIX – программу, предназначенную для распознавания готического шрифта Fraktur, часто встречающегося в текстах 1800-1938-х годов. Также компания участвует в проекте Digitisation-on-Demand, цель которого – оцифровка миллионов книг, чтобы сделать их доступными в электронном формате. Кроме того, немецкий институт Фраунгофера использовал ABBYY FineReader SDK с поддержкой старинных шрифтов для оцифровки архива газеты Neue Zürcher Zeitung.

Благодаря участию в проекте IMPACT ABBYY существенно усовершенствовала свои технологии. Многие новые разработки в области распознавания специализированных текстов и документов уже нашли применение в продуктах ABBYY FineReader Engine и ABBYY Recognition Server 3.0. Обновленные решения компании теперь доступны для использования организациями во всем мире.

Источник: Пресс-служба компании ABBYY