1 октября 2025 г.

Российская ИИ-система «Шерлок» для распознавания и проверки документов, созданная Smart Engines, получила возможность работать с удостоверениями личности на урду и персидском языках. Это стало возможным благодаря первому в мире специализированному датасету MIDV-UP, созданному учеными компании и включающему более 9000 изображений документов Пакистана и Ирана. Новый набор данных закрывает давний пробел в разнообразных и неперсонифицированных обучающих материалах и открывает «Шерлоку» выход на рынки с совокупным населением свыше 330 миллионов человек.

«Отсутствие надежных ИИ-решений долгое время оставляло неавтоматизированным огромный рынок цифровых услуг, требующих ввод данных из документов на урду и фарси. Благодаря нашему новому датасету эти документы больше не является преградой для „Шерлока“. Сегодня устойчивый спрос на технологии распознавания наблюдается не только в самих Пакистане и Иране, но и в России и других государствах — чему способствуют значительные миграционные и образовательные потоки. Теперь стало возможным масштабировать „Шерлока“ как внутри страны, так и на международных рынках», — отмечает один из авторов MIDV-UP, генеральный директор Smart Engines, д.т.н. Владимир Арлазаров.

Источник: Пресс-служба компании Smart Engines