590 млн символов и 13 лет данных: исследование влияния ИИ на дипломные работы

17 июня 2026 г.

Рис. 1. Динамика AI-доли в выпускных работах по годам. Источник ReText.AI

Рис. 2. Ключевые параметры корпуса. Источник ReText.AI

Рис. 3. Паспределение AI-доли в выпускных оаботах. Источник ReText.AI

Рис. 4. AI-доля по разделам выпускных работ в 2025 году. Источник ReText.AI

Ни для кого уже не секрет, что при написании диплома студенты все чаще используют нейросети. За три года доля текста, имеющего машинные шаблоны, в выпускных квалификационных работах выросла в четыре раза! Исследование, которое вызвало широкий резонанс в профессиональном и академическом сообществе, провела компания ReText.AI, проанализировав почти 13 тысяч дипломов за 13 лет. Сегодня авторы этой работы делятся методикой: как отличить текст, написанный человеком, от машинной генерации, почему документы анализировались по абзацам, а не целиком, и где проходит граница между помощью ИИ и подменой самостоятельной работы.

Что показала проверка текста на ИИ

Главный вывод исследования — после 2022 года AI-доля в выпускных работах начала заметно расти. По данным компании:

AI-доля выросла с 9,9% в 2022 году до 42,3% в 2025 году;
в 2025 году самые высокие значения чаще встречались в заключении — около 56%;
во введении AI-доля составила около 49%;
в основной части показатель был ниже — около 41%;
доля работ, где почти нет признаков ИИ, снизилась: в 2022 году таких работ было около 70%, а в 2025 году — около 23%;
при сохранении тренда в 2026 году AI-доля может выйти на диапазон 50–60% по корпусу.

Эти цифры показывают общий сдвиг: нейросети стали полноправной частью процесса подготовки, редактуры и структурирования материалов.

«Нас удивил не сам интерес к цифрам, а то, как быстро поменялся разговор. Еще год назад спорили, можно ли вообще использовать ИИ в дипломе. Сейчас и вузы, и студенты, и преподаватели спрашивают другое: как это правильно зафиксировать и где провести границу. Мы изначально делали исследование не для того, чтобы кого-то „поймать“, а чтобы у этой дискуссии появилась опора в данных — и, судя по реакции, такой опоры действительно не хватало», — комментирует основательница ReText.AI Ольга Шкряба.

На чем базируется исследование

В исследовании использовались 12,9 тыс. выпускных квалификационных работ за период с 2013 по 2025 год. После подготовки и фильтрации в анализ вошло 590 млн символов. Для каждой работы рассчитывалась AI-доля — доля текста, которую детектор ИИ классифицировал как похожую на машинную генерацию или LLM-переработку. Средняя AI-доля по всему корпусу составила 14,7%, но важнее не среднее значение, а изменение по годам.

Подготовка текстов к проверке

Перед анализом тексты очищались от фрагментов, которые могли исказить результат. В проверку не включались: титульные листы, аннотации, оглавления, списки литературы, приложения, благодарности, отчеты по практике, подписи к рисункам и таблицам, обрывки формул, служебные и слишком короткие фрагменты. Для анализа брались только абзацы длиной от 500 символов. Короткие фразы часто не дают ИИ-детектору достаточно контекста и могут давать менее устойчивую оценку. Также исключались работы, где после очистки оставалось меньше 10 подходящих абзацев или слишком маленький объем основной части.

Почему анализировали абзацы, а не весь документ

Одна выпускная работа может состоять из очень разных фрагментов. Введение может быть написано шаблонно, основная часть — в более индивидуальной манере, а заключение — снова в стандартном академическом стиле. Если проверять весь документ целиком, эти различия сглаживаются. Поэтому каждый абзац проверялся отдельно. Так можно увидеть не только общий показатель по работе, но и распределение: какие части текста чаще получают метку AI, а какие выглядят более естественно для детектора.

Как работал ИИ-детектор

Для исследования использовался LLM-детектор, обученный отличать человеческие тексты от фрагментов, похожих на генерацию языковых моделей. Детектору подавался отдельный абзац, а на выходе модель определяла, относится ли фрагмент к человеческому тексту или к AI-генерации. Если абзац классифицировался как машинный текст, дополнительно фиксировалась предполагаемая группа модели-генератора. Детектор оценивает не историю создания документа, а языковые признаки: структуру, повторяемость, предсказуемость формулировок, академическую шаблонность и другие стилистические паттерны. Поэтому результаты исследования использовались только для агрегированной аналитики: по годам, разделам и группам текстов.

Как считалась AI-доля

Доля текста, классифицированного как AI, считалась по символам, а не по количеству абзацев. Метод расчета предельно прозрачен: число знаков в фрагментах, которые детектор отнес к ИИ, делят на суммарный объем всех проанализированных абзацев. Например, если после очистки в работе осталось 100 тыс. символов содержательного текста, а 25 тыс. символов пришлись на абзацы, которые детектор отнес к машинному тексту, AI-доля такой работы составляла 25%. Такой подход делает оценку устойчивее: длинные содержательные абзацы сильнее влияют на итоговый показатель, чем короткие фрагменты.

Чем проверка на ИИ отличается от антиплагиата

Антиплагиат обычно ищет совпадения с уже опубликованными источниками: сайтами, статьями, рефератами, базами работ. ИИ-детектор решает другую задачу: он оценивает, насколько текст похож на машинную генерацию или переработку. Поэтому эти проверки нельзя заменять друг другом. Текст может быть оригинальным с точки зрения заимствований, но выглядеть AI-подобным для детектора. И наоборот: текст может быть написан человеком, но содержать совпадения с источниками. В исследовании анализировались именно признаки ИИ-генерации и LLM-переработки, а не заимствования.

Ограничения методологии

У исследования есть несколько важных ограничений. ИИ-детектор не дает абсолютной оценки, он работает с вероятностными признаками генерации текста. Академический стиль сам по себе может повышать вероятность срабатывания, особенно во введениях, заключениях и фрагментах с типовыми формулировками. Детектор может по-разному реагировать на тексты разных языков и на тексты, прошедшие через перевод или редактуру. AI-доля не показывает, какую именно роль играла нейросеть: генерация с нуля, редактура, перевод, перефразирование или помощь с отдельными формулировками. Именно поэтому главная ценность исследования — не в отдельных процентах, а в сравнении периодов и крупных трендов.

Главный вывод

Исследование показало: после выхода нейросетей в широкий доступ в академических текстах заметно выросла доля фрагментов, которые ИИ-детектор классифицирует как похожие на машинную генерацию или переработку.

При этом результаты проверки важно читать аккуратно. Они показывают не «историю создания» конкретного текста, а языковые признаки, которые становятся заметными на большом корпусе. Главный вывод не в том, что нейросети «заменили» авторов, а в том, что они стали частью академического письма. Поэтому дальше важнее не спорить о самом факте использования ИИ, а выстраивать понятные правила: где нейросети допустимы как инструмент редактуры, как фиксировать их использование и как отличать помощь с текстом от подмены самостоятельной работы.

Источник: Пресс-служба компании ReText.AI

Печать Печать без изображений Все новости и статьи

Успех в партнерстве

Curator

Дмитрий Ткачев, CURATOR: «Наше главное преимущество — в том, что партнёру с нами легко»

Компанию CURATOR мы уже представляли весной 2025 г., — тогда её глава рассказал в интервью нашему изданию о принципах работы вендора, о его канальной политике и о перспективах развития избранного направления бизнеса …

ICL Техно

ICL Техно: между «крепче стали» и гибкостью

«Стали крепче!» — лаконичный слоган XII мультивендорного форума ICL Partner Connect в 2025 г. приобрел особое значение. Это не просто констатация успехов в импортозамещении, но и, что гораздо важнее, демонстрация реальной готовности к дальнейшей напряженной борьбе за достижение технологического суверенитета.

Curator

Дмитрий Ткачев, Curator: «Чем дольше с нами клиент, тем больше зарабатывает партнёр»

О принципах работы компании, её канальной политике и перспективах развития избранного ею направления бизнеса изданию IT Channel News рассказывает генеральный директор Curator Дмитрий Ткачев.

Промопрограммы

NETLAB, CBR

Мотивационная программа «БонусМИКС»

1 июля — 15 августа

MERLION, Gigabyte

Мониторинг выгоды

13 июля — 13 августа

ЛТ-ТИМ, Базальт СПО

Базальт СПО: старт продаж для новых партнёров

1 июня — 30 сентября

Кадровые изменения

ЛАБ СП: Андрей Филатов

Андрей Филатов назначен генеральным директором ЛАБ СП.

R-Style Softlab: Сергей Вершков

R-Style Softlab объявляет о назначении Сергея Вершкова Генеральным директором.

Фото- и видеорепортажи

Крона КС

Сквозь жару — к вершине: компания «Крона‑КС» покорила гору Сугомак

Импульс Телеком

Лето offline: Digital-круиз с «Импульс Телеком» – традиция профессионального общения, которая объединяет ИТ-сообщество

Опрос

Новости ИТ-бизнеса и статьи

Налоговое стимулирование российской науки

Институт статистических исследований и экономики знаний (ИСИЭЗ) НИУ ВШЭ на основе данных ФНС России анализирует объем налоговых льгот …

Крупнейшие операторы связи запускают бесплатный и безлимитный доступ к мессенджеру Мах

Операторы связи из «большой четвёрки» с 1 августа начнут предоставлять своим абонентам возможность использовать национальный мессенджер Мах без …

Технологическая компания «Мой Контейнер» перенесла ИТ-инфраструктуру на платформу MWS Cloud Platform

MWS Cloud, входит в МТС Web Services, сообщает, что технологическая компания «Мой Контейнер» (бренд MyContainers) перенесла свою ИТ-инфраструктуру на …

«ГазонCity» завершил миграцию на российскую CRM-систему BPMSoft

Российский производитель материалов для благоустройства и озеленения «ГазонCity» завершил переход с зарубежной CRM-системы на отечественное решение …

SuperJob: реже всего опаздывают на работу сотрудники 45+

3 из 4 россиян никогда не опаздывают на работу. В опросах компании SuperJob приняли участие 3000 представителей экономически активного населения …

Аналитика

20 лучших региональных ИТ-компаний 2025

IT Channel News публикует результаты 18-го исследования лучших региональных ИТ-компаний. В этот раз, в отличие от предыдущих рейтингов, мы представляем не 25, а 20 победителей.

25 лучших российских системных интеграторов 2025

IT Channel News публикует результаты очередного исследования «25 лучших российских системных интеграторов» и представляет победителей 2025 года.

25 лучших региональных ИТ-компаний 2024

IT Channel News публикует результаты очередного — уже 17-го! — исследования «25 лучших региональных ИТ-компаний» и представляет победителей 2024 года.

Новые ИТ-продукты

Астра

Omnissa предложила заменить виртуальные рабочие места защищённым браузером

Астра

Исследование Termidesk: российский рынок VDI остаётся неоднородным, но требования заказчиков становятся всё более зрелыми

Intrend

Расширение серии AC Intrend ITSPK-425 ― модели ITSPK-CL425T-B и ITSPK-CL425T-G уже на складе AUVIX

Истории успеха

1С-Рарус

«1С‑Рарус» упростил кадровый документооборот для сотрудников группы предприятий «Готэк»

Галэкс, ГК

Галэкс подтвердил партнерский статус YADRO на 2026 год