Ученых проверят искусственным интеллектом

Издание:
Коммерсантъ
Дата
4 марта 2020
Автор:
Юлия Тишина

Государство в рамках нацпроекта «Цифровая экономика» выделило 180 млн руб. на систему по борьбе с плагиатом в научных статьях. Их получит компания «Антиплагиат», которая планирует направить средства в том числе на разработку технологии, позволяющей находить заимствования из текстов на других языках. Эксперты надеются, что это позволит бороться с волной некачественных публикаций в зарубежных журналах, за которые российские вузы получают гранты на миллиарды рублей в год.

Компания «Антиплагиат», разрабатывающая систему поиска заимствований в русскоязычных текстах, получила грант Российской венчурной компании (РВК) в рамках направления «Искусственный интеллект» (ИИ) нацпроекта «Цифровая экономика» в размере 180 млн руб., сообщили “Ъ” в РВК. Средства будут направлены на создание промышленного решения, которое позволит находить в текстах переводные заимствованные фрагменты независимо от языка первоисточника. Для финансирования проекта компания также выделила собственные средства в размере 50% от суммы гранта, уточнил исполнительный директор «Антиплагиата» Юрий Чехович.

АО «Антиплагиат» зарегистрировано в мае 2005 года, бенефициары компании — ее основатели — физические лица, пояснил господин Чехович. Ее основные заказчики — вузы, научно-исследовательские учреждения, научные издательства и учреждения среднего образования. Сервис индексирует более 800 млн источников на разных языках. Его выручка по итогам 2017 года составила 117,5 млн руб., чистая прибыль — 25,6 млн руб., следует из данных «СПАРК-Интерфакса».

В рамках тестирования технологии «Антиплагиат» уже обнаружил 20 тыс. российских научных статей, содержащих заимствования из англоязычных источников, утверждают в компании. Сейчас система распознает заимствования из источников на русском, английском и казахском и планирует выйти с новым продуктом на зарубежные рынки — в Латинскую Америку, арабские страны, Индию и Восточную Европу. «Мы видим тенденцию, что если раньше заимствования были в основном в рамках русского языка, то с развитием технологий машинного перевода случаи перевода текстов, например, с английского на русский участились»,— отметил господин Чехович.

Технология распознавания переводного плагиата в декабре 2019 года также появилась в системе «Диссернет», которая организована на волонтерских началах сообществом профессиональных ученых. Проект занимается проверкой диссертаций и научных статей на наличие плагиата и не планирует привлекать инвестиции. «Мы не продаем свои услуги, работаем на бесплатной основе, сейчас планируем сбор средств с помощью краудфандинга для обновления сайта»,— отметил сооснователь проекта Андрей Ростовцев.

Проблема переводного плагиата в научных статьях сейчас стоит очень остро, уверен господин Ростовцев. По его словам, «Диссернет» фиксирует десятки тысяч статей, которые засылаются в иностранные журналы, входящие в престижные базы данных — SCOPUS или WoS. «Волна таких публикаций началась после майских указов президента, в числе которых было увеличение доли публикаций российских ученых в иностранных научных изданиях. После этого начали активно расти компании, которые предлагают услуги по подготовке научных статей на иностранном языке, к услугам которых начали прибегать вузы»,— поясняет Андрей Ростовцев. При выполнении нормы по публикациям в зарубежных журналах вузы получают гранты, уточняет он, оценивая потери федерального бюджета от такой деятельности примерно в 10 млрд руб. ежегодно.

Применение ИИ в анализе текста и обработки естественного языка интересует и крупный бизнес. Так, 2 марта МТС сообщила, что совместно со «Сколтехом» открыла лабораторию ИИ, деятельность которой направлена на создание новых моделей анализа текстов на русском языке. Представитель МТС отмечает, что работа с текстами «стала одним из самых важных направлений развития технологий, а полное понимание смысла текста сейчас является ключевым направлением для научных исследований».

Последние публикации

Как реформа высшего образования повлияла на активность аспирантов
Инна Серова
Несмотря на приказы министерства, регалии «разжалованных» ученых продолжают «светиться» на официальных сайтах
Михаил Гельфанд
О манипуляции с данными в медицинских диссертациях