Paperai от NeuML — поисковая система для научных статей на базе искусственного интеллекта. Она автоматизирует утомительный процесс обзора большого количества литературы и освобождает исследователям время для решения других задач.
Программа написана на Python и работает с PDF, загруженными в базу данных. На любой запрос алгоритмы классификации текста из fastText от Facebook AI Research и поисковые функции ищут в базе релевантные работы. Результат — отчет с основными структурными элементами научного текста и ключевыми тезисами.
Paperai уже использовалась в анализе открытых данных исследования COVID-19, получив несколько наград в испытании CORD-19 Kaggle. Ее применение не ограничено одной медициной: в репозитории есть все, чтобы протестировать работу системы или настроить поиск для собственной коллекции научных работ.
Ссылка на репозиторий.
