За несколько дней система AlphaFold предсказывает трехмерную структуру, в которую может свернуться одномерная кислотная последовательность с точностью до величины, сопоставимой с шириной атома. На минуточку, 10^300 возможных вариантов для типичного белка. Чтобы просто перебрать их вручную, не хватило бы всего времени, что уже прошло в нашей вселенной.

Прогнозирование структуры белков позволит лучше понять механизмы распространения болезней и их влияния на человеческих организм. В свою очередь, это даст возможность блокировать их, исправлять сбои в белках, эффективнее разрабатывать лекарства и придумывать новые методы лечения.

После двух лет разработки, в 2018 году ученые из DeepMind при помощи AlphaFold лучше всех участников соревнования CASP смогли вслепую предсказать белковую структуру, которая еще только недавно была определена экспериментально и нигде не публиковалась.

Сейчас они увеличили точность моделирования аминокислотных остатков структуры с 68.5 процентов до 92.4! И в три раза за последние 30 лет исследования проблемы. Ниже зеленым изображен загаданный CASP белок, синим — предсказание AlphaFold.

Еще нет опубликованных статей, но ученые уже немного рассказывают о своей разработке:

— Нейросеть интерпретирует свернувшийся белок как трехмерный граф и использует в расчетах эволюционно связанные последовательности и их множественное выравнивание (процедура оценки эволюционного происхождения нуклеотидных последовательностей).

— Ее обучали на общедоступных данных, состоящих из 170 тысяч структур из банка данных белков и белках неизвестной структуры в течение нескольких недель.

— Система работает на 128 ядрах TPUv3 (нейронные процессоры от Google для Tensorflow), это как 100-200 профессиональных видеокарт от NVIDIA.

    Полезные материалы в одной еженедельной рассылке
    Подписывайтесь, не пожалеете.