Машинное обучение может помочь создавать белки гораздо точнее и быстрее, чем это было возможно ранее

За последние два года машинное обучение произвело революцию в прогнозировании структуры белков. Теперь три статьи в журнале Science описывают подобную революцию в дизайне белков.

В новых работах биологи из Медицинской школы Вашингтонского университета показывают, что машинное обучение можно использовать для создания белковых молекул гораздо точнее и быстрее, чем это было возможно ранее. Ученые надеются, что этот прогресс приведет к появлению множества новых вакцин, методов лечения, инструментов для улавливания углерода и устойчивых биоматериалов.

«Белки играют фундаментальную роль в биологии, но мы знаем, что все белки, обнаруженные в каждом растении, животном и микробе, составляют гораздо меньше одного процента от возможного. С помощью этих новых программных инструментов исследователи должны быть в состоянии найти решения для долговременных проблем». — постоянные проблемы в медицине, энергетике и технологиях», — сказал старший автор Дэвид Бейкер, профессор биохимии в Медицинской школе Вашингтонского университета и лауреат Премии за прорыв 2021 года в области наук о жизни.

Белки часто называют «строительными блоками жизни», потому что они необходимы для структуры и функционирования всех живых существ. Они участвуют практически во всех процессах, происходящих внутри клеток, включая рост, деление и восстановление. Белки состоят из длинных цепочек химических веществ, называемых аминокислотами. Последовательность аминокислот в белке определяет его трехмерную форму. Эта сложная форма имеет решающее значение для функционирования белка.

Недавно мощные алгоритмы машинного обучения, включая AlphaFold и RoseTTAFold, были обучены предсказывать детализированные формы природных белков исключительно на основе их аминокислотных последовательностей. Машинное обучение — это тип искусственного интеллекта, который позволяет компьютерам учиться на данных без явного программирования. Машинное обучение можно использовать для моделирования сложных научных проблем, которые слишком сложны для понимания людьми.

Чтобы выйти за рамки белков, встречающихся в природе, члены команды Бейкера разбили задачу проектирования белков на три части и использовали новые программные решения для каждой из них.

Во-первых, должна быть создана новая форма белка. В статье, опубликованной 21 июля в журнале Science , команда показала, что искусственный интеллект может генерировать новые формы белков двумя способами. Первый, получивший название «галлюцинация», похож на DALL-E или другие генеративные инструменты искусственного интеллекта, которые производят вывод на основе простых подсказок. Вторая, получившая название «раскрашивание», аналогична функции автозаполнения, используемой в современных панелях поиска.

Gaia Herbs, Ресвератрол 150, 50 веганские фито-капсулы с жидкостью

Gaia Herbs, Ресвератрол 150, 50 веганские фито-капсулы с жидкостью

Во-вторых, чтобы ускорить процесс, команда разработала новый алгоритм генерации аминокислотных последовательностей. Этот программный инструмент, названный ProteinMPNN, описанный в выпуске журнала Science от 15 сентября, работает примерно за одну секунду. Это более чем в 200 раз быстрее, чем предыдущее лучшее программное обеспечение. Его результаты превосходят результаты предыдущих инструментов, и программное обеспечение не требует специальной настройки для запуска.

«Нейронные сети легко обучить, если у вас есть тонна данных, но с белками у нас не так много примеров, как хотелось бы. Нам пришлось пойти и определить, какие функции в этих молекулах являются наиболее важными. был методом проб и ошибок», — сказал ученый проекта Юстас Даупарас, научный сотрудник Института белкового дизайна.

В-третьих, команда использовала AlphaFold, инструмент, разработанный Alphabet’s DeepMind, для независимой оценки того, могут ли аминокислотные последовательности, которые они придумали, складываться в намеченные формы.

«Программное обеспечение для прогнозирования белковых структур является частью решения, но само по себе оно не может придумать ничего нового», — пояснил Даупарас.

«ProteinMPNN — это то же самое, что AlphaFold для предсказания структуры белка, — добавил Бейкер.

В другой статье, опубликованной в журнале Science 15 сентября, команда из лаборатории Бейкера подтвердила, что комбинация новых инструментов машинного обучения может надежно генерировать новые белки, которые функционировали в лаборатории.

«Мы обнаружили, что белки, полученные с помощью ProteinMPNN, с гораздо большей вероятностью складывались, как предполагалось, и мы могли создавать очень сложные сборки белков, используя эти методы», — сказал ученый проекта Бэзил Вики, научный сотрудник Института дизайна белков.

Среди новых созданных белков были наноразмерные кольца, которые, по мнению исследователей, могут стать частями нестандартных наномашин. Электронные микроскопы использовались для наблюдения за кольцами, диаметр которых примерно в миллиард раз меньше диаметра макового зернышка.

«Это самое начало машинного обучения в дизайне белков. В ближайшие месяцы мы будем работать над улучшением этих инструментов, чтобы создавать еще более динамичные и функциональные белки», — сказал Бейкер.

Компьютерные ресурсы для этой работы были предоставлены Microsoft и Amazon Web Services.

Похожие статьи

Leave a Comment

Your email address will not be published. Required fields are marked with *

ИССЛЕДОВАНИЯ

ПОЛЕЗНЫЕ СТАТЬИ