В недавнем исследовании, опубликованном в Molecular Systems Biology , исследователи продемонстрировали, что для более эффективного использования AlphaFold2 для открытия антибиотиков необходимы достижения в моделировании взаимодействий белок-лиганд с использованием подходов, основанных на машинном обучении.
Фон
Основной проблемой при открытии лекарств является идентификация взаимодействия лекарства с мишенью. Исследователи применили несколько подходов к решению этой проблемы, включая биохимические анализы, генетические взаимодействия и молекулярную стыковку. Однако только молекулярный докинг оказался полезным для идентификации взаимодействий белок-лиганд и механизма (механизмов) действия лекарства.
Несмотря на универсальность, докинг требует предварительных знаний о структурах белка. Количество и качество целевых белковых структур еще больше ограничивают его применение для идентификации лекарственных средств-мишеней.
Об исследовании
В настоящем исследовании исследователи использовали недавний выпуск базы данных AlphaFold2 для прогнозирования структуры белков, чтобы включить подходы обратного докинга, которые охватывают основной протеом Escherichia coli ( E.coli ), что позволяет широко прогнозировать мишени связывания антибиотиков. Эти эксперименты могут помочь оценить производительность платформы моделирования и раскрыть точность прогнозов моделирования молекулярной стыковки с поддержкой AlphaFold2.
Предсказанные взаимодействия белок-лиганд между антибиотиками и основными белками могут быть экспериментально исследованы частично с использованием биохимических анализов, которые измеряют ферментативную активность, при этом связывающие взаимодействия поддерживаются ферментативным ингибированием.
Исследователи провели высокопроизводительные скрининги, включающие 39 128 соединений, ингибирующих рост E. coli дикого типа . Эти соединения представляли собой природные материалы, антибиотики и структурно различные молекулы с молекулярной массой от 40 дальтон (Да) до 4200 Да. Все соединения, которые ингибировали относительный рост на 80%, считались активными, и каждое активное соединение было с помощью вычислений состыковано с 296 предсказанным AlphaFold2 основным протеомом E. coli .
В качестве контроля таким же образом стыковали подмножество неактивных соединений. Исследователи использовали AutoDock Vina, широко используемую и проверенную программу стыковки с открытым исходным кодом, чтобы состыковать все 218 активных соединений с 296 основными протеомами, предсказанными AlphaFold2. Это моделирование предсказало как специфические, так и широко распространенные взаимодействия белок-лиганд, а также неразборчивость белков. Наконец, исследователи переоценили прогнозы с помощью четырех функций оценки на основе машинного обучения (SF), а именно: RF-Score, RF-Score-VS, оценка расширенной связи белок-лиган (PLEC) и оценка нейронной сети (NN).
Результаты исследования
В общей сложности 218 антибактериальных соединений были активны в отношении E. coli, из них около 80% были антибиотиками структурных классов β-лактамов, аминогликозидов, тетрациклинов, хинолонов и поликетидов. Остаточные активные соединения состояли из токсинов и противоопухолевых соединений. Исследование также выявило дополнительный набор соединений, антибактериальные свойства которых в отношении кишечной палочки ранее не были задокументированы.
Аналогичным образом, анализ исследования предсказал положение связывания и аффинность связывания 64 528 пар белок-лиганд. Еще 100 неактивных соединений, выбранных случайным образом, привели к предсказанию положения связывания и аффинности для 29 600 пар белок-лиганд с помощью аналогичного моделирования стыковки. Кроме того, исследователи измерили ферментативную активность нескольких белков кишечной палочки , участвующих в репликации дезоксирибонуклеиновой кислоты (ДНК), транскрипции и синтезе клеточной стенки.
Любопытно, что несколько белковых молекул ферментативно ингибировали каждое идентифицированное антибактериальное соединение, что подтверждает обширную неразборчивость. Это явление также позволило оценить производительность модели в статистически значимом масштабе.
Исследователи тщательно сравнили экспериментальные данные о взаимодействиях белок-лиганд с предсказаниями in silico , чтобы продемонстрировать, что в зависимости от используемого порога аффинности связывания этот подход к моделированию имел точность предсказания от 41% до 73%. Независимо от порога аффинности связывания, площадь под кривой рабочей характеристики приемника (auROC) основных белков в среднем составляла 0,48.
Примечательно, что производительность модели оставалась неизменной, даже когда исследователи использовали экспериментально определенные белковые структуры. При условии, что случайная модель соответствует auROC 0,5, эти результаты показали, что моделирование молекулярного докинга показало низкую производительность.
Авторы отметили значительное улучшение производительности модели, измеренное с помощью auROC, с помощью RF-Score, RF-Score-VS и NN-Score. И наоборот, производительность модели не улучшилась при использовании DOCK6.9, и повторная оценка была выполнена с использованием оценки PLEC. Более того, модели консенсуса, включающие несколько SF на основе машинного обучения, улучшили отношение частоты истинных положительных результатов к частоте ложных положительных результатов и точности прогноза.
Выводы
Текущее исследование продемонстрировало, что использование AlphaFold2 для прогнозирования мишеней для лекарств является многообещающим методом, но все еще находится в зачаточном состоянии. Соответственно, реализация его потенциала для открытия лекарств потребует существенных улучшений в моделировании взаимодействий белок-лиганд. Сравнительный анализ производительности моделирования стыковки молекул — один из возможных способов повысить точность прогноза; однако это требует одновременного использования подходов, основанных на машинном обучении. В целом, результаты исследования могут дать информацию о надлежащем использовании AlphaFold2 при разработке лекарств.
Leave a Comment
Your email address will not be published. Required fields are marked with *