Искусственный Интеллект Осваивает Проектирование Белков: Новые Методы для Инженерии Белков
Машинное обучение теперь используется для создания синтетических светочувствительных ферментов, которые эффективно функционируют внутри живых клеток. Искусственный интеллект произвел революцию в нашем понимании структуры белков, о чем свидетельствует пример AlphaFold2 от DeepMind, предсказавший структуры 200 миллионов белков. Теперь Дэвид Бейкер и его исследовательская группа из Университета Вашингтона сделали следующий шаг в этой области. В исследовании, опубликованном 22 февраля в журнале Nature, они продемонстрировали, как ИИ может быть использован для проектирования функциональных белков на заказ, которые затем можно синтезировать и производить внутри живых клеток. Этот прорыв открывает новые возможности для инженерии белков. Али Мадани, основатель и генеральный директор компании Profluent, специализирующейся на разработке белков с использованием ИИ, высоко оценил исследование, отметив, что оно представляет собой значительный скачок в данной области и знаменует собой "появление новой дисциплины."
Белки состоят из различных аминокислот, которые организованы в сложные свернутые цепи, что приводит к огромному разнообразию трехмерных форм. Прогнозирование 3D-структуры белка на основе одной лишь аминокислотной последовательности является сложной задачей из-за множества факторов, влияющих на сворачивание белков, включая аминокислотную последовательность, взаимодействия молекул и поверхностные модификации, такие как гликозилирование. Традиционно ученые использовали экспериментальные методы, такие как рентгеновская кристаллография, для определения структуры белков. Этот метод включает в себя дифракцию рентгеновских лучей через кристаллизованные белки, что позволяет раскрыть детальные атомные структуры. Однако такие методы требуют значительных затрат, времени и технической экспертизы. Несмотря на эти трудности, рентгеновская кристаллография позволила исследователям создать карты тысяч структур белков, предоставив ценную базу данных для обучения ИИ-моделей. Система AlphaFold от DeepMind продемонстрировала, что машинное обучение может с высокой точностью предсказывать структуру белков, а AlphaFold2 достигла еще большей точности, обучившись на 170 000 структурах белков.
В тот же день, когда была опубликована статья об AlphaFold2, Бейкер и его команда представили независимый, свободно доступный инструмент под названием RoseTTAFold, который предсказывает структуры белков с точностью, сопоставимой с AlphaFold2.
С тех пор Бейкер и его коллеги изучают возможность использования машинного обучения для обратного проектирования аминокислотных последовательностей гипотетических белков, которые могут иметь промышленное или медицинское применение. Традиционно инженерия белков включает внесение поэтапных изменений в белки и оценку их эффектов, например, введение случайных мутаций в ген, кодирующий белок, и затем скрининг полученных белков на наличие желаемых свойств. Бейкер отмечает, что с помощью ИИ "мы можем создавать еще лучшие дизайны" для этих белков "быстрее, чем когда-либо прежде."
Для оценки своего подхода к проектированию белков команда сосредоточилась на категории светящихся ферментов, известных как люциферазы (происходит от латинского слова "светоносец"). Эти ферменты, которые излучают свет при взаимодействии с небольшими молекулами, называемыми люциферинами, присутствуют в различных организмах, включая светлячков и морских существ, обитающих в темных глубинах океана.
В отличие от флуоресцентных белков, люциферазы не требуют внешнего источника света для свечения, что делает их особенно ценными для визуализации глубоких тканей. Однако природные люциферазы встречаются редко, многие из них нестабильны и лучше связываются с естественными люциферинами, чем с синтетическими, разработанными для оптимальных свойств. Это создавало трудности в использовании люцифераз в научных исследованиях и в проектировании искусственных версий этих ферментов.
Используя комплекс ИИ-систем, включая AlphaFold2, Protein MPNN и trRosetta, команда стремилась разработать аминокислотную последовательность для люциферазы, которая могла бы эффективно связываться с синтетическим люциферином, сохраняя при этом стабильность. Поскольку природные люциферазы слабо связываются с синтетическим люциферином, исследователи использовали машинное обучение для оценки того, как 4000 белков, известных своим связыванием с малыми молекулами, сравниваются по эффективности связывания. Они выделили перспективную группу: суперсемейство белков, подобных фактору ядерного транспорта 2 (NTF2), у которых имеется карман для связывания, подходящий для синтетического люциферина. Тем не менее, длинные петли в белках, подобных NTF2, могли вызывать неправильное сворачивание в синтетических версиях. Эти петли, хотя и не являются необходимыми для активности люциферазы, были заменены на более стабильные аминокислотные последовательности с использованием методов машинного обучения.
Подход, основанный на ИИ, привел к созданию 7648 новых дизайнов белков. Эти дизайны затем были протестированы на способность излучать свет при взаимодействии с синтетическим люциферином в клетках. Тестирование показало, что только три из дизайнов (0,04%) были успешными.
Али Мадани, основатель и генеральный директор Profluent, признает трудности в проектировании ферментов из-за необходимости точной функциональности, называя любой успех "очень впечатляющим." Хотя инструмент ИИ компании Profluent, ProGen, имеет показатель успеха выше 50%, Мадани отмечает, что сравнение различных подходов ИИ затруднено, так как каждый из них оптимизирован для различных типов проектирования белков.
На основе первых результатов команда улучшила свой процесс проектирования, чтобы создать дополнительные люциферазы для другого синтетического люциферина, достигнув 4% успешности из 46 потенциальных дизайнов. Энди Сиен-Вей Йе, постдокторант в лаборатории Бейкера, объясняет, что полученные на первом этапе данные помогли уточнить понимание геометрии, необходимой для эффективного проектирования люцифераз. Этот опыт также способствовал созданию компании Monod Bio, которая лицензировала их синтетические люциферазы.
Несмотря на эти достижения, проектирование белков пока не полностью автоматизировано. Бейкер отмечает, что все еще "есть пространство для улучшений", поскольку для совершенствования активного центра фермента люциферазы потребовались ручные корректировки. Он видит будущее, где ИИ сможет проектировать белки "сразу из коробки," хотя признает, что более сложные химические реакции представят дополнительные вызовы.
В будущем Бейкер и его команда разрабатывают новую систему ИИ, RFdiffusion, чтобы еще больше упростить процесс проектирования белков. Они планируют использовать эту систему для создания синтетического белка для назального спрея, направленного на предотвращение гриппа путем блокирования прикрепления вируса к клеткам-хозяевам. Ожидается, что производство сверхстабильных белков позволит этому назальному спрею обеспечивать длительную защиту в сезон гриппа. В дополнение к профилактике гриппа, Бейкер предсказывает, что этот подход, основанный на ИИ, в конечном итоге может быть использован для проектирования новых биоматериалов, ферментов для разложения пластика и белков для захвата солнечной энергии.
Источник: https://www.the-scientist.com/now-ai-can-be-used-to-design-new-proteins-70997