Компания уже использовала свой ИИ, решающий сворачивание белков, AlphaFold, для создания структур для протеома человека, а также дрожжей, дрозофил, мышей и многих других.
Еще в декабре 2020 года DeepMind удивила мир биологии, решив 50-летнюю грандиозную задачу с помощью AlphaFold, инструмента искусственного интеллекта, который предсказывает структуру белков. На прошлой неделе лондонская компания опубликовала
полную информацию об этом инструменте и опубликовала его исходный код.
Теперь компания объявила, что она
использовала свой ИИ для предсказания формы почти каждого белка в организме человека, а также форм сотен тысяч других белков, обнаруженных в 20 наиболее широко изученных организмах, включая дрожжи, фрукты, мух и мышей. Этот прорыв может позволить биологам со всего мира лучше понимать болезни и разрабатывать новые лекарства.
На данный момент сокровищница состоит из 350 000 недавно предсказанных белковых структур. DeepMind заявляет, что в ближайшие несколько месяцев они спрогнозируют и опубликуют еще более чем 100 миллионов структур - более или менее все белки, известные науке.
«Сворачивание белков - это проблема, к которой я присматривался более 20 лет», - говорит соучредитель и генеральный директор DeepMind Демис Хассабис. «Для нас это был огромный проект. Я бы сказал, что это наибольшее, что мы сделали на данный момент. И это в каком-то смысле самое захватывающее, потому что оно должно иметь самое большое влияние в мире за пределами искусственного интеллекта ».
Белки состоят из длинных лент аминокислот, которые скручиваются в сложные узлы. Знание формы белкового узла может выявить, что делает этот белок, что имеет решающее значение для понимания того, как действуют болезни и разработки новых лекарств, или выявления организмов, которые могут помочь справиться с загрязнением и изменением климата. Определение формы белка в лаборатории занимает недели или месяцы. AlphaFold может предсказывать формы до ближайшего атома за день или два.
Новая база данных должна сделать жизнь биологов еще проще. AlphaFold может быть доступен для использования исследователями, но не каждый захочет запускать программное обеспечение самостоятельно. «Намного проще взять структуру из базы данных, чем запустить ее на своем компьютере», - говорит Дэвид Бейкер из Института дизайна белков при Вашингтонском университете, чья лаборатория создала собственный инструмент для прогнозирования структуры белка, названный RoseTTAFold, основанный на подходе AlphaFold.
В последние несколько месяцев команда Бейкера работала с биологами, которые раньше застревали, пытаясь выяснить форму белков, которые они изучали. «Есть много интересных биологических исследований, которые действительно ускорились», - говорит он. Общедоступная база данных, содержащая сотни тысяч готовых форм белка, должна стать еще большим ускорителем.
«Это выглядит удивительно впечатляющим», - говорит Том Эллис, синтетический биолог из Имперского колледжа Лондона, изучающий геном дрожжей, который рад попробовать эту базу данных. Но он предупреждает, что большинство предсказанных форм еще не было проверено в лаборатории.
Атомная точностьВ новой версии AlphaFold прогнозы имеют показатель достоверности, который инструмент использует для обозначения того, насколько, по его мнению, каждая предсказанная форма близка к реальной. Используя эту характеристику, DeepMind обнаружил, что AlphaFold предсказывает формы для 36% человеческих белков с точностью до уровня отдельных атомов. По словам Хассабиса, этого достаточно для разработки лекарств.
Раньше, после десятилетий работы, только 17% белков человеческого тела имели структуру, идентифицированную в лаборатории. Если прогнозы AlphaFold столь же точны, как говорит DeepMind, инструмент увеличил это число более чем вдвое всего за несколько недель.
Даже прогнозы, которые не являются полностью точными на атомарном уровне, по-прежнему полезны. AlphaFold предсказал форму более чем половины белков в организме человека, которая должна быть достаточно хорошей, чтобы исследователи могли определить функцию белка. Остальные текущие прогнозы AlphaFold либо неверны, либо относятся к трети белков в человеческом теле, которые вообще не имеют структуры, пока не свяжутся с другими. «Они гибкие, - говорит Хассабис.
«Тот факт, что его можно применять на таком уровне качества, впечатляет», - говорит Мохаммед АльКураиш, системный биолог из Колумбийского университета, который разработал собственное программное обеспечение для прогнозирования структуры белка. Он также указывает, что наличие структур для большинства белков в организме позволит изучить, как эти белки работают как система, а не только по отдельности. «Это то, что я считаю наиболее перспективным», - говорит он.
DeepMind выпускает свои инструменты и прогнозы бесплатно и не сообщает, планирует ли он зарабатывать на них деньги в будущем. Однако это не исключает возможности. Чтобы создать и запустить базу данных, DeepMind сотрудничает с Европейской лабораторией молекулярной биологии, международным исследовательским учреждением, в котором уже есть большая база данных с информацией о белках.
На данный момент AlQuraishi не может дождаться, чтобы увидеть, что исследователи сделают с новыми данными. «Это просто поразительно, - говорит он, - я не думаю, что кто-то из нас думал, что мы окажемся здесь так быстро. Это ошеломляет».
на англ.