Нейросеть научили предсказывать структуру белка

Нейросети как двигатель медицины. Миф или реальность? Означает ли это прорыв в биотехнологиях? И нужны ли в России подобные разработки?

2 года назад

Нейросеть научили предсказывать структуру белка

pixabay

Искусственный интеллект помогает обрабатывать такие массивы данных, которые раньше были недоступны. Принято считать, что для машинного обучения всегда требуется огромная big data: терабайты, петабайты, эксабайты данных. Но это не так. Здесь как раз важнее качество данных, а не их количество. Новая разработке Google Research и Европейского института биоинформатики позволяет предсказывать структуру, функции и свойства белков. Что это означет для современной биохимии и поможет ли современной медицине, разбираемся вместе со таршим научным сотрудником в Лаборатории моделирования биомолекулярных систем Института биоорганической химии РАН. Сооснователем и главным редактором сайта Биомолекула Антоном Чугуновым.

Нейросети. Это слово появилось в нашей жизни не так давно (Deep Mind основана в 2010 году), но уже заняло в ней свое прочное место. Где только не применяют математические алгоритмы – в соцсетях, на дорогах, в бизнесе, поисковых операциях, в космических исследованиях, науке, медицине. Нейросети пишут музыку, стихи, создают фейковые фото и видео, но главное - они способны обучаться.

Например, нейронная сеть глубокого обучения Google Research и Европейского института биоинформатики, представленная на днях - способна предсказывать структуру, функции и свойства белков. Научная работа доступна в виде интерактивной демонстрации, как препринт на Биоархиве.

Для чего необходима эта разработка?

Мир нуждается в быстрой и легкой разработке ферментов для биотоплива, современных экологичных биохимикатов. И, конечно, новых медицинских препаратах.

Нейросеть ProteInfer предсказывает свойства (и функции) белка по его аминокислотной последовательности (иначе говоря, первичной структуре).

"Это новаторское достижение, но нельзя сказать, чтобы это абсолютная новинка - функциональная характеристика давно доступна в форме онтологий GO (Gene ontology), в рамках которых любому белку может быть приписано несколько термов из классификатора, объединяющего полное разнообразие функций белков, открытых к настоящему моменту" - рассказал AMMIAC. биолог Антон Чугунов.

По его словам, отличие новой работы в том, что в этой нейросети характеристика делается не на основе сравнения с другими белками (путем построения выравниваний последовательностей - как это делают программы предыдущего поколения), а как бы "напрямую" по одной только последовательности.

Работа с белками ведется специалистами из Google по искусственному интеллекту уже не первый год. Предыдущим прорывом в молекулярной биологии стало применение ИИ командой DeepMind, которая создала нейросеть AlphaFold.

Она также без "образца" предсказывала трехмерное строение белков. Предыдущее поколение программ, основанное на принципе моделирования по гомологии* - достигает этого же результата, используя структуры родственных белков.

Как работает нейросеть ProteInfer?

Каждый белок обладает конкретной функцией. То есть определенными качествами переноса электрона, образования или разрыва химических связей. Белковые последовательности для исследования берутся в природе, чаще всего у микроорганизмов. Все-таки человеческий белок пока для нас тайна за семью печатями. Геном человека расшифрован, по разным оценкам, на 1,5–2%.

Тем не менее, процесс идет все быстрее. В глобальных базах сейчас ежедневно появляются тысячи таких последовательностей. Но без описания функций белка это просто список без объяснения. С помощью ProteInfer ученым удалось сразу на 10% увеличить количество аннотаций с описаниями функций белков. В том числе, удалось добавить 360 новых аннотаций белков человека. А значит понять их предназначение в организме.

"Это фундаментальный научный результат, а не технология и уж точно не средство драг-дизайна. Методика уже реализована в виде нересурсоемкого JS-модуля, который прямо на страничке с демкой программы делает предсказания в реальном времени" - считает Антон Чугунов.

Нужны ли такие разработки в России?

Пока ничего подобного у нас не делается. Но не потому, что мы не можем. Просто здесь термин «импортозамещение» лишен смысла. Наука – не нечто национальное. Это глобальная сфера, где все занимаются чем-то своим. Никто не будет делать то, что уже удалось другим. Может быть только, чтобы проверить результаты и собственное освоение метода в новой области, появившейся всего несколько лет назад.

Тем более, что программные разработки Google открыты и ими может воспользоваться любой желающий. Конечно, если это происходит для коммерческого использования, в дело вступают механизмы использования интеллектуальной собственности и ее лицензирования.

Нейросети действительно смогут создавать лекарства?

Это не совсем так. Технология ProteInfer вообще не является методикой драг-дизайна*. Это фундаментальный научный результат, позволяющий предсказывать функции неизвестного белка. Но создание лекарств идет другим путем.

"Сначала изучают механизм заболевания, потом ищут мишень для лекарства, потом проводят драг-дизайн или подбор действующего вещества, потом проводят доклинические и, наконец, клинические исследования" - рассказывает Антон Чугунов.

Каждый проект создания лекарства обычно занимает больше 10 лет разработок и больше 1-2 млрд долларов затрат.

Может ли Россия конкурировать на этом рынке?

Мнение специалистов на этот счет далеко от оптимизма. В стране всего несколько биотех-компаний, производящих что-то инновационное, и исчезающе редкие случаи - когда это что-то оригинальное и разработанное. Многие компании производят дженерики* - лекарства, на которые истекли патенты, и которые может производить кто угодно. Но и в этом случае часто фармсубстанция закупается за границей, а у нас только расфасовывается по таблеткам/ампулам/шприцам.

"Один из немногих примеров это Биокад, но и он поднялся в основном на дженериках да на госзаказах -- по производству терапевтических антител принадлежащих в так называемому «второму поколению" лекарств. Насколько мне известно, у компании есть буквально несколько оригинальных проектов, с которыми она хотела выйти на международный рынок, но сейчас в связи с санкциями эти планы наверняка будут разрушены" - сокрушается Чугунов.

Более того, по словам специалиста, в России нет и нормальной фармшколы - зато есть куча альтернативщиков, производящих гомеопатию или лекарства с недоказанной эффективностью.

"Это средневековье и стыд, а не современная фармотрасль" - считает Антон Чугунов.

И с ним трудно не согласится.

Гомология (от греч. homologia - соответствие, согласие), соответствие органов у организмов разных видов, обусловленное их филогенетическим родством.

Драг-дизайн (от английского: drug — лекарственный препарат, design — проектирование) – это наиболее краткий и удобный термин для целого процесса, разработки и создания лекарственных препаратов с участием современной вычислительной техники и компьютерных программ по моделированию мишеней и способов взаимодействия с ними молекул активных веществ.

Дженерик (англ. generic drug) — лекарственное средство, содержащее химическое вещество — активный фармацевтический ингредиент, идентичный запатентованному компанией — первоначальным разработчиком лекарства.

Автор:

Материалы по теме

Российские ученые запатентовали изобретение для лечения сахарного диабета

2 года назад

Добавьте нас в Избранное в Яндекс.Новостях

Новости партнеров:

Новости