С помощью нейросети AlphaFold молекулярные биологи определили примерную трехмерную структуру всех 20 тыс. белков, которые вырабатывают клетки человека. Результаты исследования опубликовал научный журнал Nature.
«Возможность очень точно и быстро определять трехмерную структуру белков приведет к настоящей революции в понимании того, как работают все живые организмы. Уже сейчас можно сказать, что у AlphaFold есть множество применений, связанных со здравоохранением и сельским хозяйтсом», — отметила профессор Европейского института биоинформатики Джанет Торнтон.
За последнее время нейросети научились выполнять нетривиальные задачи и даже «мыслить» творчески — например, они рисуют картины и раскрашивают видеоролики в стиле Ван Гога или Кандинского. Например, недавно математики научили искусственный интеллект распознавать следы меланомы. Нейросеть справляется с этим лучше экспертов-онкологов.
Недавно ученые из британской компании Deepmind разработали нейросеть AlphaFold, которая может решать одну из самых сложных задач в биологии — определять трехмерную форму белковых молекул по их химическому составу. Первые опыты с этой нейросетью показали, что она может определять положение аминокислот внутри молекулы с атомной точностью. Торнтон и ее коллеги попытались с помощью этого алгоритма решить крайне амбициозную задачу — определить структуру всех 20 тыс. белков, «инструкции» по производству которых есть в ДНК человека.
Первая версия AlphaFold достаточно точно определила структуру более 98,5% белков и вычислила точное положение около 60% аминокислот из этих цепочек. Ученые надеются, что блалгодаря этому можно будет ускорить изучение протеома человека.
По обоим показателям AlphaFold превосходит ускорители частиц и другие приборы, с помощью которых ученые пытались изучать структуру белков в предыдущие пять десятков лет. В частности, ученые получили точные структуры белков, связанных с синдромом Вольфрама, диабетом и другими болезнями, которые в прошлом не удавалось определить экспериментально.
Кроме белков человека ученые проводили аналогичные расчеты для еще двух десятков живых организмов, которых активно используют в лабораторных экспериментах, в том числе мушек-дрозофил, червей-нематод и дрожжей. Все эти данные специалисты опубликовали в виде базе данных AFPSD, в которой была информация по структуре более чем 350 тыс. белков.
В ближайшее время ученые планируют расширить ее и определить трехмерную форму всех 100 млн белков, известных науке. Биологи надеются, что благодаря этим данным человечество приблизится к полному пониманию того, как устроены живые организмы и как возникают нарушения в работе разных клеточных белков.