Лента TH Новости Биоинженерия



Большие данные (и добровольцы) ломают биохимию

∴ 264

Человек должен умереть, или превзойти свою природу. В последнем нам помогает наука.

1283

Молекулярные биологи заручились передовыми технологиями генетики и большими данными, чтобы получить контроль над одной из главных задач биотехнологии: выяснить, как структурируются молекулы белка.

Но они не могли бы сделать это без помощи десятков тысяч добровольцев, одним из которых можешь стать и ты.

Плоды этого краудсорсированного компьютерного труда были обнародованы еще год назад. Исследователи из Университета Вашингтона и других учреждений заявили, что они решили более 600 групп заданий по расщеплению белка. Это примерно 5 200 семейств белков, молекулярная структура которых была неизвестна.

Еще больше решений может привести к появлению новых видов лекарств и синтетических молекулярных машин.

Белки похожи на маленькие машины. Их молекулярная структура определяет функцию, точно так же, как форма ключа определяет, какую дверь он открывает.Старший научный сотрудник Дэвид Бейкер, директор Института белковой инженерии Университета Вашингтон.

Белок с правильной формой может открыть путь для восстановления клеточных функций или блокировать распространение заболеваний, начиная от Альцгеймера и до рака.

Семейства белков состоят из больших групп отдельных белков, которые выполняют определенные функции у разных организмов. Одним из известных примеров семейства белков является гемоглобин, который переносит кислород через кровь. Мыши, киты и люди используют гемоглобин, но структура гемоглобина варьируется от вида к виду.

В прошлом выяснение молекулярной формы для различных семейств белков, осуществлялось с помощью экспериментальных методов, таких как ядерно-магнитный резонанс, или ЯМР. Но Бейкер и его коллеги были новаторами в этой области и предложили моделировать механику работы белка посредством программного обеспечения.

Одним из их инструментов является платформа распределенных вычислений под названием Rosetta@Home, которая опирается на компьютерные ресурсы, предлагаемые 1,2 миллионами пользователей. Программное обеспечение сжимает груды данных о химических взаимодействиях, чтобы определить наиболее вероятную форму, которую будет принимать белок. Больше обработанных данных приводит к большей точности.

Данные обычно исходят из анализа геномных последовательностей из известных организмов. Но исследователь У. С. Овчинников придерживался другого подхода: он использовал большую партию метагеномных данных, полученных из микробной ДНК, собранной в обычной воде.

Исследователи точно не знали, из какого рода протеинов происходят организмы, но это не имело значения. Все, что имело значение, зашифровано в базе данных из 2 миллиардов последовательностей.

Эта база данных дала толчок усилиям по решению головоломок Rosetta@Home. Во-первых, исследовательская группа проверила результаты, сравнив их со структурами 27 крупных семейств белков. Затем они сгенерировали модели для 614 семейств белков с неизвестными структурами.

Если бы вы спросили меня 20 лет назад, как мы будем решать проблему структурирования белка, я бы никогда не догадался, что ученые будут использовать информацию о последовательности, взятую из дождевой воды и команду добровольцев со всего мира.Старший научный сотрудник Дэвид Бейкер, директор Института белковой инженерии Университета Вашингтон.

Бэйкер выразил огромную благодарность добровольцам проектов Rosetta@Home и Charity Engine, которые сыграли значительную роль в исследовании, описанном в статье.

Их вклад был абсолютно необходим не только для этой статьи, но и для значительной части работы, которая продвигается на протяжении многих лет.Старший научный сотрудник Дэвид Бейкер, директор Института белковой инженерии Университета Вашингтон.

На этом фронте еще много работы: потому что метагеномная ДНК основана на жизни микробов из 614 белковых семей. И эти белки отвечают, как правило, имеют за относительно базовые функции. Но исследователи работают над расширением базы данных последовательностей белков и сосредотачивают внимание на более сложных функциях клеток.

Одним из больших преимуществ системы Rosetta@Home является то, что избыточная вычислительная мощность предоставляется бесплатно. Дэвид Бейкер рассчитал примерную стоимость экспериментов. В частности, декодирование структуры для одного семейства белков составляет десятки тысяч долларов. Но исследователям эта работа обходится в сотни долларов.

Наши затраты на вычисление структуры действительно очень малы. Потому что это добровольцы.Старший научный сотрудник Дэвид Бейкер, директор Института белковой инженерии Университета Вашингтон.

Филипп Дончев