http://sciencesprings.wordpress.com/2013/01/12/for-wcg-from-isgtw-desktop-power-helps-map-protein-dance/
http://m.isgtw.org/feature/desktop-power-helps-map-protein-dance
Белки являются частью сложной социальной сети, и редко действуют в одиночку. Взаимодействия "белок-белок" - это термин, используемый для описания когда два или более белков становятся партнерами и переплетаются вместе, чтобы выполнять различные биологические функции. В то время, как экспериментальные методы используются для определения отношений между одним и другим белком в своем клеточном соседстве, вычислительное моделирование по-прежнему необходимо, чтобы раскрыть более сложную паутину соединений для нескольких белков-партнеров.
Распределенные вычислительные мощности World Community Grid (WCG) недавно помогли в лечении мышечной дистрофии проекту (HMCD) в захвате всех возможных молекулярных и атомных связей между 2280-ю белками человека. Проанализированы белки включая те, про которые известно, что они мутируют и вызывают различные формы нервно-мышечных расстройств, включая мышечную дистрофию.
HCMD является частью более крупномасштабной авантюры, the Decrypthon Molecular Docking Project. Это союз между АСМ (французская ассоциация мышечной дистрофии), CNRS (Французский национальный центр научных исследований) и IBM, которые используют ресурсы World Community Grid, чтобы помочь им разобраться и составить карту всех функций взаимодействующих белков, обнаруженных в людях, во всемирном хранилище информации, каким является the Research Collaboratory for Structural Bioinformatics (RCSB) электронный банк протеинов.
Идея использования молекулярного моделирования - взять два белка из базы данных белков (с известной структурой), и посмотреть, какие белки сродны до такой степени, что способны переплестись друг с другом. Это включает в себя прогнозирование положения и ориентации (3D-структуры) белков в связи с лигандом (другого белка, ДНК, наркотики и т.д.).
"Вы берете два белка и смотрите в пространстве, как они наилучшим образом подходят, вращая один протеин вокруг сферы другого, говорит Alessandra Carbone из Pierre-and-Marie-Curie University Paris, которая является ведущим исследователем проекта "Помощь в лечении мышечной дистрофии" (HMCD). "Там может быть 300 тысяч возможных позиций для двух данных белков для проверки. Количество конфигураций варьируется в зависимости от размера белка. Это означает, что для крупных белков может быть более 300.000 позиций. Каждый из этих расчетов может занять 30 секунд, так что расчеты для двух белков могут занять почти месяц на ПК." Это сращение также зависит как от геометрии (как хорошо поверхности форм дополняют друг друга), так и от химических связей (измерение силы атомного взаимодействия между двумя молекулами).
На первом этапе проекта HMCD, завершенного в июне 2007 года, тщательно исследовались отношения между 168-ю протеинами с помощью молекулярного моделирования стыковки. "У людей более чем 20.000 белков, поэтому, если мы должны были бы изучить весь спектр, это было бы действительно гигантской задачей, и нам пришлось бы считать ее века и столетия. Даже просто сотня белков даст вам века расчетов, если вам изучить все 300000 конфигураций для каждого белка. Молекулярное моделирование вычисляет значения энергии на атомном уровне для групп атомов между данными белками. Это дает вам какие-то численные оценки относительно вероятности того, готовы ли два белка к взаимодействию или же, они, скорее всего, станут отталкиваться друг от друга в зависимости от физических или химических свойств аминокислот на поверхности, когда вы объединитe это со знанием, где находится участок взаимодействия", говорит Carbone.
Исследователи предсказали, что это заняло бы более чем 14000 лет вычислительного времени на компьютере с частотой 2 ГГц, чтобы выявить и исключить все возможные стыковочные комбинации для всех 168 белков. Тем не менее, "распределенные расчеты" позволили им значительно сократить время обработки. Более 6000-8000 машин доноров означает меньше 26 недель на задачу.
Тем не менее, для проверки 2280 белков во взаимодействиях один на один для фазы II проекта, исследователям был необходим метод значительно сокращающий число конфигураций, которые они должны были проверить. Молекулярные данные стыковки из анализа 168 протеинов (known to form 84 complexes) помогли им разработать быстрый алгоритм стыковки для прогнозирования потенциальных партнеров для этого большого бассейна белка.
The World Community Grid сопоставима с одним из 15 крупнейших в мире суперкомпьютеров. Его программное обеспечение было загружено на более чем два миллиона компьютеров, которые вместе завершили почти 700.000 лет научных вычислений.
Исследователи также объединили эволюционную информацию с этими молекулярными алгоритмами. Клетки всех видов имеют похожий способ организации их внутренней структуры со многими сохраняющимися (или гомологичными) протеиновыми архитектурами у разных видов. Белок-белковые взаимодействия от одного организма, следовательно, могут быть использованы для прогнозирования взаимодействия между гомологичными белками в другом организме. Площадки взаимодействия на поверхности белка, как правило, сохраняются, так как аминокислоты или физические свойства сохраняются. "Эволюционная информация позволяет нам предсказать площадки взаимодействия (площадки переплетения) с достаточной степенью вероятности, и тогда мы можем проводить молекулярный докинг прямо на этой области, которая уменьшает время исследования еще больше. В то время как вы обычно исследуете всю сферу вокруг данного белка, эволюционный анализ позволил нам исследовать лишь небольшую часть площади поверхности или сечения - конус сферы", говорит Carbone. "Численная оценка для различенич белков осуществляется путем объединения результатов молекулярной стыковки и предсказания площадок переплетения на основе эволюции", добавляет она.
Проект подошел к концу досрочно в сентябре 2012 года после двух с половиной лет. Компьютеры добровольцев прислали более 114 миллионов результатов, используя почти 53000 процессорных лет вычислительных мощностей.
HCMD2 собирается опубликовать результаты, методы, научные инструменты и взаимовлияющую информацию в ряде публичных баз данных, а также описательные документы позже, в этом году. В результате база данных будет потенциально помогать разработчикам лекарств конструировать молекулы для ингибирования или улучшения переплетений отдельных макромолекул, мы надеемся, приведет к улучшению лечения мышечной дистрофии и других нервно-мышечных заболеваний. Уникальная методология, используемая исследователями в своем анализе также может быть применена к будущим исследованиям в других областях медицины.
http://m.isgtw.org/feature/desktop-power-helps-map-protein-dance
Белки являются частью сложной социальной сети, и редко действуют в одиночку. Взаимодействия "белок-белок" - это термин, используемый для описания когда два или более белков становятся партнерами и переплетаются вместе, чтобы выполнять различные биологические функции. В то время, как экспериментальные методы используются для определения отношений между одним и другим белком в своем клеточном соседстве, вычислительное моделирование по-прежнему необходимо, чтобы раскрыть более сложную паутину соединений для нескольких белков-партнеров.
Распределенные вычислительные мощности World Community Grid (WCG) недавно помогли в лечении мышечной дистрофии проекту (HMCD) в захвате всех возможных молекулярных и атомных связей между 2280-ю белками человека. Проанализированы белки включая те, про которые известно, что они мутируют и вызывают различные формы нервно-мышечных расстройств, включая мышечную дистрофию.
HCMD является частью более крупномасштабной авантюры, the Decrypthon Molecular Docking Project. Это союз между АСМ (французская ассоциация мышечной дистрофии), CNRS (Французский национальный центр научных исследований) и IBM, которые используют ресурсы World Community Grid, чтобы помочь им разобраться и составить карту всех функций взаимодействующих белков, обнаруженных в людях, во всемирном хранилище информации, каким является the Research Collaboratory for Structural Bioinformatics (RCSB) электронный банк протеинов.
Идея использования молекулярного моделирования - взять два белка из базы данных белков (с известной структурой), и посмотреть, какие белки сродны до такой степени, что способны переплестись друг с другом. Это включает в себя прогнозирование положения и ориентации (3D-структуры) белков в связи с лигандом (другого белка, ДНК, наркотики и т.д.).
"Вы берете два белка и смотрите в пространстве, как они наилучшим образом подходят, вращая один протеин вокруг сферы другого, говорит Alessandra Carbone из Pierre-and-Marie-Curie University Paris, которая является ведущим исследователем проекта "Помощь в лечении мышечной дистрофии" (HMCD). "Там может быть 300 тысяч возможных позиций для двух данных белков для проверки. Количество конфигураций варьируется в зависимости от размера белка. Это означает, что для крупных белков может быть более 300.000 позиций. Каждый из этих расчетов может занять 30 секунд, так что расчеты для двух белков могут занять почти месяц на ПК." Это сращение также зависит как от геометрии (как хорошо поверхности форм дополняют друг друга), так и от химических связей (измерение силы атомного взаимодействия между двумя молекулами).
На первом этапе проекта HMCD, завершенного в июне 2007 года, тщательно исследовались отношения между 168-ю протеинами с помощью молекулярного моделирования стыковки. "У людей более чем 20.000 белков, поэтому, если мы должны были бы изучить весь спектр, это было бы действительно гигантской задачей, и нам пришлось бы считать ее века и столетия. Даже просто сотня белков даст вам века расчетов, если вам изучить все 300000 конфигураций для каждого белка. Молекулярное моделирование вычисляет значения энергии на атомном уровне для групп атомов между данными белками. Это дает вам какие-то численные оценки относительно вероятности того, готовы ли два белка к взаимодействию или же, они, скорее всего, станут отталкиваться друг от друга в зависимости от физических или химических свойств аминокислот на поверхности, когда вы объединитe это со знанием, где находится участок взаимодействия", говорит Carbone.
Исследователи предсказали, что это заняло бы более чем 14000 лет вычислительного времени на компьютере с частотой 2 ГГц, чтобы выявить и исключить все возможные стыковочные комбинации для всех 168 белков. Тем не менее, "распределенные расчеты" позволили им значительно сократить время обработки. Более 6000-8000 машин доноров означает меньше 26 недель на задачу.
Тем не менее, для проверки 2280 белков во взаимодействиях один на один для фазы II проекта, исследователям был необходим метод значительно сокращающий число конфигураций, которые они должны были проверить. Молекулярные данные стыковки из анализа 168 протеинов (known to form 84 complexes) помогли им разработать быстрый алгоритм стыковки для прогнозирования потенциальных партнеров для этого большого бассейна белка.
The World Community Grid сопоставима с одним из 15 крупнейших в мире суперкомпьютеров. Его программное обеспечение было загружено на более чем два миллиона компьютеров, которые вместе завершили почти 700.000 лет научных вычислений.
Исследователи также объединили эволюционную информацию с этими молекулярными алгоритмами. Клетки всех видов имеют похожий способ организации их внутренней структуры со многими сохраняющимися (или гомологичными) протеиновыми архитектурами у разных видов. Белок-белковые взаимодействия от одного организма, следовательно, могут быть использованы для прогнозирования взаимодействия между гомологичными белками в другом организме. Площадки взаимодействия на поверхности белка, как правило, сохраняются, так как аминокислоты или физические свойства сохраняются. "Эволюционная информация позволяет нам предсказать площадки взаимодействия (площадки переплетения) с достаточной степенью вероятности, и тогда мы можем проводить молекулярный докинг прямо на этой области, которая уменьшает время исследования еще больше. В то время как вы обычно исследуете всю сферу вокруг данного белка, эволюционный анализ позволил нам исследовать лишь небольшую часть площади поверхности или сечения - конус сферы", говорит Carbone. "Численная оценка для различенич белков осуществляется путем объединения результатов молекулярной стыковки и предсказания площадок переплетения на основе эволюции", добавляет она.
Проект подошел к концу досрочно в сентябре 2012 года после двух с половиной лет. Компьютеры добровольцев прислали более 114 миллионов результатов, используя почти 53000 процессорных лет вычислительных мощностей.
HCMD2 собирается опубликовать результаты, методы, научные инструменты и взаимовлияющую информацию в ряде публичных баз данных, а также описательные документы позже, в этом году. В результате база данных будет потенциально помогать разработчикам лекарств конструировать молекулы для ингибирования или улучшения переплетений отдельных макромолекул, мы надеемся, приведет к улучшению лечения мышечной дистрофии и других нервно-мышечных заболеваний. Уникальная методология, используемая исследователями в своем анализе также может быть применена к будущим исследованиям в других областях медицины.