paroh: (manbearpig)
[personal profile] paroh
Автор: Исследовательская группа The Mapping Cancer Markers (отображение маркеров рака)
15 декабря 2015

Краткое изложение

Последние этапы проекта Mapping Cancer Markers (MCM) высветили белок-белковые взаимодействия и биологические пути, вовлеченные в рак легких, а также предложили неожиданные результаты его биомаркеров. После того, как этот нынешний этап завершится, МСМ перейдет к анализу рака яичников. Благодаря вашей помощи мы делаем открытия и помогаем международному научному сообществу. Доктор Jurisica, в частности, является одним из самых часто цитируемых исследователей во всем мире.

Третий этап анализа рака легких в процессе разработки

В нашей предыдущей свежей новости мы объявили второй, целевой этап открытия сигнатур рака легких. Мы после этого перешли на новый, третий этап анализа рака легких: таргетинг высоко результатных некоррелированных биомаркеров. Эти различные этапы являются частью общих трудозатрат для понимания сигнатур рака легких. Первый этап обследовал возможные сигнатуры рака легких, взятые из комплекта биомаркеров рака легких нашего набора данных. Статистика собранная в этом первом этапе были использована, чтобы сузить список биомаркеров для изучения на последующих этапах. Второй и третий этапы изучают сигнатуры рака легких, взятые из небольших наборов сигнатур с высокими показателями, отобранные двумя различными способами. На втором этапе, мы сосредоточили внимание на 1%-м подмножестве биомаркеров, выбранному по частоте, с которой каждый появлялся в высоко результативных сигнатурах начальной стадии. На третьем этапе, мы выбрали различные подмножества биомаркеров, которые одновременно высоко результативны и в значительной степени коррелируют друг с другом.

Корреляция является мерой общей информации между двумя источниками данных. Два биомаркера коррелируют, если они демонстрируют похожие паттерны в наборе данных рака. Например, два коррелированных гена могут показать высокую активность в одном наборе образцов опухоли, низкую активность во втором наборе и среднюю активность в третьей. В том числе, два высоко коррелирующих биомаркера в той же сигнатуре могут снизить качество сигнатуры, потому что они будут способствовать избыточной информации для сигнатуры. Для сигнатуры фиксированного размера избыточный биомаркер потенциально может вытеснить другой биомаркер, имеющий другое информационное содержание.

В качестве аналогии, рассмотрим информацию, содержащуюся в небольшой библиотеке учебников. Предположим, есть три книги: A, B и C. Если A и В две копии одного и того же учебника, один из них является излишним. Удаление B из библиотеки не изменит информацию, содержащуюся в библиотеке и замена B другим учебником (D), приведет к увеличению информации в библиотеке. Если А и В были похожие, но не одинаковые книги (например, две книги по введению в молекулярную биологию, написанные разными авторами), все еще будет некоторое дублирование текстов и возможно преимущество замены B с D.

Производительность сигнатуры

Поскольку целевые биомаркеры в этом третьем этапе были выбраны, чтобы быть минимально взаимно-коррелирующими, каждая сигнатура должна быть свободна от избыточной информации. Поэтому мы предположили, что сигнатуры в третьей стадии будут работать лучше в среднем, чем те, на втором этапе. На рисунке 1 показаны удивительные результаты: сигнатуры второго этапа (потенциально содержащие коррелирующие биомаркеры) превзошли те, от третьей ступени. Мы анализируем эти результаты и дальше, чтобы определить основные причины разницы в производительности.

Рисунок 1. Распределение баллов сигнатур для второго (черный) и третьего этапов (синий). Как и следовало ожидать, более крупные сигнатуры, как правило, обгоняют меньшие. Удивительно, что второй этап сигнатур обошел третий этап в среднем.

Влияние размеров на шкалу биомаркеров в топовых сигнатурах

Большие сигнатуры (т.е., сигнатуры, содержащие больше биомаркеров) включают более подробную информацию и потенциально могут предложить лучшую точность, но являются более сложными и дорогими для реализации в клинике. Все три этапа MCM пока что исследовали сигнатуры рака легких различных размеров. Для каждого размера сигнатуры нами рассмотренной, целевые подмножества биомаркеров для второго этапа были выбраны по отдельности, основываясь на статистике из первого этапа. Набор маркеров, выбранных для третьего, фиксируется во всех размерах сигнатуры. Этот фиксированный набор позволяет сравнить эффекты размера сигнатуры на частоте каждого биомаркера в высоко результативных сигнатурах. Рисунок 2 показывает изменение частоты при переходе от 10-ти биомаркеров в подписи к 20-ти. Каждая точка на графике представляет собой биомаркер. Ось Х представляет собой частоту, с которой биомаркеры появляются в size_10 сигнатурах. Ось Y показывает частоту в size_20 сигнатурах. Обратите внимание, что биомаркеры изменились в шкале, но, в основном, коррелируют. Сигнатуры size_10 показывают большее распространение частоты биомаркеров: некоторые имеют относительно высокую частоту, и многие низкую частоту. Частоты биомаркеров в крупных (size_20) сигнатурах даже больше.

Биомаркер соединяется в пары, как белковые взаимодействия?

Мы применили и расширили анализ биомаркеров пар, описанных в новости августа 2015 года в ранние результаты данных третьего этапа, ищущих специально пары биомаркеров в обоих втором и третьем этапах, которые появляются на удивление часто в высоко результативных сигнатурах рака легких. Когда два гена или белка появляются в подписях вместе с большей частотой, чем ожидалось случайно, мы прогнозируем более сильное, связанное с раком соединение (взаимодействие).

Мы искали каких-нибудь известных соединений (взаимодействий) в базе данных интегрированных взаимодействий (IID), базе данных известных и предсказанных белок-белковых взаимодействий, созданной нашей лабораторией. Мы нашли несколько пересечений в IID, которые отражают эти раковые взаимодействия, но перекрытие не было статистически значимым.

Метаболический путь усовершенствования знаний в целях второго и третьего этапов

Мы также взяли гены, выбранные для второго и третьего этапов, и искали для них в базе данных биологических метаболических путей. См. рисунок 3. Мы обнаружили, наши списки генов были обогащены (присутствовали в статистически значимых числах; р ≤ 0,01) в ряде метаболических путей. См. таблицу 1.

Хотя наш анализ продолжается, мы видим, что два из выявленных путей - компоненты метаболизма мевалоната. Пути мевалонаты уже являются целями для многих лекарств, таких как статины и вовлечены в качестве мишеней для лечения рака легких. Некоторые из неприоритетных анализов сфокусируются на том как сигнатуры, обнаруженные при обработке World Community Grid, в конечном счете подключаются к путям и другим исследованиям. Мы использовали мевалонат в качестве примера, но есть многое другое, что может быть рассмотрено для оценки жизнеспособности наших лучших сигнатур.

Переход от рака легких к анализу рака яичников

Третий этап почти завершен и будет заключительная часть MCM анализа рака легких на World Community Grid, прежде чем мы переключимся на рак яичников.

Рак яичников является гинекологической злокачественной опухолью, занимающей 8-е место по заболеваемости и 5-е по смертности среди всех женских онкологических заболеваний. Наблюдение Американского национального института рака, Эпидемиологии и Конечные результаты (SEER) программы дают оценку в 22,240 новых случаев и 14,030 смертей от рака яичников в 2013-м. Пациенты, как правило, диагностируется на поздней стадии (61% присутствует метастазы рака) и имеют плохой прогноз (27,3 месяцев до стадии метастазирования. (SEER)).

Мы ожидаем, что переход к исследованию рака яичников начнется в начале 2016 года и не ожидаем каких-либо перерывов в потоке рабочих юнитов.

Статья полностью, с картинками и таблицей (англ.)

August 2025

S M T W T F S
     12
3 456 78 9
101112 13141516
17 181920212223
24252627282930
31      

Style Credit

Expand Cut Tags

No cut tags
Page generated Aug. 19th, 2025 05:34 pm
Powered by Dreamwidth Studios