Новый инструмент машинного обучения обнаруживает мутационную сигнатуру, которая связывает рак мочевого пузыря с курением табака

Исследователи из Калифорнийского университета в Сан-Диего впервые обнаружили закономерность мутаций ДНК, которая связывает рак мочевого пузыря с курением табака. Открытие стало возможным благодаря новому мощному инструменту машинного обучения, который команда разработала для поиска закономерностей мутаций, вызванных канцерогенами и другими процессами, изменяющими ДНК.

Работа, опубликованная 23 сентября в журнале Cell Genomics , может помочь исследователям определить, какие факторы окружающей среды, такие как воздействие табачного дыма и ультрафиолетового излучения, вызывают рак у определенных пациентов.

Каждое из этих воздействий окружающей среды изменяет ДНК уникальным образом, создавая определенный набор мутаций, называемый мутационной подписью. Если в ДНК раковых клеток пациента обнаружена сигнатура, рак можно проследить до воздействия, вызвавшего эту сигнатуру. Знание того, какие мутационные сигнатуры присутствуют, также может привести к более индивидуальному лечению конкретного рака пациента.

В этом исследовании исследователи обнаружили мутационную сигнатуру в ДНК рака мочевого пузыря, связанную с курением табака. Это открытие важно, потому что мутационная сигнатура курения табака была обнаружена при раке легких, но еще не была обнаружена при раке мочевого пузыря.

Имеются убедительные эпидемиологические доказательства связи рака мочевого пузыря с курением табака. Мы даже видим специфические мутационные признаки в других тканях, таких как рот, пищевод и легкие, которые непосредственно подвергаются воздействию канцерогенов табака. Тот факт, что мы не нашли эту подпись в мочевом пузыре, был странным».

Людмил Александров, старший автор исследования, профессор биоинженерии, клеточной и молекулярной медицины, Калифорнийский университет в Сан-Диего

Александров и его коллеги теперь показывают, что существует мутационная сигнатура курения табака при раке мочевого пузыря, и она отличается от сигнатуры, обнаруженной при раке легких. Более того, они показывают, что эта сигнатура также обнаруживается в нормальных тканях мочевого пузыря курильщиков табака, у которых не развился рак мочевого пузыря. В тканях мочевого пузыря некурящих сигнатура не обнаружена.

«Эта подпись говорит нам о том, что определенные мутации в вашей ДНК связаны с воздействием табачного дыма», — сказал соавтор исследования Маркос Диас-Гей, научный сотрудник лаборатории Александрова. «Это не обязательно означает, что у вас рак. Но чем больше вы курите, тем больше мутаций накапливается в ваших клетках и тем выше риск развития рака».

Это стало возможным благодаря машинному обучению следующего поколения

Исследователи обнаружили табачную подпись с помощью инструмента машинного обучения нового поколения, разработанного в лаборатории Александрова. Команда говорит, что это самый передовой автоматизированный инструмент биоинформатики для извлечения мутационных сигнатур непосредственно из больших объемов генетических данных.

Fungi Perfecti, Host Defense, Breathe, грибы для поддержки здоровья дыхательной системы, 60 вегетарианских капсул

Fungi Perfecti, Host Defense, Breathe, грибы для поддержки здоровья дыхательной системы, 60 вегетарианских капсул

«Это мощный подход к машинному обучению для распознавания закономерностей мутаций и отделения их от геномных данных», — сказал Александров. «Он берет эти паттерны и расшифровывает их, чтобы мы могли увидеть, что представляют собой мутационные сигнатуры, и сопоставить их с их значением».

Он сравнил подход машинного обучения с выделением отдельных разговоров на коктейльной вечеринке.

«Вокруг вас разговаривают несколько групп людей, и вас интересует только то, как говорят определенные люди», — сказал он. «Наш инструмент, по сути, помогает вам сделать это, но с генетическими данными рака. У вас есть несколько людей по всему миру, подвергающихся воздействию различных мутагенов окружающей среды, и некоторые из этих воздействий оставляют отпечатки в их геномах. Этот инструмент просматривает все эти данные, чтобы выбрать какие процессы вызывают мутации».

Инструмент был использован для анализа 23 827 секвенированных раковых заболеваний человека. Он обнаружил четыре мутационных сигнатуры, в том числе рак мочевого пузыря, связанный с курением табака, которые не были обнаружены никаким другим инструментом. Три других признака, обнаруженные при раке желудка, толстой кишки и печени, требуют дальнейшего изучения, чтобы выяснить, какие процессы их вызвали.

Чтобы показать, насколько мощным является их инструмент, исследователи протестировали его против 13 существующих инструментов биоинформатики. Инструменты были оценены на предмет их способности извлекать мутационные сигнатуры из более чем 80 000 синтетических образцов рака. Инструмент, разработанный командой Александрова, превзошел все остальные. Он обнаружил на 20–50% больше истинно положительных сигнатур и в пять раз меньше ложноположительных сигнатур. Он даже показал хорошие результаты при анализе зашумленных данных, в то время как другие инструменты потерпели неудачу.

«В биоинформатике впервые был проведен такой всеобъемлющий бенчмаркинг в таком масштабе для извлечения мутационных сигнатур», — сказал Диаз-Гей. «Это огромная задача — сравнить множество инструментов во многих наборах данных».

Такой подвиг тоже дорого обходится, отметил Александров. «Благодаря финансированию от Cancer Research UK мы смогли провести эту техническую обширную оценку, которая обычно не проводится».

Создание более удобного и персонализированного инструмента

Конечная цель команды — создать веб-инструмент, который сможет использовать больше исследователей и, как следствие, профилировать больше пациентов.

«Сейчас для запуска этого инструмента требуются знания в области биоинформатики, — сказал Александров. «Что мы хотим, так это создать удобную для пользователя версию в Интернете, где исследователи могут просто указать мутации пациента, и это сразу же даст вам набор мутационных сигнатур и то, какие процессы их вызвали».

«Наша идея на будущее — использовать этот инструмент для анализа пациентов на индивидуальном уровне», — сказал Диас-Гей.

Похожие статьи

Leave a Comment

Your email address will not be published. Required fields are marked with *

ИССЛЕДОВАНИЯ

ПОЛЕЗНЫЕ СТАТЬИ