Пётр Харченко: о современной геномике, пространственной организации ткани и принципах выбора научной задачи
03 августа 2022
Пётр Харченко: о современной геномике, пространственной организации ткани и принципах выбора научной задачи
- 613
- 1
- 4
-
Автор
-
Редакторы
Темы
Пётр Харченко — вычислительный биолог, PhD, профессор Гарвардской Медицинской школы. Область научных интересов — эпигенетические механизмы регуляции метаболизма тканей, роль эпигенетических нарушений в развитии различных заболеваний.
Дата интервью: 12 августа 2021 года.
Разговоры за жизнь
За последние полгода мир вокруг нас изменился. Наука не осталась в стороне от этого. Тем не менее, области знаний, которыми интересуются ученые в России и за рубежом, остались те же. Совместный со Сколтехом и Российским научным фондом медиапроект «Разговоры за жизнь» — цикл интервью известных ученых о своей работе, пути в науке и поиске вдохновения.
— Когда я готовился к интервью, заглянул на сайт вашей лаборатории и заметил, что у вас много русских ребят работает. Это потому, что в России сильных биоинформатиков готовят или вам просто комфортнее с русскими?
— Хороший вопрос. Хороших специалистов не так много, к сожалению. В принципе, мне кажется, в России прекрасная подготовка, особенно начальная: и в школе, и в институте, с точки зрения математических методов, теперь уже и с точки зрения компьютерных технологий. И мне кажется, что именно в моей отрасли с такими началами, математическими и аналитическими, значительно легче что-то интересное сделать. Если есть интерес, человек может быстро наверстать, что нужно ему в конкретной области. Наверстать же математическую подготовку и аналитические методы очень тяжело.
Поэтому да, мне кажется, что в России достаточно много молодых людей с сильной подготовкой, которые заинтересованы в науке. Вот в Штатах, где я работаю и с которыми сравниваю, у студентов больше альтернативных вариантов, куда пойти с такими навыками. И мы постоянно соревнуемся за таланты и с большими компаниями, и с финансовым сектором.
— Как правильно назвать ту область, которой вы занимаетесь? Это компьютерная биология? Биоинформатика? Геномика? Протеомика?
— Мы вычислительные биологи . Мы не ставим экспериментов, работаем с теми, кто их ставит, и, в основном, разрабатываем статистические вычислительные методы, применяем их, интерпретируем результаты. Это применимо на разных уровнях организации живого.
Об основных принципах «сухой» биологии мы рассказывали в одноименной статье спецпроекта «12 биологических методов в картинках» — Ред.
Мы работаем на молекулярно-клеточном уровне: смотрим на состояние клеток, экспрессию генов, упаковку генома. Какие вопросы мы решаем? Есть 2 больших направления. Во-первых, это опухоли: мы смотрим на их микроокружение и на гетерогенность самих раковых клеток. Второе — более веселое направление — развитие и координация клеток во время роста тканей. Это все можно назвать геномикой.
— А геномика — это раздел генетики? В чем ее особенность как отрасли?
— Традиционная генетика — это что-то, связанное с наследованием и тому подобным. Геномика изначально зародилась, потому что накопилось много данных по секвенированию генома и стало понятно, что полученную последовательность нуклеотидов интерпретировать мы не можем. Например, ученые пытались выявить связанные с болезнями мутации, и ассоциативные исследования часто выявляли мутацию-кандидат, но что эта мутация представляет из себя функционально, мы обычно не могли сказать. И для этого стали разрабатывать серию методов, которые помогают понять, что делает конкретный участок генома либо кластер таких участков. Оказалось, что это можно делать при помощи определенных технологий обработки данных. Например, отследить изменения генома в действии, смотреть на функции генома. Это называется функциональной геномикой.
Прямое сравнение геномов больных и здоровых людей — Прим. авт.
— А как это делается методологически?
— В основном, с помощью методов секвенирования: секвенирования РНК, секвенирования обогащенного хроматина, открытых кусков хроматина. Этим методам уже 30–40 лет. Например, есть дезоксирибонуклеаза I — фермент, который режет геном. Когда-то очень давно ученые стали смотреть вокруг конкретных генов, где именно проходят такие «надрезы». Дезоксирибонуклеаза I — большой фермент, который может взаимодействовать только с открытыми, неупакованными участками генома. Казалось бы, что в этом интересного? То, что если участок открыт, значит, он делает что-то важное. Например, является промотором или энхансером . Поэтому считывание открытых участков генома оказывается информативным — это говорит о том, где что-то происходит.
Промотор — участок ДНК, с которого начинается транскрипция — Прим. авт.
Энхансер — участок ДНК, который усиливает транскрипцию — Прим. авт.
Потом стало возможно делать так и для всего генома, не только для открытых участков. Последние 5–10 лет совершенствовались методы анализа отдельных клеток. Теперь можно изучать геном каждой клетки образца индивидуально .
О том, как проводится секвенирование единичных клеток, можно почитать в статье «Одноклеточное секвенирование: разделяй, изучай и властвуй» — Ред.
— Мы обсудили общий дизайн исследований, которые вы проводите. А над какими вопросами вы работали в последние пару лет, с чем вы хотели бы разобраться и уже разобрались?
— Мы изучали и изучаем метастазирование рака простаты. На поздних стадиях этой опухоли метастазы почти всегда образуются по каким-то причинам именно в костном мозге, но причины такой избирательности неизвестны.
Мы хотели сравнить генетическое состояние клеток костного мозга, иммунных клеток, и клетки метастазов, чтобы понять, что там происходит. Материал этот труднодоступен: нам понадобилось собрать большую команду, которая включала онкологов, хирургов, гематологов, молекулярщиков и нас.
Сравнение показало нам ожидаемые вещи. Например, что при наличии метастаз иммунная система костного мозга находится в состоянии истощения: Т-клетки, которые должны активироваться для убийства опухолевых клеток, бездействуют. Это видно во многих видах рака, не только в метастазах рака простаты. Дальше мы стали смотреть на функциональное состояние макрофагов, моноцитов и ряда других клеток врожденного иммунитета, которые могут модулировать активность Т-лимфоцитов, и думать, как вывести иммунную систему из истощенного состояния.
На метастазах рака простаты стандартные методы иммуномодуляции, к сожалению, не работали: например, блокировка молекул — иммунологических чекпоинтов PD-1 и CTLA-4 неэффективна. Это может быть связано как с состоянием самих иммунных клеток, которые должны атаковать рак, либо с какими-то другими сигналами, которые влияют на эффективность такого терапевтического подхода.
Наша задача свелась к тому, чтобы найти внутри ткани такие сигналы, которые могут ингибировать возможность Т-лимфоцитов атаковать опухоль. С помощью вычислений из множества сигналов мы выделили приоритетный: тот, который выглядел многообещающе. Дальше его роль уже исследовали экспериментаторы на лабораторных животных — мышах.
Это долгий путь. Мы использовали специально разработанную для этого мышиную модель, в которой двумя разными способами (блокировкой лиганда и рецептора) прерывали найденный сигнал. В результате мы обнаружили значительное улучшение выживаемости у тех мышей, которые подвергались блокировке.
— А что оказалось более эффективным: блокировка лиганда или рецептора?
— В нашем случае блокировка рецептора была более эффективной. Но вообще оценить, что работает лучше, довольно тяжело — данных не так много. Что можно сказать — так это то, что оба подхода лучше, чем отсутствие вмешательства.
— Затем на основе таких экспериментов можно разработать протокол лечения, выйти на испытания — доклинические, клинические, — правильно я понимаю?
— В идеале — да. Но, как вы понимаете, переход от мыши к человеку — сложный процесс. Мышь отличается от человека по многим аспектам, и, к сожалению, многие лекарства, которые очень эффективно работают в мышах, либо не оказывают никакого эффекта на человека, либо слишком токсичны и так далее.
— Получается, для того, чтобы придумать возможный терапевтический подход, нужно разобраться с «молекулярным портретом» опухолей, собрав огромное количество данных… Где-то они каталогизируются?
— В биологии в принципе данных накапливается много, а в геномике — особенно. Есть базы данных, куда все это складывается, но они не очень систематизированы. У нас сейчас ведется проект по созданию базы данных, где можно хранить данные по секвенированию единичных клеток и использовать их для автоматизации интерпретации, какую именно субпопуляцию клеток мы видим. Для этого нужно собрать достаточную базу данных, чтобы покрыть много случаев.
Одна из целей этого проекта — помочь специалистам «занимать» интерпретацию друг у друга. Вот, например, есть специалист по хелперным Т-лимфоцитам, умеющий их разделять и классифицировать, его экспертиза может быть закодирована алгоритмами и далее представлена другим специалистам, если они хотят использовать это для своих исследований.
— Это же, по сути, оцифровка эксперта! Вы создаете искусственный интеллект, который заменит узкоспециализированных первоклассных экспертов и предоставит экспертизу всем нуждающимся, так?
— Практически. Однако в реальности задача достаточно узкая: нужно распознать подвиды и состояния клеток из определенного типа данных. Если некий ученый часто это делает, то мы у него можем этому научиться, используя методы искусственного интеллекта или машинного обучения.
— Насколько я понял, сейчас геномика занимается поиском ответов на очень конкретные вопросы, а параллельно происходит сбор и накопление огромного массива данных. Может ли произойти переход из количества в качество?
— Тут мнения специалистов расходятся. Мне кажется, что чистым объемом тут не взять. То, как мы сейчас изучаем клетки — это, конечно, здорово и дает нам более статистически верные картины происходящего внутри клеток. Но это все равно очень узкий взгляд и искаженный. Узкий, потому что с одноклеточными транскриптомами мы смотрим, по сути, только на РНК. Это очень важная молекула, их полный ансамбль говорит о том, что клетка сейчас пытается сделать, какие в ней работают гены, какие белки синтезируются… Но есть и совершенно другие измерения, которые мы не видим.
Например, то же состояние хроматина, упаковку генома, состояние белков, состояние метаболитов — все эти молекулярные аспекты влияют на общее состояние клетки. В принципе, если смотреть на отдельную клетку, окажется, что многие переменные завязаны друг на друга. Поэтому, когда мы сможем измерять и то, и другое, и третье одновременно, мы поймем, как эти переменные связаны, и сможем получать совершенно иные интерпретации. Это первый момент.
Второй момент заключается в том, что мы изучаем многоклеточные организмы. По сути, наши возможности сейчас ограничены одной клеткой в вакууме, но в большой повторности. Однако функционирование тканей, онтогенез, процесс ответа на патоген — это поведение многоклеточного организма. Крайне важно понимать контекст функционирования клетки, связь между ними, цепи реакций, которые там происходят. Это все хотелось бы видеть и изучать, но для этого необходимы новые методы.
В последние несколько лет разрабатываются методы пространственной транскриптомики, где с помощью анализа молекул мРНК эта многомерная картина может изучаться в контексте ткани — на срезе или в трехмерном кусочке. Этот метод позволяет видеть контекст. Вот есть клетка, у нее такое-то состояние, и в ткани она находится в таком-то контексте. Мне кажется, это огромный шаг вперед. Из этих данных с помощью статистических методов можно попытаться вывести зависимость клетки от контекста: что именно на нее влияет и что к чему приводит. Можно начать долгий путь к молекулярному описанию и моделированию тканей, а потом, может быть, и органов.
— Над чем вы работаете прямо сейчас?
— У нас есть несколько проектов. Например, мы недавно закончили работу над, казалось бы, технической задачей, над которой работали несколько лет: мы определили молекулярные границы клетки.
Это пространственная транскриптомика: по сути дела, на срезе ткани замеряются молекулы. На этом срезе могут быть миллионы клеток, а в каждой клетке могут быть тысячи молекул. И точные границы каждой клетки видны не всегда. Даже если применять специальные окрашивания, определить точные границы очень сложно. Это мешает дальнейшему анализу: очень тяжело понять, что происходит в системе. Поэтому нам пришлось потратить много сил, чтобы создать метод, который более-менее аккуратно описывает эти границы. Казалось бы, техническая вещь, но она необходима для корректной интерпретации данных.
— То есть, вы в итоге определили молекулярные границы клетки?
— Да. Но этот метод, мы надеемся, будет полезен для многих групп. С данными, где границы уже определены, можно делать более интересные вещи. Например, строить вычислительные модели структуры ткани, проводить анализ зависимости состояния клеток от контекста и так далее. Это то, куда мы целимся, но для решения подобных задач нужна серьезная проработка таких вот технических вещей.
— А что можно делать дальше?
— Например, при помощи анализа единичных клеток исследовать гетерогенность внутри опухоли. Резистентность к существующим методам терапии — традиционная проблема при лечении онкологических заболеваний. Один из ее механизмов — это появление новых мутаций. Они могут гиперактивировать ген, который позволяет клеткам, например, быстрее расти или удалять лекарство, либо дезактивировать ген, который в определенных условиях ограничивает рост клеток. Традиционно это изучалось секвенированием генома, что дает опять-таки лишь статическую картину. А там есть и другие механизмы — эпигенетические и белковые, — которыми клетка может достичь схожих результатов.
Поэтому хотелось смотреть гетерогенность внутри опухоли одновременно и с точки зрения генома, и с точки зрения других составных частей клетки. Но сопоставить это экспериментально было очень тяжело. Мы разработали алгоритм, который находит генетические клоны и подклоны внутри опухоли по данным, в которых можно видеть транскрипционные или эпигенетические состояния клеток. Этот метод работал, но точность оставляла желать лучшего: мы не могли находить подклоны, которые отличаются небольшим количеством изменений.
Мы разговаривали со специалистами совершенно другой области биологии — популяционной генетики, — и мы позаимствовали у них идею использовать данные по популяции для фазирования геномов , что позволило увеличить точность алгоритмов. Теперь мы, совмещая данные по популяции и данные по одиночным клеткам, можем получить более точный ответ.
Определение, какие варианты генов на каких хромосомах лежат — Прим. авт.
— А можете чуть подробнее рассказать? Какой именно популяционный механизм пригодился вам для описания типа клеток?
— По сути дела, это даже не механизм, а феномен вариации генома внутри населения. Есть куски генома, которые держатся вместе при рекомбинациях, а есть точки, где рекомбинация очень активна. Из-за этого в населении можно по нескольким рядом стоящим мутациям предсказать, какие еще мутации появятся чуть дальше. То есть, если смотреть линейно по геному, мутации не независимы, и их можно начать предсказывать.
Например, раковая клетка может удалить копию хромосомы или большой ее кусок. Это частый механизм, который позволяет клеткам менять свое поведение. Для нас статистика по популяции человека объясняет, какие мутации должны быть в одной копии хромосомы, а какие — в другой.
— Получается, вы работаете как над решением конкретных медицинских вопросов, так и над фундаментальными задачами?
— Наша основная экспертиза методологическая: мы разрабатываем вычислительные и статистические методы в контексте биологических или медицинских исследований. Это та вещь, которую я все время пытаюсь донести до своих сотрудников: вычислительный биолог может работать в разных областях, возможностей бесконечное количество.
— Личный вопрос: как стать успешным ученым? Когда я открыл ваш профиль в SCOPUS, то увидел, что ваш индекс Хирша равен 48, а статьи опубликованы в очень престижных журналах: Nature, Nature Genetics, Nature Communications, Nature Methods и т.д. Как вам это удалось? Что бы вы могли посоветовать делать молодым ученым, чтобы состояться в науке?
— Есть советы высокого уровня, а есть практические.
Во-первых, важен интерес. Я, если честно, даже своим студентам говорю, что можно получить образование, но после заниматься исследованием только если это очень интересно. Потому что с практической точки зрения это будет очень долгая, непредсказуемая, тяжелая работа. Нужна внутренняя мотивация. Ведь в современном мире очень много других прекрасных возможностей состояться, особенно для людей, у которых достаточно экспертизы, чтобы заниматься вычислительной биологией. Можно пойти в какой-нибудь банк аналитиком или устроиться в Google или Facebook. Возможностей куча, поэтому наукой стоит заниматься, только если есть внутренний интерес.
— Концептуальное наставление.
— Без этого, мне кажется, люди впустую тратят свое время. Нужно понимать, что вся суть науки в том, что мы занимаемся тяжелыми непонятными вопросами, которые никогда просто так не решались. Нужно ожидать, что некоторые из них — точнее, многие, — не будут решаться или приводить к удовлетворяющему решению.
Связанная вещь: очень важно аккуратно выбирать мишень для исследования. Это, кажется, половина успеха. Нужно продумать, основательно осмотреться, почитать, поговорить с людьми прежде чем тратить несколько лет своей жизни на какое-то направление — все занимает очень много времени. И важно, чтобы задача стоила этого времени, чтобы она имела хотя бы гипотетическую перспективу ответить на интересные вопросы, на которые иначе не ответить.
Кроме того, задача должна быть хотя бы потенциально решаемая. Поэтому я всегда уговариваю студентов своих все-таки вести более одного проекта, потому что каждый проект может просто-напросто не получиться.
Еще мне кажется, вычислительные биологи очень выигрывают от общения с другими биологами — вычислительными и нет. Нужно общаться, рассказывать о своих идеях. Да, иногда у вас будут что-то красть, но плюсы перевешивают: в результате общения вы будете получать значительно больше идей и советов от сообщества, чем потенциально потеряете.
— Последний вопрос: о чем вы мечтаете?
— Хороший вопрос. Ну… каждый вычислительный биолог мечтает о чистых данных (смеются оба).