Екатерина Храмеева: о биоинформатическом подходе к изучению упаковки хромосом, творческой свободе и профессиональном выгорании
06 июля 2022
Екатерина Храмеева: о биоинформатическом подходе к изучению упаковки хромосом, творческой свободе и профессиональном выгорании
- 1043
- 0
- 3
-
Автор
-
Редакторы
-
Иллюстратор
Темы
Екатерина Храмеева — биоинформатик, кандидат биологических наук, старший преподаватель Центра молекулярной и клеточной биологии Сколтеха. Работала в Институте проблем передачи информации, Университете Лейпцига, Центре им. Гельмгольца (Мюнхен) и других академических институтах и компаниях в России и за рубежом. Область научных интересов — биоинформатика во всех ее проявлениях: от вариаций генома и архитектуры хроматина до экспрессии генов и эволюции метаболома.
Разговоры за жизнь
За последние полгода мир вокруг нас изменился. Наука не осталась в стороне от этого. Тем не менее, области знаний, которыми интересуются ученые в России и за рубежом, остались те же. Совместный со Сколтехом и Российским научным фондом медиапроект «Разговоры за жизнь» — цикл интервью известных ученых о своей работе, пути в науке и поиске вдохновения.
— Екатерина, здравствуйте! Многие люди, которые долго работают в науке, рано или поздно сталкиваются с профессиональным выгоранием. Скажите, как вам удается сохранять интерес к работе?
— Это интересный вопрос. Могу сказать так: я не из тех ученых, которые готовы всё положить на алтарь науки — не спать, не есть, работать ночью, по выходным, без перерыва — нет. У нас нормальный график, мы заканчиваем не позже семи-восьми вечера, по выходным лаборатория не работает. Своим сотрудникам и студентам я не позволяю перерабатывать, потому что, на самом деле, это приводит к плохим вещам. Многие ходят к психотерапевту, потом начинаются проблемы с выгоранием. Это совершенно ни к чему.
Спокойный режим помогает мне сохранять интерес к науке. Если бы я перерабатывала, я бы не захотела исследованиями больше заниматься, потому что это тяжелая область на самом деле. Как и все вокруг, я устаю, напряжение большое, постоянные дедлайны, все это немножко выматывает. Но если нормально к этому подходить и пытаться сохранять work-life balance, то можно с этим существовать.
Если говорить об интересе, то мне нравится моя работа. Помимо того, что я 15 лет занимаюсь наукой, я еще 5 лет работала в компаниях, так что мне есть с чем сравнить. И в компаниях мне не нравится совсем, потому что там достаточно рутинные задачи. В науке все-таки мы сами себе хозяева, изучаем, что хотим и что нам нравится.
— То есть в науке вы видите творческую свободу?
— Да, наука — это определенно творческий процесс, потому что мы никогда не знаем, какой будет результат. Мы можем что-то планировать, загадывать — но совершенно не обязательно, что это получится. А иногда, наоборот, получается добиться успеха там, где совсем не ожидаешь. В этом и есть интерес: нет предсказуемости и четкого плана. И, кроме того, мы вообще более свободны, чем в компаниях, несмотря на то что у нас тоже есть гранты, и план работ, и дедлайны, и количество статей, которые мы должны сдать к определенному моменту. Все равно это все гораздо более гибко, чем в других областях.
— А что для вас самое тяжелое?
— Ой, лично для меня — это преподавание. Я очень сильно устаю — не знаю, как другие коллеги справляются. Некоторые читают по несколько лекций в день, я прочту одну — и потом мне нужно два дня отлеживаться, отдыхать. Наверное, у каждого есть что-то, что ему тяжело дается — хотя я не могу сказать, что это занятие мне не нравится. И без преподавания тоже никак: невозможно заниматься только исследованиями, потому что нам нужны студенты, аспиранты — ведь их руками делается вся наука, не моими вовсе. Я только их направляю, даю им советы. Большую часть работы делают ребята, и кто-то должен их учить. Если я не буду это делать, кто будет это делать?
— Вы имеете довольно богатый опыт — работали в разных университетах и в разных странах, причем как в европейских, так и в азиатских. Все всегда занимались биоинформатикой?
— Если сравнивать со средним ученым, то у меня, может быть, и правда богатый опыт, но для биоинформатика — это нормально. Наша работа устроена так, что мы всегда делаем много проектов параллельно. Мы биоинформатики — это значит, что мы анализируем данные за компьютером. Их получают наши коллеги в лаборатории, которые делают эксперименты, а мы только обрабатываем их результаты. Я не хочу преуменьшать наш вклад — без анализа сейчас не выполнишь никакое исследование — но, тем не менее, это всего лишь часть работы в большом проекте. Вообще, в современной науке так, наверное, все проекты выстроены: есть большая коллаборация из многих ученых, из многих лабораторий, очень часто из разных стран, и каждый делает свой маленький кусочек работы. Вот и мы тоже делаем свой маленький, но важный кусочек работы.
— Биоинформатика сейчас сильно востребована?
— У меня никогда не было проблем с поиском работы, и у моих студентов тоже. Наоборот, трудно кого-то найти к себе в лабораторию, так как специалистов меньше, чем нужно, на самом деле. А почему так происходит — это хороший и интересный вопрос, потому что данных сейчас в науке вообще и в биологии в частности очень много производится.
Все технологии подешевели, эксперимент теперь не требует таких больших расходов. Если в 90-е годы секвенирование генома стоило супер дорого и расшифровка первого генома обошлась, наверное, в миллионы — если не миллиарды — долларов, то сейчас сделать один геном стоит, может быть, несколько тысяч долларов. А если делать транскриптом — то есть получать информацию не о том, какие гены у нас есть в принципе, а о том, как они работают в конкретном органе и клетке — то это вообще на порядок дешевле. С падением цен логично выросла доступность, но что с получаемыми данными делать — не так много кто знает. Биоинформатики — одни из тех, кто относится к их числу, но таких специалистов не очень много в принципе, потому что это молодая профессия. Когда поступала в университет, мы были только третьим набором на первый в России факультет, готовящий биоинформатиков. Это было 15 лет назад, то есть можете примерно представить возраст профессии. Сейчас, конечно, больше мест, где готовят специалистов, но все равно .
О том, как развивается биоинформатика в Сколтехе, мы рассказывали в статье «Биоинформатика в Сколтехе: как программисты и биологи вместе делают науку» — Ред.
— При этом, данные всё продолжают множиться. В каких темпах их количество растет, можно оценить?
— В информатике есть такой закон — закон Мура — который описывает, с какой скоростью прогрессирует мощность компьютеров. Количество данных растет примерно в той же прогрессии. Если бы я нарисовала график, то он с 90-х годов начал бы резко расти и уходил прямо в небеса. Опять же это связано с удешевлением технологий и с увеличением доступности приборов.
— В чем вообще трудность с анализом данных? То есть почему у нас нету большого количества биоинформатиков? Это не для всех, получается, профессия?
— Нет, почему, это профессия для всех, в ней ничего особо сложного нет. Но нужно уметь программировать, и чтобы научиться, придется, наверное, несколько лет жизни потратить. Без этого ничего не получится.
Наверное, небольшая трудность может возникнуть из-за разнообразия типов данных. Секвенирование объединяет в себе много разных технологий, которые направлены на разные биологические объекты. Например, есть транскриптомика — она изучает активность работы наших генов. А можно исследовать, как устроена регуляция работы генов — этим занимаются технологии ChIP-seq и ATAC-seq. Сложность в том, что для каждого из этих типов данных нужны свои подходы к анализу, свои программы.
Сейчас стало легче, потому что много людей во всем мире занимаются этим и разрабатывают программы для анализа данных. В принципе, если технология появилась уже достаточно давно — «достаточно давно» в нашей науке это 3 года назад, — значит, уже есть программы для анализа этих данных. Но это хороший случай. В реальности все редко случается так, что ты запустил программу и получил результат — только если данные хорошего качества. Обычно экспериментаторы сталкиваются с проблемами, которые ухудшают качество данных. С этим можно бороться, но надо обладать определенными навыками. Просто запустить программу, не задумываясь, как она работает, не получится. Придется разбираться в деталях, подкручивать внутри программы какие-то «винтики», дописывать кусочки кода, модифицировать… Вот этим мы обычно и занимаемся, потому что идеальных данных в реальности нет.
И потом, опять же, наука — это не индустрия, где можно делать все по шагам. Нам всегда нужно что-то эдакое из данных вытащить, и стандартные подходы здесь, как правило, не работают. Они хороши для начальных этапов обработки данных, когда нужно что-то отфильтровать, очистить от шума. Но когда нам нужно ответить на какой-то биологический вопрос, проверить гипотезу — почти всегда приходится придумывать оригинальный подход к анализу, потому что стандартный на этом последнем этапе уже не подходит.
— Говоря про современные подходы: используете ли вы как-то машинное обучение?
— Да, в последние 3–5 лет мы очень много стали применять машинное обучение. Вообще, мы работаем со всеми типами данных, но среди всех с некоторыми работаем больше. Есть такой тип эксперимента, который позволяет понять, как уложена ДНК в ядре клеток и как упакованы хромосомы. Ведь они не просто скомканы абы как, там есть определенный порядок, и этот порядок очень важен для регуляции работы генов. Представьте, что мы от папы и мамы получили по одной копии хромосомы, и этот набор хромосом у нас во всех клетках одинаковый. Но у нас есть глаза, волосы, печень, почки, сердце — то есть разные клетки, хотя набор генов в них одинаковый. Как так получается? Есть сложная система регуляции работы генов, которая, в свою очередь, определяется упаковкой хромосом в ядре. От того, как в разных клетках хромосомы упакованы, зависит то, какие гены сейчас в этой клетке работают. Моя лаборатория специализируется в основном как раз на этом.
И есть специальный эксперимент, он называется Hi-C, который как раз направлен на то, чтобы вот эту карту упаковки хромосом детально расшифровать. Здесь тип данных более сложный, чем обычно, потому что он двумерный: мы говорим про упаковку хромосом, и это можно себе представить как карту контактов всех хромосом друг с другом с очень большим разрешением. И для каждого органа карта уникальна: в почках — своя, в печени — своя, в сердце — своя. Если мы переводим ее на язык данных, то получаем своеобразную матрицу контактов, и это более сложно, чем то, с чем обычно биоинформатики работают. Обычно секвенирование генома — это просто последовательность нуклеотидов на хромосоме, большинство данных одномерны. А то, чем мы занимаемся, это редкий тип данных, с ним мало кто работает. По крайней мере, сейчас существует не так много готовых программ, поэтому мы пытаемся применять для анализа этих данных что-то нестандартное. И машинное обучение, deep learning — все эти модные слова приходят на помощь, потому что машинное обучение вообще традиционно работает с изображениями. Даже если мы вообще от биологии отойдем, то с чего машинное обучение начиналось и сейчас на чем это все работает — это распознавание лиц, распознавание изображений, автоматический поиск объектов на фотографиях. Наши двумерные карты можно тоже как изображение представить: закодировать цветом числа, например. И мы как раз такой подход и пытаемся применять. Это во всем мире сейчас очень популярно.
— Но хорошая ли точность у моделей, которые сейчас в биоинформатике используются?
— Точность, конечно, страдает. И вообще, с биологическими задачами в отношении машинного обучения есть такая проблема, что у нас очень много признаков — например, генов — а образцов мало. Машинное обучение хорошо работает в обратной ситуации, когда много образцов, а признаков мало, а у нас всё наоборот. Поэтому не хватает мощности для хорошей работы моделей, которые в других областях применяются. Чтобы было понятнее, можно представить, что мы пытаемся распознать на изображении вазу: машинное обучение будет хорошо работать, если у нас есть 10 тысяч картинок и одна ваза, а у нас сто картинок и тысяча ваз на каждой из них. Понимаете разницу? Здесь еще нужно многое дорабатывать.
— Что нам, собственно, может сказать такая карта внутренних органов?
— Мы можем сравнивать карты и смотреть, где отличия — что, например, отличает работу печени от селезенки. Можно попытаться понять, какие гены отвечают за то, что называется словом «фенотип» — то, как выглядят клетки и как работают в конкретном органе. Но это фундаментальная задача, которая просто помогает нам разобраться, как все работает. Если мы будем говорить о более прикладных задачах, то можно такие же карты построить для здоровых и больных людей — например, для пациента с глиомой, раком мозга, и для человека со здоровым мозгом. Сравнивая результаты и находя отличия, мы сможем понять, что поломалось и, возможно, привело к развитию заболевания, потому что для многих заболеваний до сих пор непонятен механизм их возникновения, в том числе и для глиомы. Если мы это поймем, то сможем выбрать мишень для терапии и для разработки лекарства, которое, если не починит, то каким-то образом скомпенсирует поломку.
Глиому я выбрала в качестве примера, потому что для нее совершенно точно известно, что то, как упаковка хромосом поломалась, и определяет развитие болезни — по крайней мере, для некоторых подтипов. Но это не единственный пример, есть много таких заболеваний, в основном онкологических.
— А на какие фундаментальные вопросы ваша лаборатория пытается ответить?
— Мне кажется, наша лаборатория сейчас интересуется тем, что всем интересно в этой области — как упаковка хромосом устроена у человека и у других организмов . Потому что совершенно точно уже на сегодняшний день ясно, что у разных организмов даже фундаментальные принципы упаковки хромосом разные: у человека — свои, у мушки-дрозофилы — свои, у каких-то более простых организмов типа дрожжей — вообще другие. И ответа на то, почему она разная, нет до сих пор. Мы до сих пор не понимаем ни фундаментальных принципов, ни почему оно так устроено, ни какими механизмами оно поддерживается. Если мы хотим разобраться в этом вопросе, то надо, наверное, идти от простого к сложному — вернуться назад и проследить, как упаковка хромосом усложнялась постепенно от простых организмов вроде бактерий до человека. В итоге, может быть, это нам поможет понять механизм эволюции и разобраться в деталях.
О системной биологии хроматина Екатерина и ее коллеги уже рассказывали «Биомолекуле» в статье «Путешествие внутрь клеточного ядра, или системная биология хроматина» — Ред.
В последние годы большой прогресс был сделан в методах расшифровки упаковки хромосом. Они только в 2009 году появились, то есть совсем недавно.
— А какие еще прорывы были в вашей области?
— Как раз появление этой технологии, Hi-C, позволяющей определить, как детально упакована хромосома в ядре. Потому что пока ее не было, все, что мы могли сделать, это буквально посмотреть близость двух фрагментов генома. Но повторить подобное для миллионов маленьких кусочков хромосом и проследить, где они в ядре расположены, с кем любят рядом жить, мы смогли только в 2009 году. Благодаря появлению этой технологии было открыто очень много всего нового о деталях упаковки хромосом. Например, раньше, еще в 80-е годы, считали, что хромосомы упакованы в так называемую 30-нанометровую фибриллу — такую своеобразную жесткую трубочку. Потом появился метод Hi-C и данные с большим разрешением, и стало ясно, что никакой жесткой трубочки нет, и ДНК, на самом деле, скорее упакована в плотные клубочки, которые чередуются с рыхло упакованной ДНК. Весь наш геном — это такая цепочка: клубочек — рыхлая — клубочек — рыхлая — клубочек — рыхлая. При этом клубочки находятся примерно в одних и тех же местах в разных клетках нашего организма — то есть это очень стабильные структуры. Даже если мы будем сравнивать, например, человека и мышь, и как-то сопоставим наши хромосомы и хромосомы мыши, то эти клубочки будут примерно в одних и тех же местах расположены.
Сейчас ученые думают, что клубочки — это как раз таки единица регуляции работы генов, потому что, в основном, все активные гены живут на границах этих клубочков, там, где все распаковано, а внутри остаются неактивные гены, которые не нужны в данный конкретный момент клетке. В общем, даже понятно, почему так происходит — когда все плотно упаковано, внутрь просто физически не могут зайти белки, которые запускают работу спрятанного гена. А когда что-то находится на поверхности — там, где все рыхлое — ситуация обратная. Видимо, как раз поэтому структура важна для правильной регуляции работы клеток. Она немножко отличается между разными типами клеток — сердцем, кожей и так далее, но мне кажется, что именно в этом и кроется ответ на вопрос, почему в нас разные клетки по-разному работают. И это стало известно только с появлением нового метода.
— Но детально, почему печень — это печень, мы все еще не понимаем?
— Нет. То есть мы понимаем, что это связано с регуляцией работы генов, что регуляция как-то связана с клубочками — упаковкой хромосом и отличиями в упаковке хромосом между печенью и сердцем, условно говоря. Но детали еще не все известны. В частности, еще даже неизвестно, почему эти клубочки такие стабильные, почему структура по большей части не меняется от клеток к клеткам. Должен же быть какой-то механизм, который поддерживает эти клубочки, — ведь они не переезжают на разные места. Гипотезы существуют, но, во-первых, это все равно гипотезы, а во-вторых, мы совершенно точно знаем, что у человека и у мушки разные механизмы формирования этих клубочков. И почему так — непонятно.
Часть гипотез уже подтверждается и в ближайшие годы они, наверное, перейдут в разряд доказанных. Но все равно останутся какие-то вопросы. И, опять же, механизмы подтверждены, в первую очередь, для человека, но есть же организмы, которыми вообще никто не занимался. Если мы хотим проследить весь путь усложнения упаковки хромосом, то нужно сделать еще много экспериментов, много данных проанализировать. Кто-то должен этим заняться, чтобы для всех организмов получить такие карты экспериментально и понять, как в них хромосомы уложены.
— Сможем ли мы с помощью подобных карт изучать другие, не только онкологические, заболевания? Нейродегенеративные, например?
— Здесь вы попали абсолютно в точку. Мы, например, занимаемся психическими расстройствами, такими как шизофрения, аутизм , в том числе и по грантам РНФ. Почему мы думаем, что упаковка хромосом может быть связана с психическими расстройствами? Потому что в случае аутизма — по крайней мере, для трех мест в геноме — была установлена связь между заболеванием и поломками в упаковке. И для шизофрении тоже — правда, косвенными методами. Поэтому сейчас мы хотим провести прямые эксперименты: взять образцы от умерших людей с диагнозом «шизофрения» и от здоровых людей, и построить карты, чтобы найти отличия. Может быть, где-то есть важные для шизофрении гены. Условно говоря, у здорового человека был в каком-то месте клубочек, а у больного он развалился, и теперь ген работает не так, как должен, что, возможно, привело к развитию заболевания. Это наша гипотеза, и мы будем проверять ее экспериментально и на уровне анализа данных.
О своих исследованиях в этой области Екатерина рассказывала «Биомолекуле» в материале «Как системная биология раскрывает тайны мозга» — Ред.
— Как вы видите развитие вашей области в ближайшей перспективе и, может быть, очень далекой?
— В очень далекой, наверное, тяжело сказать, потому что, например, 10 лет назад нашей области-то еще не и было. И что случится через 10 лет, сложно себе представить. Но в ближайшей перспективе, проблема того, что данных становится все больше, а людей, желающих и способных глубоко анализировать их, растет не так быстро, будет только усугубляться. Но, с другой стороны, сейчас уже для всех самых популярных типов экспериментов и данных, есть готовые программы, которыми можно пользоваться. Это упрощает нашу работу. То есть это не решает всех проблем — нельзя запустить программу и получить статью в Nature — все равно на финальных этапах нужно придумывать уникальный подход для каждого проекта. Но все равно, по крайней мере для первых шагов обработки данных, уже есть инструменты.
В ближайшие 5 лет, я думаю, будет появляться все больше программ, они будут становиться все более удобными, и, по крайней мере, для почти всех шагов анализа данных мы будем уже, по сути, не нужны. Они будут легкими: не нужно будет уметь программировать или быть биоинформатиком, будет достаточно просто компьютерной грамотности. Но я думаю, что все равно для вот того маленького шага, который кажется последним и, может быть, незначительным — нужен будет человек. Это то, что превращает базовую работу в хорошую — то, что может привести к какому-то научному открытию. Поэтому я не думаю, что наша профессия пропадет. Наоборот, даже, скорее, она станет, возможно, более востребованной, потому что в ней появится больше творчества: нам не нужно будет делать технические, монотонные шаги.
— То есть, получается, рутина станет автоматизированной?
— Да, рутина уходит, и мы видим это уже сейчас. За последние пару лет появились программы, которые автоматически анализируют полученные прибором данные. Раньше для каждого этапа была своя отдельная программа: ее нужно было отдельно запускать, подбирать параметры, думать, как она работает, как ее подстроить. Сейчас есть просто одна большая программа, туда загружаешь результаты и получаешь почти обработанные данные.
Это дает больше свободы для занятия чем-то интересным. Но, с другой стороны, это создает и сложности. Например, большая часть биоинформатиков до сих пор занималась просто разработкой этих программ. Многие лаборатории так и продолжают жить тем, что публикуют статьи про инструменты для обработки данных. Это тоже хорошее направление, но сейчас им будет супер трудно, потому что уже есть хорошие инструменты: что ты такого можешь нового сделать, чтобы еще улучшить то, что и так хорошо работает? Наверное, этому типу биоинформатиков придется нелегко. Но мы, к счастью, не такой тип биоинформатиков, мы — те, кто любит что-то придумывать на последнем этапе. И мне кажется, что мы еще будем нужны.