биомолекула.ру. Взгляд изнутри.
 

Логин:
Пароль:


Я б в биоинформатики пошёл, пусть меня научат!

[30 апреля, 2014 г.]

Биология не раз переживала новое рождение: быв сначала «полевой» наукой, изучавшей животных и растения, в XX веке она значительно переместилась в лаборатории, концентрируясь на молекулярных основах жизни и наследственности. В XXI веке история двинулась дальше: многие эксперименты теперь проводятся на компьютере, а материалом для изучения являются последовательности белков и ДНК, а также информация о строении биологических молекул. В этой статье мы дадим несколько советов тем, кто решил связать свою карьеру с компьютерной биологией, став, тем самым, биоинформатиком.

Обратите внимание!

Спонсор публикации этой статьи — Лев Макаров.

В наше время в мире никого не удивишь уже названием профессии «компьютерный биолог» или «биоинформатик», хотя еще несколько десятков лет назад эти сферы деятельности — биология и компьютеры — казались совсем непересекающимися, а еще за несколько десятков лет до того никаких компьютеров не было вовсе. Причем сейчас этот термин включает в себя уже достаточно много отдельных занятий, требующих разной подготовки и разного взгляда на науку и ее место в жизни: биоинформатик, специалист по обработке информации, разработчик баз данных, программист, куратор онтологий, специалист по молекулярному моделированию — все они занимаются разными вещами, хотя со стороны их отличить будет непросто. Все это без намеков говорит нам, что компьютеры прочно вошли в будни биологов, причем это не только е-мейл и фейсбучек, но и масса более специальных навыков, без которых исследователю сейчас и в будущем уже не обойтись (см. врезку). Студент вы или профессор, — никогда не поздно начать совершенствовать свои навыки биоинформатика*!

* — Для ясности биоинформатиками будем называть всех биологов, в работе которых компьютеры играют роль бóльшую, чем просто печатная машинка, хотя в российской традиции собственно под биоинформатиками имеют в виду тех, кто занимается изучением закономерностей биологических текстов — последовательностей белков и ДНК, — а моделирование динамики и свойств биомолекул, например, чаще называют молекулярным моделированием.

«Сухая» биология

«Биомолекула» довольно много внимания уделяет компьютерной, или, как ее еще называют, «сухой» биологии — современной отрасли биологической науки, в которой главным инструментом исследователя является обычный компьютер. (Правда, частенько приходится прибегать к помощи и не совсем обычных — суперкомпьютеров.) На нашем сайте есть специальная рубрика, посвященная этой науке, — «In silico» [1], — ознакомиться с которой мы и предлагаем заинтересованному читателю. В частности, там идет речь о концепции количественной биологии [2], о способах вычисления пространственной структуры [3] и динамики [4] биологических молекул (с особенным акцентом на биомембранах и мембранных белках и рецепторах [5]), а также о становлении молекулярной графики [6]. В недавних статьях было рассказано о методах изучения эволюции по молекулярным данным [7], а также о новой концепции «сухой» биологии, предсказывающей будущее биологии как науки [8].

В этой статье, основанной на переводе недавнего эссе в журнале Nature Biotechnology [10], мы приводим некоторые советы для начинающих биоинформатиков — исследователей, которые планируют заниматься изучением жизни без отрыва от клавиатуры.


Словарик компьютерных терминов

Командная стока — способ взаимодействия с компьютером без мышки и кнопочек, а лишь набирая в окне терминала специальные команды и оперируя информацией, хранящейся в текстовых файлах. Чаще всего командная строка ассоциируется с компьютерами под управлением UNIX/Linux, хотя и в WindowsTM, и в Mac OSTM они тоже есть.

Кластер — объединенные в единую высокоскоростную сеть и работающие вместе компьютеры, которые можно использовать для решения ресурсоемких задач. Обычно оснащены системой планирования задач и диспетчеризации ресурсов.

Конвейер — способ решения конкретных задач по обработке данных, объединяя программы более общего назначения в цепочку так, чтобы информация, выдаваемая одной программой, попадала на вход следующей.

Исходный код (исходник) — текст программы на одном из языков программирования. В случае интерпретируемых языков текст является программой сам по себе, а вот программу, написанную на компилируемом языке, сначала надо перевести в бинарный исполняемый файл (скомпилировать).

Программное обеспечение (ПО). Ну это и так понятно — добавим лишь, что это набор инструкций для компьютера, который позволяет пользователю (или программисту) решать нужные ему задачи — от набора текстов в ворде до анализа генетической последовательности или расчета молекулярной динамики.

Скрипт — разновидность программы, написанная на интерпретируемом языке (а значит, не требующая специальной компиляции) и используемая биоинформатиками для автоматизации своих задач, для реализации парадигмы конвейера.

Система контроля версий — компьютерная система управления разработкой сложных программ, включающих десятки или сотни файлов с исходниками, тысячи или даже миллионы строчек кода, и разрабатываемых несколькими или многими программистами. Позволяет программе со временем не «расползаться», а программистам — легко переключаться между разными версиями и «ветками» разработки.

UNIX/Linux — семейство исходно многопользовательских и многозадачных операционных систем (ОС). Чаще всего используется на серверах и вычислительных кластерах, однако может устанавливаться и на персональные компьютеры в качестве альтернативы коммерческим ОС (таким как Windows). Особенностью этих операционных систем является модель разработки — поскольку ОС имеют открытый исходный код, в их создании участвуют программисты-добровольцы со всего мира. Впрочем, число версий так велико, что есть и проприетарные («закрытые») ветви — как, например, Mac OS, которая с некоторого времени внезапно стала «потомком» UNIX-систем.

Выбор оружия за вами

Сейчас создано такое количество разнообразных биоинформатических программ, что сделать оригинальное компьютерное исследование можно, и не программируя самостоятельно; надо только выбрать подходящее ПО. Однако не стоит слишком расслабляться: чтобы получилось что-то хорошее, надо сначала как следует понять, что же эти программы делают, и какая математическая теория лежит в их основе. Вы же не пойдете в лабораторию ставить полимеразную цепную реакцию, предварительно не узнав, что это такое и для чего нужно*? Ну так вот и с компьютерами то же самое. Биоинформатические программы, по сути, являются аналогами оборудования и методик в «мокрой» молекулярно-биологической лаборатории. (Кстати, на контрасте со словом «мокрый» биоинформатические лаборатории все чаще сейчас называют «сухими» [8].) Поэтому, хотя от вас и не требуется вчитываться в каждую строчку исходного кода, представлять себе общие принципы работы программ совершенно необходимо.

* — Ну, мы надеемся, что не пойдете. — Ред.

Разные программы часто воплощают один и тот же теоретический подход, но все-таки адаптированы для решения разных практических задач. Например, при «сборке» генома из отдельных последовательностей ДНК [9], получаемых в результате работы автоматических секвенаторов, в случае «длинных» (сотни остатков нуклеотидов) прочтений используется алгоритм, основанный на перекрывании (Overlap-Layout-Consensus), в то время как для работы с наборами «коротких» (десятки остатков нуклеотидов) фрагментов лучше подходят графы де Брёйна. И выбор правильной программы не только сэкономит вам массу времени, но и вообще принципиально обеспечит (или не обеспечит) выполнимость поставленной задачи.

Хотя иной раз на мониторе биоинформатика и появляются занятные картинки (в данном случае — гликопротеин лихорадки Денге), чаще всего там можно увидеть текстовое окошко с непонятными колонками цифр или строчками букв. Картинка: Sanofi Pasteur @ Flickr.

Держите все под контролем

Одна из главных опасностей, что компьютер запросто может выдать неправильный результат, специально никак не просигнализировав об этом. Отсутствие сообщения об ошибке еще не говорит о том, что полученный результат правильный. Подав программе дикие данные на вход или просто использовав неправильные настройки, неизбежно получишь дикий ответ, и чрезвычайно важно постоянно помнить о такой возможности и уметь проверять, что полученное имеет хоть какое-то отношение к действительности. Проще всего убедиться, что все работает как следует, запустив программу для данных, ответ для которых уже известен, и убедиться, что именно он и получается. Часто для маленьких наборов данных вычисления можно провести буквально вручную, и тогда сверить ответ с получаемым на компьютере особенно занятно: если он отличается, то либо не права машина, либо вы. Но положительного результата в этом случае уже не получить — это точно.

Биохимические эксперименты никогда не проводят без отрицательных и/или положительных «контролей», так вот привыкайте и на компьютере делать то же самое. Контролем в биоинформатике последовательностей служит, как правило, проверка модели на неких случайных данных. С выбором модели генерации случайных данных надо быть очень и очень аккуратным. Дважды проверяйте, что все было без ошибок, и, главное, что полученные результаты имеют какой-то смысл, — иначе вас неизбежно подкараулят «открытия» на ровном месте.

Если программировать достаточно много, все предстает в другом свете. Картинка: molecularecologist.

Вы ученый, а не программист

Как известно, лучшее — враг хорошего. Помните, что в вашей работе важны свежие мысли и новизна результатов, а не красота исходников программы. Превосходно оформленный и документированный код, который не дает правильного ответа, несомненно, никуда не годится по сравнению с примитивным скриптом, который дает его. Другими словами, красоту в программу следует привносить только после того, как вы не раз уже убедились, что она и впрямь делает то, для чего предназначена. И — самое главное — используйте свои биологические знания по максимуму, потому что только это и делает вас компьютерным биологом. С другой стороны, полезно писать комментарии прямо по ходу написания программы: «эта функция/структура нужна для...», иначе уже через неделю вы потратите много времени, чтобы понять, что здесь происходит. Повторный запуск программы — это отличное повод для приведения кода в человеческий вид; вы просто будете делать это походу «вспоминания» вчерашней последовательности действий.

Используйте систему контроля версий

Использование контроля версий позволит более гибко управлять развитием кода, позволит легко возвращаться к предыдущим редакциям программы или переключаться между разными ветвями разработки, а также откроет возможность совместной разработки программы. Распространенные системы — такие как Git или Subversion — дадут возможность легкой публикации проекта в сети. Вы сделаете лучше прежде всего для себя, если не поленитесь написать несколько внятных README-файлов и положите их в нужные места проекта; это чрезвычайно вам поможет, если спустя месяцы или даже годы вам придется вернуться к старой программе. Документируйте программы и скрипты, чтобы было понятно, что они делают. Когда публикуете научную статью, хорошим тоном будет опубликовать также оригинальные программы, которые использовались для обсчета данных: это позволит другим использовать тот же метод и воспроизвести ваши результаты. Неплохо бы также вести электронный дневник, в котором был бы записан весь ход работы. Онлайн-репозитории, такие как Github, позволяют делать это, а также позволят вам хранить рабочие версии программы, что станет дополнительным уровнем бэкапа ваших наработок (см. таблицу 1).

Таблица 1. Важные инструменты компьютерного биолога
ЗадачаИнструменты
Совместная разработка программСделайте ваш код (и, возможно, данные) доступными в сети с такими онлайн-хранилищами как Github, Sourceforge или Bitbucket. В интернете много руководств по использованию этих систем. Существуют также системы управления научными проектами, о которых рассказано в отдельной врезке.
Для сложных задач пишите скрипты и конвейерыДля этого можно использовать как современные разработки, вроде Ruffus, так и проверенные временем классические UNIX-утилиты типа Make. Выбор конкретного инструментария зависит от личных предпочтений и любимого языка программирования
Сделайте ваши «конвейеры» доступнымиНе исключено, что в командной строке вы себя чувствуете, как рыба в воде, но большинство ваших коллег, наверняка, нет. Созданные вами конвейеры можно оснащать графическими интерфейсами с помощью систем Galaxy или Taverna.
Инструменты разработчика (IDE)Конечно, программы можно писать в любом текстовом редакторе, начиная с vi, но будет лучше, если вы освоите более продвинутые инструменты — такие как текстовый редактор Emacs или полнофункциональную среду разработки типа Eclipse. И, опять же, конкретный выбор будет основан на ваших предпочтениях и любимом языке программирования.

Системы управления проектами

Еще одним полезным инструментом, помимо систем контроля версий, который можно позаимствовать из программисткой практики, являются системы управления проектами. Проще всего воспринимать их как продвинутый электронный журнал, который предоставляет вам следующие дополнительные возможности:


  • Создание и назначение задач. Например, «посчитать то-то». Внутри задачи можно вести обсуждения, которые будут удобно структурированы и не превратят вашу почту в склад ужасающей переписки вроде «Re: Project X (100)» При этом, однако, можно настроить почтовые уведомления, поэтому никто не пропустит важный комментарий.
  • Прикладывать и организовывать файлы с подробными описаниями и поддержкой версий а-ля Dropbox. Вам приходилось подолгу искать в нескольких ветках переписки по проекту какие-нибудь файлы с маловразумительными названиями, вроде «report_ACC_clean.xxx»?
  • Во встроенную Wiki можно заносить описания процедур запуска программ, методики экспериментов, встраивать видеозаписи и даже рендерить LaTeX формулы.
  • Текстовый поиск по всему содержимому, в том числе по приложенным файлам.
  • Интеграция с системами контроля версий для разработки ПО позволяет удобно соотносить задачи с изменениями в репозиториях.
  • Есть даже такие экзотические возможности, как организация своего аналога Google Docs для одновременного редактирования текста. Не всю информацию можно доверить сторонним ресурсам.

В нашей лаборатории мы используем Redmine — это отличная СПО-система управления проектами, под которую есть множество плагинов. Ее можно развернуть как самостоятельно, так и взять в аренду виртуальную машины с уже установленной системой. Наиболее известным проприетарным аналогом является Basecamp.

Залевский Артур, Факультет Биоинженерии и Биоинформатики МГУ (группа вычислительной структурной биологии).

Заразная болезнь конвейерит

Конвейер (pipeline) — программная цепочка из нескольких или многих инструкций, позволяющая проводить в точности те же операции на новом наборе данных. Конвейеры и скрипты незаменимы в работе компьютерного биолога, но они также могут загнать ваше сознание в прокрустово ложе скрипта и в корне прервать полет фантазии.

Поэтому нужно предупредить: не пишите всеобъемлющих скриптов слишком рано. Сначала убедитесь, что ваша задумка сработала, и только потом программируйте конвейер. Да и в этом случае трижды подумайте: а оно надо? Точно ли конвейер в этом случае сэкономит время и позволит вывести исследование на новый уровень? Смогут ли (и захотят ли!) этой программой пользоваться другие люди? Если в дальнейшем никто, кроме вас, этой программой пользоваться не собирается, то проще будет оставить ее на уровне работающего скрипта и не увлекаться слишком полной автоматизацией процесса. Тем более — если работа была разовая, в вряд ли заново придется делать то же самое. В этом случае достаточно просто записать в журнал проделанное и с чувством выполненного долга двигаться дальше. В любом случае, вежливо будет в статье написать «scripts are freely available at request», если вы и впрямь не против поделиться своим решением.

Полет фантазии

Ну конечно же, вы можете. Что захотите — то и можете. В том смысле, что креатив и смелая фантазия в работе компьютерного биолога совершенно необходимы, потому что иначе сделать ничего интересного не получится. Адаптируйте существующие методы, создавайте новые, предвидьте успех и не бойтесь неудачи. В этой области очень многого можно достичь, просто лазая по интернету и общаясь с коллегами в лаборатории или в сети. Самообразование не только научит вас решать конкретные проблемы — оно научит вас постоянно учиться.

Запишитесь на онлайн-курсы (см. табл. 2), но это будет только начало, а не конец обучения. Лишь смерть обрывает обучение по-настоящему творческого человека.

Таблица 2. Полезные ресурсы для (само)образования
Полезный навыкРесурсы
Онлайн-курсы (Massive open online courses)Сейчас такие курсы переживают взрыв популярности, и уже предлагают крайне широкий спектр тематик для изучения прямо через интернет. На сайтах Coursera, Udacity, edX и Kahn Academy есть масса полезного из области биоинформатики, геномики, компьютерной биологии, статистики и разнообразного моделирования.
Обучение программированиюCodeacademy и Code School не являются чем-то заточенным под биологию, но хорошо подходят для начал программирования. Потом можно продолжить с курсом «Python для биологов». Множество хороших примеров доступно на сайте http://software-carpentry.org.
Решение биоинформатических задачПрактическое изучение биоинформатики путем изучения программирования и соревнования с другими участниками проекта доступно на российском сервисе Rosalind.
Международные организацииGOBLET — международная организация по биоинформатическому образованию, а ELIXIR — европейское объединение, обеспечивающее различную информационную поддержку и инфраструктуру для исследований в области наук о жизни.
Блоги и листы подпискиВ сети есть масса блогов и списков рассылки для компьютерных биологов, например http://stephenturner.us/p/edu и http://ged.msu.edu/angus/bioinformatics-courses.html. Для вычислительных химиков есть еще CCL.net.
«Локальные» российские ресурсы
Обучение основам биоинформатики (курсы и свободное посещение)Московская школа биоинформатики даст основные навыки в этой сфере, а курс по работе с данными высокопроизводительного секвенирования расскажет, как получают полные последовательности геномов. Институт биоинформатики в Санкт-Петербурге знакомит студентов с основами биоинформатики на примере реальных научных исследований (также проходит Летняя школа).
Вузы, в которых преподают биоинформатику
Опыт работы с Linux/UnixПомощь в установке и настройке одного из дистрибутивов Linux вам могут помочь в сообществах Russian Fedora или Ubuntu. Также вы можете обратиться с вопросами на http://linux.org.ru; более того, на этом ресурсе можно получить и ответы на некоторые научные вопросы.

Никого не слушай

При отработке статистических методик часто делают такой эксперимент: генерируют большие массивы случайных данных, которые случайно же обозначают как «рабочую выборку» или «контроль». А затем к этим данным применяют статистический критерий, который должен выявить различия между данными, которые исходно не различаются, и... Для многих «выборок» p-значение частенько указывает на статистически значимое различие. Биологические наборы данных, например, полученные из геномного анализа или из скрининговых тестов, также полны случайного «шума» и часто огромны по размерам. Будьте готовы к тому, что при анализе подобных данных вам придется столкнуться с ложноположительными и ложноотрицательными результатами, а также в исходные данные может вкрасться систематическая ошибка, возникшая из-за особенностей эксперимента или экспериментатора.

Даже у биологов, искушенных в статистике, частенько возникает соблазн наплевать на осторожность и углубиться в эксперименты с программой или скриптом, давшими интересный результат. Однако тут всегда необходима осторожность, которая подсказывает, что необходимо рассматривать любой результат как потенциально ошибочный и провести дополнительные проверки на этот счет. Если один и тот же результат удается получить с помощью разных подходов, тогда уверенность в правильности каждого из них возрастет. И, тем не менее, большинство таких «открытий» требуют экспериментального подтверждения, чтобы откинуть оставшиеся сомнения.

Самое важное — что для интерпретации полученных на компьютере результатов нужно хорошее биологическое образование и чутье. И даже то, что программа или скрипт работают правильно, еще не гарантирует, что полученный результат не является артефактом или просто неверной трактовкой каких-то других явлений.

Любимые слова компьютерных биологов. Картинка: nsaunders.

Верный инструментарий

Обязательно освойте командную строку UNIX/Linux. Бóльшая часть биоинформатических программ имеет интерфейс командной строки. На самом деле, она чрезвычайно мощная, позволяет в тонкостях контролировать рабочие задачи, запускать программы на параллельное исполнение, и, что немаловажно, контролировать работу утилит и перезапускать их прямо через текстовый терминал, хоть с мобильного телефона. Это одно из преимуществ работы биоинформатиков — работать можно где угодно, был бы под рукой компьютер или планшет, а также выход в интернет. Освойте параллельные вычисления, потому что они позволяют запускать сотни задач одновременно и многократно повышать производительность работы. Обязательно нужно уметь хоть чуть-чуть программировать, хотя выбор конкретного языка программирования не играет большой роли: у всех у них есть свои преимущества и недостатки, и иногда нужно комбинировать несколько разных языков, чтобы сделать работу быстрее.

Помните, что выбор более популярного языка позволит вам пользоваться бóльшим набором существующих библиотек и подпрограмм, которые позволят не изобретать велосипед, а сосредоточиться на своей работе. Примером такого «склада» наработок является Open Bioinformatics foundation. Старайтесь не использовать Microsoft Excel (только для вывода таблиц, которые будут читать некомпьютерные биологи, которые только с ним и умеют работать). Это хорошая программа, но для обработки большого количества данных она все-таки подходит плохо. Лучше всего хранить экспериментальные данные в структурированных текстовых файлах (хороший вариант для таблиц — csv) или в SQL-базе — это позволит получать доступ к информации прямо из вашей программы.

И, да, делайте бэкапы!

Элементарно, Ватсон!

Раз уж вы станете компьютерным биологом, вам все время придется возиться с данными. Они хранят множество историй, и выловить эти истории оттуда — ваш профессиональный долг. Однако скорее всего сделать это будет не так-то просто. Нужно постоянно держать в голове смысл проведенного эксперимента и схему анализа данных, а также денно и нощно обдумывать, какой же биологический смысл кроется в полученных результатах. И не является ли гипотетический подмеченный вами смысл тривиальным следствием ошибок анализа или артефактов в данных.

Чтобы все это имело смысл, нужно общаться с другими специалистами, которые получали эти экспериментальные данные, и стараться собрать картину по кусочкам. Предлагайте дополнительные эксперименты, которые смогут подтвердить или опровергнуть выдвинутую вами гипотезу. Станьте детективом, докопайтесь до ответа.

Кто-то это уже сделал. Так найдите их и спросите!

Какая бы хитрая не была проблема и как бы не был нов метод, всегда есть вероятность, что люди уже занимались тем, с чем пришлось столкнуться вам. Есть два сайта, на которых обсуждают возникшие в исследованиях проблемы — BioStars и SeqAnswers (а чисто программистские вопросы — Stack Overflow). Иногда можно получить дельный совет даже в твиттере. Поищите в интернете, кто в этой стране и в мире занимается похожими вопросами и свяжитесь с ними (см. таблицу 3).

Таблица 3. Русские «сухие» лаборатории
ЛабораторияГородЧем занимаются
Группа молекулярного моделирования на биологическом факультете МГУМоскваМолекулярная динамика белков и пептидов
Группа вычислительной структурной биологии, биоинформатическая группа и лаборатория эволюционной геномики на факультете биоинженерии и биоинформатики МГУМосква
  • Молекулярное моделирование нуклеиновых кислот и нуклеопротеидов и биомембран. Дизайн ферментов.
  • Системная биология, биостатистика, изучение вторичной структуры РНК.
  • Изучения естественного отбора на геномном уровне, работа с данными секвенирования нового поколения (NGS).
Лаборатория химической кибернетики и группа компьютерного молекулярного дизайна на химическом факультете МГУМосква
  • Квантовая и фотохимия
  • Молекулярное моделирование оболочек вирусов и их ингибиторов, а также мембранных рецепторов
Лаборатория биокатализа и биотрансформаций и Отдел математических методов в биологии НИИ физико-химической биологии МГУМосква
  • Молекулярное моделирование и биоинженерия ферментов
  • Анализ пространственной структуры белков и комплексов белок-ДНК. Анализ геномных данных.
Лаборатория моделирования биомолекулярных систем в Институте биоорганической химии РАНМоскваМолекулярное моделирование биомембран и мембранных белков, а также биологически активных веществ
Лаборатории структурной биоинформатики и структурно-функционального конструирования лекарств в Институте биомедицинской химии РАМНМоскваКомпьютерное моделирование комплексов белков с белками и лекарствами, драг-дизайн, фармакология, изучение связей «структура—активность»
Учебно-Научный центр «Биоинформатика» и еще несколько биоинформатических групп в Институте Проблем Передачи Информации РАНМоскваСистемная биология, анализ пространственных структур биомолекул, сравнительная геномика.Организуют Московский биоинформатический семинар, Московскую школу биоинформатики и конференцию «Moscow Conference for Molecular Computational Biology».
Лаборатория системной биологии и вычислительной генетики и группа биоинформатики в Институте общей генетики РАНМоскваПоиск функциональных мотивов (сайтов связывания транскрипционных факторов и т.д.) в последовательностях ДНК
Лаборатория биоинформатики и системной биологии в Институте молекулярной биологии РАНМоскваМетоды биоинформатики и поиска функциональных мотивов, предсказание предрасположенности к заболеваниям
Лаборатория биоинформатики в НИИ Физико-химической медициныМоскваПроблемы метагеномики и протеомики
Лаборатория алгоритмической биологии Академического университета РАНСанкт-ПетербургПроблемы «сборки» и анализа геномов
Лаборатория «Алгоритмы сборки геномных последовательностей» национального исследовательского университета информационных технологий, механики и оптикиСанкт-ПетербургПроблемы «сборки» и анализа геномов
Группа биоинформатики и функциональной геномики Института Цитологии РАНСанкт-ПетербургИзучение функционального значения общей структуры генома
Лаборатории функциональной геномики и клеточного стресса и механизмов функционирования клеточного генома Института биофизики клетки РАНПущино
  • Моделирование структурной организации и поиск промоторов в ДНК бактерий
  • Анализ распределения физических свойств вдоль последовательности ДНК, нелинейная динамика ДНК
Лаборатория прикладной математики в Институте математических проблем биологии РАНПущиноВторичная структура РНК, альтернативный сплайсинг
Лаборатория физики белка Института белка РАНПущиноТеоретическое и экспериментальное изучение процессов сворачивания белковых молекул
Отдел системной биологии Института цитологии и генетики СО РАННовосибирскПостгеномная биоинформатика. Компьютерный анализ и моделирование молекулярно-генетических систем. Генные сети. Модели эволюции микроорганизмов.
Группа лаборатории экологической биохимии Института биологии КарНЦ РАНПетрозаводскМолекулярное моделирование биомембран
Мы отдаем себе отчет, что в одной таблице нельзя перечислить все стóящие научные группы. Если мы забыли кого-то, то с удовольствием добавим.
Таблица подготовлена Еленой Чуклиной (Московский Физико-Технический Институт / Учебно-научный центр «Биоинформатика» Института Проблем Передачи Информации РАН).

В довершение можно сказать, что в интернете есть масса форумов и юзергрупп, где можно задать интересующие вопросы. Установите себе линукс и начните изучать в онлайне что-нибудь биоинформатическое. При должном упорстве вы удивитесь, как многого можно достичь, имея просто компьютер и выход в интернет!

Статья написана по мотивам эссе в журнале Nature Biotechnology [10] при участии Артура Залевского и Елены Чуклиной.

Литература

  1. биомолекула: «In vivo — in vitro — in silico»;
  2. биомолекула: «Пространственно-временное моделирование в биологии»;
  3. биомолекула: «Торжество компьютерных методов: предсказание строения белков»;
  4. биомолекула: «Молекулярная динамика биомолекул. Часть I. История полувековой давности»;
  5. биомолекула: «Компьютерные игры в молекулярную биофизику биологических мембран»;
  6. биомолекула: «На заре молекулярной графики»;
  7. биомолекула: «Как прочитать эволюцию по генам?»;
  8. биомолекула: «Вычислительное будущее биологии»;
  9. биомолекула: «Код жизни: прочесть не значит понять»;
  10. Loman N., Watson M. (2013). So you want to be a computational biologist? Nat. Biotechnol. 31, 996–998.

Автор этой заметки делает вид, что моделирует на компьютере взаимодействие лиганд-связывающего домена никотинового ацетилхолинового рецептора типа α7 с одним из природных нейромодуляторов.

Автор: Чугунов Антон.

Число просмотров: 8233.

Creative Commons License — условия использования и распространения материалов сайта.
Вернуться в раздел «In Silico»

Комментарии

(Оставить комментарий) (показывать сначала старые комментарии)

Re: Я б в биоинформатики пошёл, пусть меня научат!

mike potanin — 26 октября, 2016 г. 15:42. (ссылка)

Вместо IDE лучше осваивать "записные книжки" Jupyter, а вместо питона учить Julia или R.

(ответить)

Академия наук КНР открыла новые вакансии для иностранных ученых, особенно ищем биоинформатиков!

Иванов Петр — 21 августа, 2014 г. 10:22. (ссылка)

"A new talent program has been initiated by the CAS. The application starts now.
1. Category and Qualification
1) CAS President’s International Fellowship for Distinguished Scientists:
Foreigners with non-Chinese ethnicity, with the potential to win international first-class awards in science, or already got one but stick to research work in the scientific frontiers, who can visit host institute for at least 1-2 week(s) for academic exchange and accept a return visit by the host institute’s scientist scientists.
2) CAS President’s International Fellowship for Visiting Scientists:
Foreigners with non-Chinese ethnicity, working in overseas research bodies, universities or the research organs of enterprises, actively engaged in the research work with the title of assistant professor and above or its equivalent, with worldwide recognized achievements, who can visit host institute for 1-12 months (Those who apply to work for more than 1 month should work in China for no less than 1 month consecutively each time.); with a concrete work plan with the Chinese collaborator and abiding by the Chinese laws and regulations of the CAS and host institutes.
3) CAS President’s International Fellowship for Postdoctoral Researchers:
Foreigners with non-Chinese ethnicity under the age of 40, with a Ph. D degree granted by a formal university; able to provide at least two recommendation letters (one issued by his/her doctoral supervisor); in conformity with registration regulations of the National Postdoc Management Committee; abiding by the Chinese laws and regulations of the CAS and host institutes.
2. Respective Funding Plans
1) Distinguished Scientists: 50,000 RMB per week and 30%, namely 15,000 RMB, should be borne by the Chinese collaborator or supervisor
2) Visiting Scientists:
The funding plans involve three classes:
A. For those with the title of professor or equivalent, the standard is 40,000 RMB per month (pretax);
B. For those with the title of adjunct professor or equivalent, the standard is 30,000 RMB per month (pretax);
C. For those with the title of assistant professor or equivalent, the standard is 20000 RMB per month (pretax);
Besides, they will get subsidies for the international trips, 5000 RMB per person for visitors from the adjacent countries of China, 20,000 RMB per person for visitors from Latin America and Africa, 8000 RMB per person for visitors from the rest countries.
3) Postdoctoral Researchers:
The funding plan covers 1-2 years with a standard of 200,000 RMB per person each year (pretax). Besides, they will get subsidies for the international trips, 5000 RMB per person for visitors from the adjacent countries of China, 20,000 RMB per person for visitors from Latin America and Africa, 8000 RMB per person for visitors from the rest countries. Those below the age of 35 can also apply for the International Young Scientist Research Fund by NSFC through our Science Department."

(ответить)

Re: Я б в биоинформатики пошёл, пусть меня научат!

Илья — 5 июня, 2014 г. 13:00. (ссылка) (свернуть ветвь)

Скажите пожалуйста, какова средняя зарплата специалиста-биоинформатика? Прошерстив сайты вакансий, складывается впечатление что биоинформатики вообще никому не нужны на рынке труда и в ближайшем будущем эта ситуация вряд ли изменится.

(ответить)

Re: Re: Я б в биоинформатики пошёл, пусть меня научат!

Чугунов Антон — 5 июня, 2014 г. 13:04. (ссылка)

Ответить на этот вопрос однозначно нельзя. Подавляющее число биоинформатиков работает научными сотрудниками в структурах РАН или других ведомств, а значит, получают очень низкий оклад бюджетников (10-20 тысяч рублей в месяц). При этом реальный доход, как и у всех научных сотрудников в России, складывается в основном из надбавок, выплачиваемых по грантам, зависящих от конкретной лаборатории, периода и отношений с начальством.
Что же касается должности биоинформатиков в коммерческих структурах (где была бы гарантирована высокая зарплата), то я про это просто ничего не знаю.

(ответить)

Re: Я б в биоинформатики пошёл, пусть меня научат!

Саша — 3 мая, 2014 г. 23:08. (ссылка)

Спасибо за столь подробную статью!
Для меня один из самых полезных ресурсов: справедливо указанный в статье biostars.org. (часто начинаю решение новых проблем именно с поиска по темам биостарсов)
Из полезного могу добавить http://omictools.com/ -- хорошо категоризованный каталог инструментов, многие из которых будут полезны биоинформатикам. (на http://seqanswers.com/wiki/Software также есть общий список-таблица)

(ответить)

Яндекс.Метрика

© 2007–2015 «биомолекула.ру»
Электропочта: info@biomolecula.ru
О проекте · RSS · Сослаться на нас

Дизайн и программирование —
Batch2k15.

Сопровождение сайта — НТК «Биотекст».

Условия использования сайта
Об ошибках сообщайте вебмастеру.