О зарождении биоинформатики: интервью с Марком Бородовским

О зарождении биоинформатики

Интервью с Марком Бородовским

«Поток»: Корреспондент Мария Гефен 

 

Заведующий кафедрой биоинформатики Физтеха Марк Бородовский рассказывает о зарождении биоинформатики, развитии кафедры и возможностях для новых поколений физтехов


Марк Юрьевич Бородовский — выпускник Физтеха, ученый, уже более двадцати лет работающий в США, профессор в Департаменте биомедицинской инженерии университетов Эмори и Джорджия Тех, глава Центра биоинформатики и вычислительной геномики в Технологическом институте Джорджии (Джорджия Тех), а также заведующий кафедрой биоинформатики в Московском физико-техническом институте (МФТИ). Марк Бородовский стоял у истоков биоинформатики: ещё работая в России он, совместно с коллегами, предложил алгоритм для предсказания местоположения генов в геноме, который позднее нашел разнообразное применение в биологии, став основой для нескольких пакетов программ, самая популярная из которых — GeneMark.

26 марта состоялся День открытых дверей кафедры биоинформатики МФТИ в Институте общей генетики РАН, для которого Марк Юрьевич прибыл в Москву. 25-го марта корреспондент «Потока», Мария Гефен, встретилась с Марком Бородовским утром в лобби отеля «Марриотт» на Новом Арбате, чтобы узнать о развитии кафедры, о науке в России и за рубежом, о перспективах для студентов.

О кафедре и науке в целом

— Сейчас кафедра биоинформатики набирает популярность: многие из нынешних студентов третьего курса задумываются о том, чтобы заниматься именно биоинформатикой. Как Вы думаете, с чем связан такой интерес?

— Биоинформатика уже на протяжении очень длительного времени привлекает к себе внимание тех молодых людей, которые знают, что у них есть способности к математике, к физике, и, с другой стороны, они очень заинтригованы тем, что они могут сделать для таких важных областей знаний как биология, медицина. Такая двойственность, которая присуща большой категории молодых людей, как раз находит отражение в этом интересе к биоинформатике. А почему это недавно — потому что тот объем данных, который возник в биологии, собственно, не так давно появился, и эта информация не сразу достигает тех, кто кончает школу. Со временем они начинают понимать, что есть такая интересная область, и стараются в этом направлении как-то двигаться. Когда я начинал, это был момент, когда вообще еще ничего не было, в Институте молекулярной генетики в Москве начала создаваться группа по компьютерному анализу генетических текстов.

— Да, я знаю про существование этой группы, но никогда не слышала эту историю от человека, который состоял в ней.

— Да, если вспоминать 1984 год, когда я в первый раз услышал о том что в Институте молекулярной генетики есть лаборатория Александра Анатольевича Александрова, эта лаборатория получила, — и это было практически уникальное явление в тот момент, — первые персональные компьютеры, которые были только что сделаны в Соединенных Штатах. 

Это были PC/XT, буквально первое поколение персональных машин c операционной системой Windows, до этого практически все было на main stations — компьютерах с многими пользователями, колодой перфокарт. Вместе с этими компьютерами они получили DNASTAR (имеется в виду пакет программ компании DNASTAR, прим. ред.), это компания в Штатах, в Мэдисон, Висконсин. Эта компания сделала пакет программ, чтобы анализировать фактически ДНКовые простые тексты. И это само по себе событие было столь ключевым, оно показывает что эта группа имела определенные ресурсы, чтобы покупать оборудование, покупать программы, но её основная задача была создавать алгоритмы, программы для анализа ДНКовых текстов. Кроме Александрова там были еще молодые сотрудники — это Женя Голованов и Юрий Стрижицкий, они со мной встречались вместе с Александровым, и я получил предложение присоединиться к ним, и начал там работать с 1984 года.

— Вы уже имели дело с какими-то сиквенсами (биологическими текстовыми данными, прим. ред.)?

— Да-да, уже тогда было какое-то количество, может быть, 10-я часть генома E-coli (кишечная палочка, прим.ред.) была секвенирована. Там была задача в перспективе создать систему, которая похожа на или параллельна GenBank.

— Кстати говоря, как эти данные [секвенирования] доставлялись?

— Тогда по подписке все можно было получить, такую магнитную ленту с этими данными. Они распространялись, может быть, раз в три месяца — такие апдейты.

— И в какой-то момент стало возможно установить сотрудничество с другими странами. 85-86 год — Вы разработали метод на основе скрытых марковских моделей, а потом в 90-м году у Вас уже лаборатория в Джорджия Тех, это большой рывок.

— Да-да, действительно так, если смотреть назад, то можно видеть такие ступеньки. Статьи, о которых Вы говорите, были опубликованы в журнале «Молекулярная биология» как раз в 86-м году — эта работа делалась в течение 85-го года. И основной результат этой работы был достаточно фундаментальный, потому что слово скрытые марковские модели в самих этих статьях не употреблялось. Потом английские и датские [ученые] сделали книжку, которая известна хорошо — это Дурбин(Ричард Дурбин, британский ученый-биоинформатик, прим. ред.) и соавторы, «Biological sequence analysis» («Анализ биологических последовательностей», прим. ред.), там они ссылаются на эти работы как на HMM-like(похожий на СММ, скрытые марковские модели, прим. ред.) подход. Действительно HMM-like, постольку поскольку в Hidden Markov Models существуют три основных алгоритма: это Viterbi algorithm (алгоритм Витерби), Posterior decoding algorithm (алгоритм прямого-обратного хода) и Baum-Welch Algorithm (алгоритм Баума-Велша). То, что было сделано, — это аппроксимация Posterior decoding, но, кроме этого, что само по себе было новое, там была предложена правильная схема моделирования кодирующих областей, — потом это показалось совершенно естественным, то есть почему же раньше не догадались, — которая используется для моделирования во всех алгоритмах, которые существуют для предсказания генов.

После этого, что касается международного сотрудничества, Александров меня попросил установить контакты, и я был в командировке в конце 86-го года в Германии, в феврале 87-го в Праге, в Чехословакии, потом еще я был в Венгрии. Мы собрали в 87-м или 88-м конференцию, уже международную конференцию, по компьютерному анализу генетических последовательностей.

— Международную конференцию — где?

— Одна была в Пущино, одна была в Йене, в ГДР тогда. В Германии, например, есть такое место — Берлин Бух (район Берлина, известен своими лечебно-медицинскими и научно-исследовательскими учреждениями, прим. ред.), где тогда там был Йенс Райх, Клаус Роде, там был тогда же Пир Борк. Пир приезжал на последнюю нашу конференцию в 2017-м году как главный спикер, и он же выступал на нашей первой конференции в Атланте 20 лет назад.

— И последняя в 2017-м тоже в Атланте?

— Да, каждые два года эта конференция была организована в одном и том же месте — в Атланте, Джорджия Тех. Конференция происходила уже 11 раз. И, в каком-то смысле, её возникновение связано с тем опытом, который у меня был по организации конференций в Москве и Йене.

— А проводились ли другие конференции, о которых Вы знали?

— Название биоинформатика появилось в 97-м году, и как раз оно мне очень нравилось. Я помню, что журнал назывался «Computer Applications in Biosciences» («Вычислительные задачи в биологических науках», прим. ред.), этот журнал был переименован в Биоинформатику, и я послал поздравление редактору с этим шагом. И наша конференция тогда еще не называлась «Биоинформатика», она называлась «In silico Biology» («Компьютерное моделирование в биологии», прим. ред.), и вот уже в 98-м году администрация Джорджия Тех попросила меня организовать программу по биоинформатике. Потому что программа началась уже в 99-м.

— И она была именно магистерская?

— Да-да. И с тех пор уже более 300 выпускников на этой программе.

Научная деятельность в США

— Когда Вы организовывали лабораторию, как это происходило?

— Да, хороший вопрос. В 90-м году я был в Атланте по приглашению моих друзей. Тогда я выступал в Джорджия Техе, просто делал доклад. И я получил предложение там работать, это было достаточно быстрое развитие событий, учитывая много обстоятельств. Например, в сентябре уже 90-го года на расстоянии 400 км от Атланты была конференция по Human Genome, самая первая: в том году был одобрен Human Genome Project(проект «Геном человека», прим. ред.) в Соединенных Штатах. В тот момент было очевидно, что будет очень интенсивное развитие, которое могло быть критически важным для работы, которую я делал. В сентябре я, помню, взял машину в ренту, в первый раз поехал по highway (шоссе, прим. ред.) из Атланты в место Хилтон Хэд, который вообще называется Хилтон Хэд Айленд, на границе Джорджии и Южной Каролины. Ещё тогда лаборатория практически не существовала, нужно было набирать студентов и так далее, а они еще не приехали, с мая до сентября летнее время. И то, что я показывал, был еще prototype (прототип, прим. ред.) алгоритма, то есть тот алгоритм, который был сделан в Москве, это примерно 30 процентов того, что могло работать. Понятно было, что можно доделать, я помню, разговаривал с Юрой [о том], как дальше можно развивать то, что мы сделали.

В 89-м году было такое ощущение что интерес по каким-то причинам не такой большой к этому развитию, администрация [в России], видимо, испытывала какие-то трудности. Группа наша перестала развиваться. Так что, когда я почувствовал возможность, принял решение продолжать работу там, где есть большой интерес. Когда говорят интерес, это так же в большой степени связано с ресурсами для того, чтобы делать эту работу. Через какое-то количество месяцев там появились студенты, там появились гранты, и мы сделали то, что можно увидеть на нашем веб сайте.

Прикладная наука в России

— Кстати говоря, Вам не кажется, что в России существует глобальная проблема с тем, что есть некая наука, а когда её хочется применить или как-то развить, то это всегда встречает большие препятствия? Можно ли с этим как-то побороться?

— Я не могу обобщать, я не знаю, что происходит в других областях. Физтех, конечно, может отслеживать развитие новых технологий и разработок в большом спектре. Физтех организован по принципу объединения преподавания и research (исследования, прим. ред.). Эта система всегда встречается в research universities (исследовательские университеты, прим. ред.), и даже кое-где Физтех был впереди того, что делалось в Англии, в Америке, по своей уникальности. В Америке нет такой централизации, как в России, даже если говорить про самые известные университеты, Гарвард, Стэнфорд и так далее — это 8 университетов, которые традиционно относятся к Ivy League (Университеты Лиги плюща, прим. ред.), и эти 8 университетов находятся не в одном месте, они находятся в разных местах Соединенных Штатов. В России Москва — это то, с чем ничто не может сравниться, Москва — это другой мир, и в Москве центральные научные институты, Физтех, который с ними всеми связан, он так и назывался — Russian MIT (Русский МТИ, Массачусетский Технологический Институт, прим. ред.), и, безусловно, Физтех до сих пор — марка.

В тот момент, когда я учился, это был конец 60-х годов, он [МФТИ] был в расцвете, и, тем не менее, когда я заканчивал аспирантуру в 76-м году, дальше было ощущение, что это какой-то туман, какие-то непонятные перспективы. Это было связано с тем, что в России, в Советском Союзе, отсутствовал вот этот market (рынок, прим. ред.), что называется. Например, в европейских странах, в Штатах, есть, была какая-то прозрачность, был институт постдоков, который отсутствовал практически в России. И везде есть свои экономические механизмы: человек, который приобрел квалификацию, очень ценный для компании, поскольку компания может производить какой-то продукт, innovative (инновационный, прим.ред.) абсолютно, или он очень ценный для университета, поскольку он может приносить гранты, большую прибыль университету: то есть университет получает примерно одну треть от того, сколько получает исследователь от федерального агенства, от foundation (фонда, прим.ред.). Развитие университета — приоритет администрации, и они очень заинтересованы в том, чтобы к ним шли сильные сотрудники, которые делают cutting edge research (прорывные исследования, прим. ред.). И Россия просто не так устроена, а в то время — Советский Союз, то есть эта система, к сожалению, не была эффективной, и её корни находились именно там, в экономике.

— А теперь?

— Я думаю, что сейчас ситуация гораздо лучше, чем она была тогда, и чисто теоретически должны быть компании. В свое время, когда мы начинали кафедру, это было в 12-м году, когда ректор Физтеха попросил меня это сделать, Физтех уже преобразовался в университет, который сравнивает себя с западными ВУЗами. Что касается этого понимания в 12-м году, я полагал, что та же прозрачность может существовать на российском рынке позиций, и что студенты тоже могут подавать после окончания на одно, другое направление дальнейшей деятельности.

— Проект «Сколково» изначально имел целью сделать науку полезной обществу разными способами: учить людей, поощрять высокотехнологичное предпринимательство. Вы наблюдали за развитием этого проекта?

— Я наблюдал судьбу одного проекта, который был в Институте общей генетики. Сергей Киселев был соруководитель проекта, который выиграл грант большой сколковский, и, насколько я знаю, этот проект не осуществился. Я понимаю, что в Сколково есть сейчас более-менее спокойная стационарная ситуация, когда есть профессора, которые работают часть времени в Сколково, часть времени еще где-то, что у них есть ресурсы чтобы поддерживать профессоров и студентов, которые более существенны, чем в других местах. Если говорить про   импакт Сколково вообще, —  то есть можно говорить про их имидж в масс медиа и так далее, — но по сути если разобраться, сколько там человек находится, то импакт реальный гораздо меньше, чем идеальный имидж, который для Сколково создан.

Программа двойных дипломов Физтеха и Джорджия Тех

— Вы много сил вложили в то, чтобы было установлено сотрудничество между МФТИ и Джорджия Тех, но есть только двое студентов, которые учатся по этой программе. Как Вы думаете, с чем связано то, что их так немного?

— Небольшая поправка, не двое, а трое.

— Я знаю, что третий формально только в Джорджия Тех, не по программе двойного диплома.

— Да, я принимаю эту поправку, конечно. У нас есть Настя, Арина и Сергей. Сергей был самым первым выпускником кафедры. Он сначала работал в Германии, в Гедельберге, полгода, там у него не получилось каких-то communication (контактов, взаимодействия, прим. ред.) правильных со своим научным руководителем. Сергей со мной связался, попросил совета, я порекомендовал лабораторию, где он сейчас работает, и туда же пришла Настя через год. А Арина только начала, и она действительно имеет четкий шанс получить и там, и там: на Физтехе Master (степень магистра, прим.ред.), а в Джорджия Техе PhD.

Что я могу сказать по поводу этой совместной программы. Во-первых, слабое место физтеховских студентов в том, что английский находится не на достаточно высоком уровне, поэтому преодолеть барьер и прийти на PhD программу в Джорджия Тех довольно сложно. Это, пожалуй, в значительной степени обстоятельство номер один. С другой стороны, какой-то процент только думают об этом, правильно, они приходят на биоинформатику: не обязательно на биоинформатику в Джорджия Тех, и могут этой биоинформатикой заниматься и в Москве, и в Питере, и в ближайшем или не ближайшем зарубежье.

О жизни на Физтехе и увлечениях

— Вопрос по другой теме. Когда Вы в сентябре разговаривали с нами, студентами четвертого курса, Вы спросили нас, какие мероприятия проходят на Физтехе, рассказали, что Вы и сами организовывали, и так уставали, что даже не могли на все из них прийти. Расскажите, какие мероприятия это были?

— На четвертом курсе была [такая] возможность на факультете — это был факультет управления и прикладной математики, куда я перешел с общей физики: я три года учился в группе низких температур на ФОПФе, и это очень интересная специальность. Тем не менее, когда открылся новый факультет управления и прикладной математики, меня заинтересовали возможности, связанные с тем, что можно управлять процессами, динамическими системами. Это совершенно другое, чем в классической физике, когда нужно просто исследовать, находить какие-то интересные закономерности и законы, но как ими управлять это вопрос, который уходит куда-то в туман. А здесь с самого начала вопрос об управлении. Я могу сказать, забегая вперед, это был 69-й год, и буквально через несколько месяцев высадились на Луне, и критическим элементом полета на Луну было правильное управление. Тогда в управлении с Земли нужно было корректировать траекторию. Измерения, которые получали на Земле, обрабатывали с помощью фильтра Калмана — это один из примеров, когда в управляющем контуре используется информация, где есть модель движения, где есть модель сигнала. Это как раз имеет отношение к hidden markov models (скрытые марковские модели, прим. ред.)  на самом деле: тоже есть скрытые переменные, а в данном случае скрытой переменной является траектория, координата и траектория, а измерения дают эту информацию с каким-то шумом. В тот момент теория фильтрации, это часть теории управления, была очень интересная тема, и динамическое программирование, которое, оказывается, применимо в биоинформатике тоже, скрытые марковские модели, которые применимы в биоинформатике, —  то есть там оказалось, на определенной глубине, много математических конструкций, которые можно использовать при анализе данных в биоинформатике.

Но я ушел в сторону от Вашего вопроса. В общем, я перешел на этот факультет, и там был культмассовый сектор, который я взял на себя. Надо было это где-то делать, и я организовал клуб «Искремас», который существовал довольно долго уже после того, как я закончил. «Искремас» — это другое название фильма «Гори, гори моя звезда», это первоначальное название, «Искусство революции — массам», сокращенное название. В этом фильме играл Табаков, играл Леонов, там был прекрасный художник, мы даже нашли этого художника, ездили с моими друзьями к нему на Мосфильмовскую, с ним встречались как-то вечером, было очень, очень интересно. Я приглашал [на Физтех]: был один артист, который выступал со стихами Цветаевой, Пастернака, Ахматовой, приезжал главный тренер сборной СССР по теннису, показывал спортивные фильмы. Я, кстати, был тренером на физтехе по теннису, до сих пор играю в теннис. И эта организация отнимала у меня время, то есть я практически не пришел на этот поэтический вечер, хотя фильмы я помню, значит, на фильмах я был.

— Вы также говорили, что, приезжая в Москву, ходите в театр.

— Да, в прошлом году я был на трех спектаклях Студии Фоменко, а потом я еще раз был в Москве и был на спектакле «Юбилей Ювелира», в котором играет Табаков. Играл. Кстати, когда я смотрел недавно в связи с тем, что его не стало, про его деятельность в кино, то эта его роль в фильме «Гори, гори моя звезда» стоит выше всех ролей, именно в кино. А сейчас: вчера я был в «Гоголь-Центр», спектакль «Кому на Руси жить хорошо». Я был вместе с моим племянником, очень интересный спектакль, действительно. И сегодня мы с ним пойдем в Большой театр на «Анну Каренину», балет. Я смотрел в Лондоне несколько спектаклей, я был в ноябре в Лондоне, «Phantom of the opera» («Призрак оперы», прим. ред.), например. Я был в Тель-Авиве перед приездом сюда, там интересный очень спектакль, это «Les Miserables», «Отверженные», не менее знаменитый чем «Phantom of the Opera». Спектакль идет на иврите, и это очень сильная постановка, прекрасные декорации, производит очень сильное впечатление.

— А в Америке?

— В Америке есть разные варианты. Например, в Атланте приезжают в большой оперный театр, кроме того там есть возможность в кино посмотреть — они транслируют оперу из «Метрополитен опера», из других театров. Например, недавно смотрели: London National Theatre (Лондонский национальный театр, прим. ред.) поставили «Гамлет» с известным артистом, Cumerbatch (Бенедикт Камбербэтч, британский актер, прим.ред.).

— Вы можете назвать книги: одну, несколько, к которым вы обращаетесь на протяжении всей жизни и почему?

— Я могу сказать, что в принципе моя литература, если спрашивать про всю жизнь, то это естественно литература на русском языке. И просто я люблю стихи очень, поэтому я если к чему-то возвращаюсь, что-то хочу почитать, то это прежде всего Пастернак, Бродский, это поэты, у которых есть стихотворения, не все, но есть стихотворения, которые мне очень нравятся, которые я могу еще раз прочитать просто потому, что это не роман, не повесть — это более или менее короткие, очень красивые вещи, которые приятно вспомнить.

Но есть еще, конечно, писатели, например, Булгаков. Можно открыть «Мастера и Маргариту», почитать — чудесный язык, или Чехов, конечно. Кстати говоря, интересно, что я начальную часть жизни прожил в Батуми, это Georgia (Грузия, прим. ред.). И вот в Батуми есть один дом, на котором есть доска, там написано что «там жили три сестры». Эта доска мне хорошо известна, поскольку в том доме живут мои друзья, и они живут именно там, где жили эти три сестры. А история такова: Чехов имел друга, который жил в Батуми. Батуми был гарнизон тогда, в 1887 году по мирному договору с большим участием Бисмарка Батуми был передан России. И с тех пор российская армия туда пришла, они сделали свой медицинский центр, это я помню прекрасно, потому что мой отец там работал. И недалеко жил доктор (друг Чехова, прим. ред.), который работал там, к нему приезжал Чехов, приезжал Горький, — в общем, они сидели в Батуми в этом доме за этим столом, где, спустя какое-то время, мы сидели со своими друзьями. И этот доктор был женат на женщине, у которой было две сестры. И гарнизонный дом, где офицеры были, был через дорогу, ближе к бульвару. Но я заговорил об этом потому, что, если вы посмотрите письма Чехова, там есть потрясающие короткие строчки, что «если вы не были на Кавказе, заложите ваш дом, экипаж, жен, детей и поезжайте на Кавказ посмотреть, как это прекрасно.» Горы, море, и так далее.

Это Чехов. И много моих любимых поэтов: Пастернак был в Батуми, у него есть прекрасное стихотворение про Кавказ, про Батуми в частности. Сейчас, как это… У Пастернака там такие строчки:

Здесь будет спор живых достоинств,

И их борьба, и их закат,

И то, чем дарит жаркий пояс

И чем умеренный богат.

И в тяжбе борющихся качеств

Займет по первенству куплет

За сверхъестественную зрячесть

Огромный берег Кобулет.

 И так далее. И вот Пастернак был в Батуми, и Бабель был в Батуми, и Мандельштам был в Батуми, то есть люди, которые потрясающе совершенно писали. А родился я в Курске, там дедушка и бабушка жили. Родители жили в Батуми: отец был военный, вместе с ним они переехали туда в 48-м году и жили там всю жизнь. Они были врачи, и моя мама была в Батуми очень известный доктор кардиолог. Я был в Батуми в последний раз в 11-м году.

Если вы нашли ошибку, пожалуйста, выделите фрагмент текста и нажмите Ctrl+Enter.

Поделиться

comments powered by HyperComments