Биолог Евгений Кунин и его «Логика случая»: что общего у генома с куполом Пантеона, зачем биологам книги по космологии и как случайно подсмотреть ножницы для ДНК у бактерий, которым нездоровится
COLTA.RU совместно с «Книжными проектами Дмитрия Зимина» запускает новый большой проект. Встречаемся с нобелевскими лауреатами — настоящими и будущими. Разговариваем, слушаем, пытаемся разобраться в том, как все устроено с точки зрения современной большой науки.
Наш первый собеседник — один из самых известных в мире специалистов в области компьютерной и эволюционной биологии Евгений Кунин. Итак, рубрика «Большая наука»: мы начинаем.
Старательные популяризаторы любят непременно сообщить про ДНК, что это «цепочка букв». Часто для наглядности кусок цепочки — например, TAAGTTATTATTTAGTTAATACTTTTAA... — приводят рядом и поясняют: вроде абракадабра, но в ней (вы не поверите, подчеркивают старательные популяризаторы) зашифрованы человеческие качества нас с вами.
Геном человека расшифровали — в том смысле, что смогли записать его в виде такой цепочки длиной в три миллиарда знаков — в 2003 году, а черновую версию опубликовали в журнале Nature в 2001-м. Среди авторов этой работы — Евгений Кунин, американский исследователь, эмигрировавший из СССР еще в 1991-м. Сидя у себя в кабинете в городе Бетесда, штат Мэриленд, он между делом показывает пальцем на изображение двойной спирали ДНК под стеклом, составленное из портретов ученых: «Вот у меня есть грамота, которую выдали всем, кто участвовал». Это исследование потом процитируют в других научных работах как минимум 19 836 раз (статистику собирает Google Scholar), а всего на работы Кунина сослались в общей сложности 134 000 раз, и цифры растут дальше. Он — самый цитируемый из биологов, когда-либо работавших в России.
Кунину 60 лет, его только что избрали в Национальную академию наук США, но он меньше всего похож на академика, какими мы привыкли их себе представлять по фото с ежегодных сессий РАН. На официальном групповом снимке он позирует в джинсах и футболке с надписью «Рио» и ходит прыгающей походкой подростка.
Где другие видят буквы, Кунин видит кое-что посложнее. В его описании устройства ДНК встречаются «темная материя» (термин из космологии) и «подпорки-пандативы» (термин из теории крестово-купольной архитектуры), «гипотеза Красной Королевы» и «бюрократический потолок сложности». Это все можно было бы принять за лирику и попытку изъясняться повозвышеннее, если бы за каждым таким словосочетанием не стоял в каждом случае тот или иной строгий абстрактный принцип, для которого пока просто не успели придумать более приземленные метафоры.
Профессиональный интерес к буквам предполагает, что для всякого текста полезно выяснить историю его появления на свет, и ДНК не исключение. Ее история — это четыре миллиарда лет эволюции всего живого, когда фрагменты генетического текста перетасовывались, дублировались, портились при копировании, заимствовались людьми у вирусов и вирусами у бактерий, исчезали и появлялись: собственно, это эволюция и есть. Всю свою работу как биолога Кунин сводит к ответу на вопрос, что ею движет. «Разобраться в эволюции. Для меня других задач, в общем, нет», — говорит он без всякого пафоса.
Кунин руководит большой исследовательской группой в Национальных институтах здоровья США. Это государственное ведомство, которое тратит на медицинские и биологические исследования 30 миллиардов долларов в год (то есть около 180 годовых бюджетов МГУ), со штаб-квартирой в 20 минутах от центра Вашингтона: за это время вы как раз успеваете выехать на метро из города и оказаться в соседнем штате Мэриленд. Здесь есть Национальный институт старения и Национальный институт рака, Национальный институт наркологии и Национальный институт биомедицинских изображений и биоинженерии. Чтобы составить представление о масштабах: у Национальных институтов здоровья имеется своя отдельная радиостанция, которая рассказывает исключительно о транспортных проблемах на территории кампуса и на подъездах к нему.
Зачем эволюция медицинскому центру? Самый общий ответ на этот вопрос — любимая Куниным цитата из Теодосия Добжанского, классика генетики: «Ничто в биологии не имеет смысла, кроме как в свете эволюции». Любое знание, которое хотя бы косвенно использует представления о ДНК и мутациях, — то есть вообще все современное медицинское знание — опирается на теорию эволюции как на обязательный фундамент. Еще проще сказать, что и устойчивость бактерий к антибиотикам, и мутации, приводящие к раку, — непосредственные иллюстрации к тому, как эволюция работает.
Но это все старые и давно известные факты. Нет ли чего поновее? В 2015 году журнал Science назвал прорывом года систему CRISPR-Cas9, которую называют «молекулярными ножницами» для ДНК. Она позволяет точечно вырезать из генома дефектный кусок и так же точечно вставить новый фрагмент. «В ближайшее время — в течение не десятилетий, а именно считанных лет — это придет в больницы. Для начала будут лечить от болезней, которые связаны с мутациями в одном гене», — объясняет Кунин. Его называют одним из отцов метода, хотя сам он ни к какому медицинскому применению своего открытия не стремился: «Это, так сказать, побочный продукт. Конечно же, его никто не будет выбрасывать».
В 2006 году Кунин пытался разобраться, откуда в ДНК бактерий регулярно повторяющиеся группы букв — и почему участки ДНК между повторами напоминают ДНК вирусов, способных их заразить (бактерии, как и люди, болеют вирусными инфекциями). Решение, которое пришло ему в голову, было таким: эти куски ДНК — трофеи, помогающие опознать и уничтожить врага. Бактерия узнает вирус по запасенному заранее фрагменту его генома — и режет его ДНК на части ровно в том месте, где фрагмент обнаружился. Так у одноклеточных, которые не имеют наших средств борьбы с инфекцией — ни лимфоцитов, ни макрофагов, — был найден ни на что не похожий иммунитет, эволюционное приспособление для борьбы с инфекцией. Некоторое время спустя, в 2012-м, эту систему бактериальной самообороны приспособили для разрезания какой угодно ДНК, включая человеческую. И тогда ею занялись уже медики.
С помощью каких инструментов делают такие открытия? На просьбу устроить экскурсию по своей лаборатории Кунин неожиданно отвечает, что это будет зря потраченное время: «Вы же в своей жизни уже видели компьютеры, верно?» По аналогии с теоретической физикой, которая во времена атомной бомбы внезапно оказалась важнее экспериментальной, область науки Кунина называют теоретической биологией, но сам он предпочитает употреблять слово computational — «вычислительная».
«Очень большая часть биологии теперь computational, потому что у нас есть огромное количество всяких данных по сиквенсу генома, по экспрессии генов, по протеомике, по мутациям. Их можно анализировать при помощи алгоритмов и компьютерных программ, что мы и делаем. И именно эти данные являются материалом проверки всяких теоретических моделей». Сиквенс — это последовательность тех самых букв ДНК, экспрессия — то, как ДНК превращается в белок, а протеомика имеет дело с разнообразием самих белков. Одна-единственная клетка, таким образом, производит на свет как минимум четыре комплекта данных объемом в гигабайты.
Хотя Кунин окончил биофак МГУ и защитил кандидатскую по вирусологии, его научные статьи местами напоминают докторскую математика — там то и дело встречаются «скрытые марковские модели», «бутстреп» и «кластеризация». Или работу структурного лингвиста: те же «скрытые марковские модели» активнее всего используются при моделировании естественного языка. Анализ ДНК оказывается похож на анализ текста не только тем, что там и там — буквы.
Когда в 2011 году вышла на английском 500-страничная «Логика случая» Кунина, биологи в России не стали дожидаться, чтобы какое-нибудь издательство собралось напечатать ее в России. Волонтеры — их набралось около двух десятков — в «Живом журнале» договорились поделить главы между собой и сели за перевод. Кунину, для которого все это стало неожиданностью, оставалось убедиться, что его идеи переданы аккуратно. Через три года перевод вышел на бумаге гигантским для научного труда тиражом в 2500 экземпляров — столько читателей биофак МГУ не выпускает, наверное, и за десять лет. Сам автор отказывается считать свою работу научно-популярным текстом, адресованным людям, которым оригинальные научные статьи не по силам: «“Логика случая” — не вполне научпоп. Это в общем-то книга для тех, кто статьи в Nature читает, а часто и пишет. Но только по своей тематике».
Кроме продвинутых читателей сегодня у книги предполагались еще адресаты — которые, правда, прочитать ее не имеют возможности: те, кто 160 лет назад, после выхода «Происхождения видов» Дарвина, выдвинул самые дельные претензии к его теории. Дарвин в 1859 году ничего не знал про гены и мутации, шестеренки тех самых процессов изменчивости и отбора, которые он описал. Поэтому как минимум интересно возразить его критикам с высоты сегодняшнего знания. С другой стороны, про какие-нибудь вирусы он ничего не знал тоже, поэтому вопрос, как они могли появиться параллельно клеточной жизни, не заставлял его спать беспокойным сном. А современных биологов заставляет.
И вообще проблема происхождения жизни превращается в парадокс, только если вы кое-что знаете про биомолекулы. Ответить на вопрос «что было раньше — курица или яйцо?» позволяет владение теорией эволюции в объеме седьмого класса: раньше был динозавр. Но этот вопрос вас догоняет в новом качестве, когда дело доходит до более фундаментальных вещей. Дарвину было достаточно написать про «маленький теплый пруд», где из молекул попроще в химических реакциях получались молекулы посложнее и в конце концов получилось нечто живое. Мы теперь знаем: основа жизни — молекулы, умеющие копировать сами себя, они же репликаторы. Молекулам ДНК для этого нужен как минимум белок, из которого сделаны копировальные машины клетки. А белкам, чтобы появиться на свет, — ДНК и РНК. Что из них было раньше — копировальная машина или то, что копируют? Как вообще так получилось, что перед первым актом копирования в каком-нибудь «теплом пруду» встретились молекулы, непохожие химически, но при этом идеально подогнанные друг к другу?
До сих пор занятие этой проблемой могло проходить по разряду праздного любопытства, но тут астрономы начали сотнями открывать планеты в обитаемой зоне других звезд. Последняя такая новость — про целых семь потенциальных копий Земли в 40 световых годах от нас.
Есть ли там жизнь? Кунин сомневается: «С моей точки зрения — а эта точка зрения довольно непопулярная — ее там нет. На Земле она возникла, и, конечно, в бесконечной Вселенной она возникла бесконечное количество раз. Но разумно ожидать, что наши соседи от нас крайне далеко. Ни в каком смысле не в 40 световых годах». Почему так? Потому что для этого требуется слишком удачное стечение удачных обстоятельств. «Трудно придумать существенно другую химию. Мы знаем весьма хорошо распределение элементов во Вселенной, по крайней мере, в нашей части Вселенной. Мы знаем, чего от этого можно ждать, а чего нельзя. Неуглеродную жизнь с точки зрения химии представить себе исключительно трудно. Органическая химия — она, в общем, едина, что бы мы там ни искали. Конкретные аминокислоты, нуклеотиды и прочие вещи могут быть другими. Но, в общем, свобода не очень велика».
Как узнать пределы свободы, которую дает эволюция? Присматриваться к микробам. Дарвин строил свои выводы на наблюдениях за вьюрками и олушами Галапагосских островов, но для Кунина эти животные (а тем более случай человека и обезьяны) — слишком сложные и слишком неинтересные по сравнению с одноклеточными. У этих последних бешеная скорость смены поколений и невероятное давление отбора. Еще они могут позволить себе, например, запросто красть у других видов ДНК и встраивать в свою (это называется «горизонтальный перенос генов») — умение, которого многоклеточные вроде нас лишились. Чтобы выжить, микробам приходится экономить, в первую очередь, на ДНК и делать ее намного более эффективной, чем наша. Вместо того чтобы доводить до совершенства внутриклеточную химию, сложные организмы пошли по пути наименьшего сопротивления: не хватает функций — надо добавить еще клеток и дописать код. Предел такой неэкономной конструкции ДНК кладут только расходы по управлению ею. Генно-регуляторные сети начинают вести себя как раздутый административный аппарат и тратят все ресурсы системы на себя — это и есть упомянутый раньше «бюрократический потолок сложности».
«Бюрократический потолок» — пример того, как другие плоскости человеческого опыта подсказывают идеи для описания эволюции. Другой важный источник таких идей для Кунина — космология и статистическая физика. Та и другая тоже по-своему описывают рождение сложности из хаоса: здесь бесформенный пар превращается в правильные шестиконечные снежинки, там наполненный горячей плазмой после Большого взрыва космос порождает разбросанные по пространству спиральные галактики.
Эти аналогии лежат на поверхности, но Кунин идет дальше и рассуждает про эволюционные процессы в терминах температуры, энтропии и фазовых переходов. Например, уравнения статфизики начинают приобретать биологический смысл, если за так называемую свободную энергию принимать приспособленность вида, а за температуру — размер популяции. В этом смысле эволюция микробов — «горячий» процесс, а эволюция людей или слонов — «холодный»: по сравнению с кишечными палочками нас в популяции слишком мало, чтобы отбор отсеивал из ДНК все неэффективное. По сравнению с геномом вируса, утверждает Кунин, наш, человеческий, геном в итоге просто «плохо спроектирован». Или, как резюмировал его рассуждения один из переводчиков книги Георгий Любарский, «сложность — это болезнь генома, не вылеченная слишком слабым давлением отбора».