Клетки, ДНК, РНК и белок. Ваш геном составляет примерно 750 мегабайт информации (3 x 10? букв x 1 байт / 4 буквы).

МЕНЮ


Главная страница
Поиск
Регистрация на сайте
Помощь проекту
Архив новостей

ТЕМЫ


Новости ИИРазработка ИИВнедрение ИИРабота разума и сознаниеМодель мозгаРобототехника, БПЛАТрансгуманизмОбработка текстаТеория эволюцииДополненная реальностьЖелезоКиберугрозыНаучный мирИТ индустрияРазработка ПОТеория информацииМатематикаЦифровая экономика

Авторизация



RSS


RSS новости


Ваш геном составляет примерно 750 мегабайт информации (3 x 10? букв x 1 байт / 4 буквы). Это примерно половина размера операционной системы, за исключением того, что она кодирует все человеческое тело, а весь код умещается в объеме, в сто раз меньше крупинки риса. Ваш мозг, который развивается в соответствии с вашим геномом, представляет собой невероятный суперкомпьютер, который также требует меньше энергии, чем тусклая лампочка – буквально в десятки тысяч раз более энергоэффективен, чем искусственные суперкомпьютеры.

Так как же работает геном?

Геномика, транскриптомика и протеомика – это области, основанные на данных, которые призваны ответить на вопрос о том, как геномы кодируют живого, дышащего человека (или кошки, или растения, или бактерии). Этот пост знакомит с геномикой, транскриптомикой и протеомикой ученых-вычислителей и инженеров, которые заинтересованы в работе с «омиксными» данными и хотели бы быстро познакомиться с тем, откуда эти данные и с ключевой биологией, лежащей в основе данных. В этом посте используется минимум жаргона и множество аналогий, чтобы прояснить сходства и различия между этими разными видами «омических» данных и то, как они предоставляют разные окна в одну из самых сложных существующих программ – вашу ДНК.

Омиксными принято называть технологии, основанные на достижениях геномики, транскриптомики, протеомики, метаболомики, то есть наук, которые изучают, как устроен геном и как реализуется закодированная в нем информация. Как она преобразуется в структуру белков и, в дальнейшем, в какие-то признаки организма, которые могут иметь значение для диагностики и лечения заболеваний. Иначе говоря, омиксные технологии являются одним из главных инструментов геномной и постгеномной медицины.

Клетка

Клетка является основным строительным материалом для всех живых существ: людей, собак, мышей, деревьев, цветов, мух и бактерий. Все формы «омиков» измеряют большие количества чего-то, что находится внутри клеток.

Роберт Гук открыл и назвал клетки в 1665 году . Он назвал их клетками, потому что под микроскопом они выглядели как «целлюлоза» или маленькие комнаты – другими словами, «клетки» называются «клетками», потому что под микроскопом они могут выглядеть как тюремные камеры.

Клетки людей, собак, мышей, деревьев, цветов и мух являются «эукариотическими», что означает, что эти клетки упаковывают свою ДНК в пакет (ядро).

Клетки бактерий называют «прокариотическими», потому что они не хранят свою ДНК в пакете (т.е. у них нет ядра):

ДНК и гены

Ваша ДНК – это длинная последовательность из 3 миллиардов букв, которая находится внутри вашего ядра. Каждая клетка вашего тела (за редким исключением) имеет полную копию всего вашего генома (то есть всей вашей ДНК). Поскольку в вашем теле около 37,2 триллиона клеток , это означает, что вы несете около 37,2 триллиона копий всей своей последовательности ДНК! Выводы интересны: это означает, что клетка на кончике вашего пальца содержит все инструкции, необходимые для построения всего вашего мозга.

«Ген» - это особый сегмент ДНК, который кодирует инструкции по созданию белка.

Мы можем думать о теле как о фабрике, для функционирования которой нужны определенные «машины» (белки):

На самом деле только 1% генома состоит из генов. Гены называют «кодирующей» частью генома, поскольку гены «кодируют» белки. В геноме человека около 25 000 генов , что соответствует 25 000 маленьких машин (белков), которые заставляют ваше тело функционировать.

Остальные 99% генома «некодирующие». «Некодирующая» часть генома по-прежнему важна, потому что она сообщает клетке, как использовать «кодирующую» часть.

Другими словами, если «кодирующая» часть служит инструкциями по созданию различных машин, «некодирующая» часть служит инструкциями о том, как использовать эти машины на заводе: когда машины нужно включить, когда машины должны быть выключены, сколько машин необходимо, когда машины должны использоваться и т.д.

Если мы изобразим геном в виде книги, он будет содержать некоторый текст о том, как построить машины (кодирующая часть), и некоторый текст о том, как использовать машины (некодирующая часть).

Нуклеотиды: строительные блоки ДНК (A, T, C, G)

3 миллиарда букв в ДНК происходят из ограниченного алфавита, состоящего всего из 4 возможных букв: A, T, C и G. (Интересный факт: вот почему фильм «Гаттака» о триумфе генетически «неполноценного» человека над своим общество использует в названии только буквы A, T, C и G.)

Вот полная последовательность ДНК человеческого гена S100A10 (также называемого «p11»), одного из самых коротких генов в геноме :

CCGGTTACCTCTGGTTCTGCGCCACGTGCCCCACCGGCAGGACGGCCGGGTTCTTTGATT TGTACACTTTCTAAAACCAAACCCGAGAGGAAGGGCAGGCTCAGGGTGGGATGCCCTAAA TATTCGAGAGCAGGACCGTTTCTACTGAAGAGAAGTTTACAAGAACGCTCTGTCTGGGGC GGGCGAGCGCTCTGCGAGGCGGGTCCGGGAGCGAGGGCAGGGCGTGGGCCGCGCGCCCGG GGTCGGGGGAGTCGGGGGCAGGAAGAGGGGGAGGAGACAGGGCTGGGGGAGCGCCCTGCC GAGCGCCCGCCAGGCTCCTCCCCGTCCCGCACCGCCTCCCTCTACCCACCCGCCGCACGT ACTAAGGAAGGCGCACAGCCCGCCGCGCTCGCCTCTCCGCCCCGCGTCCACGTCGCCCAC GTCGCCCAGCTCGCCCAGCGTCCGCCGCGCCTCGGCCAAGGTGAGCTCCCAGTTCGGCCC

Строительные блоки ДНК (четырехбуквенный алфавит A, T, C и G) называются «нуклеотидами». Их полные названия – гуанин (G), аденин (A), цитозин (С) и тимин (T). Каждый строительный блок нуклеотидов, в свою очередь, состоит из углерода, водорода, кислорода и азота.

Когда мы соединяем вместе нуклеотиды A, T, C и G для образования ДНК, мы получаем нечто, называемое «нуклеиновой кислотой» - отсюда и полное название ДНК, «дезоксирибонуклеиновая кислота». «

Две нити ДНК наматываются друг на друга, образуя двойную спираль. Информация в одной цепочке является «зеркальной копией» информации в другой цепочке. Это связано с тем, как строительные блоки A, T, C и G сочетаются друг с другом. Одна нить ДНК может синтезировать дополнительную, комплементарную себе цепь, присоединяя азотистые основания по строго определенным правилам: Т к А, G к C и наоборот. Следовательно, если одна нить читает «AAATTC», противоположная цепь всегда будет читать «TTTAAG». Информационное содержание одной цепи равно информационному содержанию другой цепи.

Наличие двух копий одной и той же информации может показаться пустой тратой, но на самом деле важна двухцепочечная природа ДНК:

Двуцепочечность облегчает репликацию ДНК (т.е. копирование всего генома, которое должно происходить каждый раз, когда одна клетка делится на две клетки, поскольку каждой «дочерней клетке» требуется полная копия генома);

Двухцепочечность позволяет телу исправлять ошибки в геноме (т.е. если есть ошибка, сделанная в процессе копирования, двухцепочечность позволяет исправить ошибки);

Двойные нити более стабильны, чем одиночные, и очень важно, чтобы план жизни был стабильным.

От опечаток не гарантирован ни один процесс тиражирования информации. Репликация — удвоение ДНК — в этом смысле исключением не является. В процессе тиражирования ДНК — построения комплементарной копии на одной из нитей ДНК — редко, очень редко, но, все же, случаются опечатки. Это может быть и замена одного азотистого основания на другое, и потеря фрагмента, и вставка лишнего куска молекулы, и разворот фрагмента, и перенос его с одной молекулы на другую. Такие события — опечатки в генетических текстах — называются мутациями.

Если эти события приводят к грубым изменениям формы молекулы, они привлекают внимание клеточных «корректоров» ферментов репарации. Эти ферменты поступают просто: они вырезают участок в одной из двух нитей в двойной спирали ДНК, вновь застраивают его согласно информации, записанной на второй, неповрежденной нити ДНК, и сшивают концы встроенного фрагмента со свободными концами корректируемой молекулы.

Постоянная бдительность клеточных корректоров обеспечивает поразительную точность тиражирования ДНК, недостижимую в издательском процессе. Но у них есть один недостаток: они устраняют только те ошибки, которые грубо меняют форму молекулы. Если же ошибка никак не сказывается на этом параметре, она не будет замечена и исправлена ферментами репарации.

Гены, несущие такие, негрубые, с точки зрения клеточных корректоров, ошибки, затем сами будут реплицироваться, их дочерние копии будут еще раз копироваться, размножая ошибку — мутацию — в бесчисленном множестве экземпляров.

В тех клетках, где по законам развития происходит считывание информации с данного гена, измененные последовательности будут транскрибированы в молекулы РНК. Эти РНК будут, конечно, отличаться от тех, что считываются с неизмененного мутацией гена. Соответственно на этой, отличной от нормы, матрице РНК будет затем построена измененная белковая молекула. В ней может быть встроена иная, чем в норме, аминокислота, или потеряна часть аминокислот, или их последовательность будет перевернута. Очень высока вероятность того, что такая структурно измененная белковая молекула изменит и свою функцию. Это может привести к тому, что окажется измененным и признак, в формировании которого участвует молекула.

Вот так по цепочке распространяется эффект изменений в молекуле ДНК: от гена к признаку. Молекулярное изменение гена превращается в изменение организма, созданного по ошибочному рецепту. Последствия зависят от того, насколько серьезной была ошибка.

Если вы, готовя торт, вместо вишневого варенья добавите клубничное, это будет уже другой торт, либо более, либо менее вкусный, чем тот, что пекся по стандартному рецепту. Но если вы вместо вишневого варенья положите горчицу, боюсь, что он будет совсем несъедобным и вам придется его выбросить. Так и с мутациями. Может возникнуть организм, отличающийся от исходного в лучшую или худшую сторону, но может возникнуть и совершенно нежизнеспособное создание.

Геномика

Геномика – это изучение последовательностей ДНК человека, животных, бактерий и т. Д. Часто геномы сравнивают друг с другом, чтобы узнать о здоровье и болезнях.

Например:

Геномы здоровых и больных людей можно сравнить, чтобы узнать о генах, которые влияют на риск заболевания или непосредственно вызывают заболевание.

Геномы многих людей можно сравнить, чтобы узнать о естественных вариациях генома, не связанных с заболеванием – например, о генах, влияющих на цвет волос, цвет глаз, рост и другие характеристики.

Геномы людей и животных можно сравнить, чтобы восстановить древо жизни и понять историю эволюции.

Любой случайно выбранный мужчина на планете на 99,9% генетически идентичен любой случайно выбранной женщине на планете.

Например, Джордж Такей и Опра Уинфри генетически идентичны на 99,9%.

Шимпанзе и человек в целом генетически идентичны на 96% (и на 98% идентичны в кодирующих областях).

Два гоминина.

Собаки и волки идентичны на 99,9% и на самом деле настолько генетически похожи, что технически являются одним и тем же видом.

Таким образом, большая часть геномики направлена на выявление крошечных частей генома, которые приводят к различиям (собаки являются особенно интересным видом для изучения, поскольку они сильно различаются по размеру, цвету, поведению, продолжительности жизни и риску заболеваний). Геномика может быть «поиском иголки в стоге сена», особенно при сравнении различных человеческих геномов друг с другом, чтобы понять риски болезней, поскольку любая данная пара людей в основном идентична.

Виды геномных данных

Гипотетически последовательность ДНК одного человека может храниться примерно в 750 мегабайтах. Однако на самом деле процесс секвенирования ДНК не идеален, и вместо получения одного точного считывания всего генома от начала до конца он производит множество частичных считываний, которые должны быть собраны вместе, как головоломка. Например, предположим, что вам были даны следующие фрагменты предложения:

«Птица прилетает»

«Летает в небе»

«В небе и поет»

Поскольку ДНК секвенирована таким образом, необработанная последовательность ДНК сразу после секвенирования составляет около 200 гигабайт и должна быть «очищена» перед анализом.

До сих пор мы говорили только о получении полной последовательности генома, что называется «секвенированием всего генома». Также возможно проводить геномные исследования с другими видами геномных измерений:

Секвенирование всего экзома («WES») : в этом методе секвенируются только кодирующие части генома (части, которые кодируют белки).

Генотипирование SNP : в этом методе измеряются только отдельные буквы в местах, которые считаются важными. «SNP» - это «однонуклеотидный полиморфизм»: одиночный, потому что это только одно место (например, «положение 4576877»), нуклеотид, потому что строительными блоками ДНК являются нуклеотиды, и в этом месте есть один нуклеотид (A, T, C, или G), и полиморфизм, потому что это особые рассматриваемые места, которые, как известно, варьируются в популяции (т.е. они «полиморфны»). Наличие определенных нуклеотидов в SNP, а не других, может привести к драматическим последствиям. Например, серповидно-клеточная анемия может быть вызвана изменением одного нуклеотида.

Как и ДНК, РНК представляет собой нуклеиновую кислоту, в частности рибонуклеиновую кислоту.

Сравнение ДНК и РНК:

ДНК состоит из A, T, C и G. РНК состоит из A, U, C и G. Таким образом, РНК содержит U (урацил) вместо T (тимин).

ДНК двухцепочечная. РНК одноцепочечная.

ДНК предназначена для стабильного и длительного хранения всей информации, необходимой для создания живого существа. РНК используется в качестве временной матрицы, помогающей в процессе производства белков. Вот такой длиной обладает РНК:

AAUCAAAGAACCCGGCCGUCCUGCCGGUGGGGCACGUGGCGCAGAACCAGAGGUAACCGGUUUAGGGCAUCCCACCCUGAGCCUGCCCUUCCUCUCGGGUUUGGUUUUAGAAAGUGUACAGCCCCAGACAGAGCGUUCUUGUAAACUUCUCUUCAGUAGAAACGGUCCUGCUCUCGAAUACCGGGCGCGCGGCCCACGCCCUGCCCUCGCUCCCGGACCCGCCUCGCAGAGCGCUCGCCCGGCAGGGCGCUCCCCCAGCCCUGUCUCCUCCCCCUCUUCCUGCCCCCGACUCCCCCGACCACGUGCGGCGGGUGGGUAGAGGGAGGCGGUGCGGGACGGGGAGGAGCCUGGCGGGCGCUCGUGGGCGACGUGGACGCGGGGCGGAGAGGCGAGCGCGGCGGGCUGUGCGCCUUCCUUAGUGGGCCGAACUGGGAGCUCACCUUGGCCGAGGCGCGGCGGACGCUGGGCGAGCUGGGCGAC

РНК используется в качестве шаблона для построения белков. Во-первых, часть РНК строится на основе гена в ДНК. Процесс создания РНК из ДНК называется «транскрипцией», потому что РНК «транскрибируется» из ДНК, используя правила спаривания, обсужденные ранее:

РНК C пары с ДНК G

РНК G пары с ДНК C

РНК U пары с ДНК A

РНК А пары с ДНК Т

Транскриптомика

«Транскриптомика» - это изучение последовательностей РНК. Транскриптомика интересна тем, что говорит нам, какие гены «включены» в разных частях тела.

Вернемся к аналогии последовательности ДНК как инструкции по эксплуатации:

Теперь предположим, что мы должны делать фотокопию страницы с информацией о «Машине» каждый раз, когда мы хотим добавить новую Машину в комнату нашей фабрики – возможно, мы передаем фотокопию страницы инструкций для Машины какому-нибудь работнику, который собирается построить Машину. Если мы сделаем ксерокопию страницы для «Машины» в общей сложности 25 раз, то кто-то, кто пробирается в помещение завода и подсчитывает общее количество фотокопий для страницы Машины, может сделать вывод, что в этом конкретном помещении фабрики нам нужно 25 машин.

Таким образом, подсчитав количество фотокопий (транскриптов РНК) в определенной комнате фабрики (часть тела), мы можем сделать вывод, какие машины (белки) используются больше всего в этой части фабрики.

Тело состоит из тканей, например, мышцы – это разновидность ткани, а нервные клетки – это другой вид ткани.

«Экспрессия» - это просто другое слово для создания части РНК из ДНК. Мы говорим, что ген «экспрессируется», когда этот ген используется для создания матриц РНК. Фраза «измерение экспрессии гена» относится к определению степени, в которой РНК образована из конкретных представляющих интерес генов. Другими словами, «измерение экспрессии гена» то же самое, что «измерение транскриптома».

Белки и аминокислоты

До сих пор мы обсуждали, как ДНК превращается в РНК. Теперь мы обсудим, для чего используется РНК: она служит шаблоном для создания белков.

Белки – это маленькие механизмы, которые выполняют разные функции в организме.

ПРОДОЛЖЕНИЕ В КОММЕНТАРИЯХ


Источник: vk.com

Комментарии: