Обзор инструментов сворачивания РНК и интуитивно понятный способ объяснения концепции минимальной свободной энергии.

Введение и репликация RNA Energy Dot Plot для программного обеспечения для складывания

Последовательности РНК складываются во вторичные и третичные конформации. Эти складки обусловлены родством пар нуклеотидных оснований — G похож на C, A похож на U.

Вы можете знать о них из ДНК как о парах оснований Уотсона Крика.

Каждый нуклеотид связывается с одним партнером за раз, причем длинные участки, где у них есть партнер по связыванию, более благоприятны, чем более короткие и более близкие партнеры по связыванию с точки зрения последовательности. Часто вы можете видеть, что кодирующие последовательности молекулы мРНК загибаются только на своих хвостах, в то время как открытая рамка имеет структуру стержня.

Тем не менее, некоторые складки все же встречаются. Фактически, когда комплементарность пар оснований отсутствует, мы получаем эти петли и шпильки поперек удлиненной структуры. Это, в конечном счете, создает эти вторичные структуры, которые играют ключевую роль в функционировании молекулы РНК [аналогично свойствам белка].

Чаще всего вторичные структуры очень консервативны на протяжении всей функции или быстро изменяются при данных обстоятельствах, которые влияют на водородные связи между парами оснований.

Например, рибопереключатели имеют регуляторные открытые элементы, которые в присутствии других органических молекул разрывают связи и, таким образом, заставляют молекулу РНК изменять структуру [цель этой статьи — дать вам лучшее интуитивное понимание этого процесса].

Эти рибопереключатели находятся на конце традиционной молекулы мРНК и играют важную роль в регуляции экспрессии белка в рибосомных субъединицах. Для молекул мРНК это свертывание можно экстраполировать при наличии некоторого понимания биологии и доступа к вычислительной мощности.

Это первая часть серии из двух частей, в которой объясняется смысл моего текущего проекта оптимизатора фолдинга мРНК и его потенциал для расширения нашего иммунного репертуара.

Краткое введение в кинематику складывания

Мы можем думать об избирательном сворачивании РНК как о среде, в которой эволюция благоприятствует доминирующим признакам. Не очень похожим, но очень тонким образом наше тело синтезировало пары оснований таким образом, что оно создает конкуренцию между парами оснований для складывания на основе множества факторов.

Прежде всего, мы подумали о доступной энергии и о том, как мы можем создать наиболее эффективные молекулы, но они должны быть сбалансированы с функциональностью [т.е. скорость трансляции информационного обмена], рН, температура и его способность взаимодействовать с остальной частью тела [должна разлагаться посредством ферментативных реакций рибонуклеазы]. В некоторых случаях структура может быть оптимизирована для укладки, например, некоторые кодоны выравниваются с другими кодонами и обычно образуют комплементарные штаммы, которые представляют собой просто длинные двухцепочечные складки РНК [дуплексная РНК].

Доступная химическая энергия и потенциал являются основным фактором, влияющим на конформацию молекул мРНК. Мы называем конформацию с наименьшей энергией конформацией с минимальной свободной энергией.

Мы можем пойти дальше и описать расположение молекул РНК как вероятностное по отношению к множеству факторов и то, как эта вероятностная модель помогает объяснить способность отдельной молекулы переходить между различными оптимальными структурами.

К настоящему моменту вы, как и я, уже поняли значение этого свойства для гипотезы мира РНК и даже ту роль, которую он играет как разнообразная, надежная биологическая машина.

Прежде чем мы перейдем к тому, как устроены эти вероятностные модели, лучше ознакомиться с упрощенной записью вторичной структуры РНК. В биоинформатике большинство конформаций записывается в формате Energy Dot-Plot Format.

Точечный график на самом деле просто способ выяснить, какие пары оснований с какими. Диагональ действует как наша ось/текущая базовая пара. Мы читаем точечный график, проходя по диагонали и проверяя, есть ли в его координате x образование пары оснований.

Они обозначены цветными энергетическими состояниями, а разные цветные энергетические состояния указывают на разные конформации сворачивания. Если энергетическое состояние находится на пересечении горизонтального положения пары оснований, координата y энергетического состояния выравнивается с другим нуклеотидом на диагонали. Следовательно, относительные положения каждого энергетического состояния соответствуют спариванию оснований этой структуры.

В результате можно увидеть некоторые закономерности. Во-первых, стержневые структуры имеют прямые диагонали, а все промежутки представляют собой некоторую форму петли. По мере прохождения этого раздела вы заметите, что внутренние петли, например, будут иметь только одно отсутствующее энергетическое состояние между структурой стебля.

Петли в конечном итоге означают, что пары оснований в координате x не имеют партнеров по связыванию, поэтому они разветвляются и становятся независимыми [часто дает петлю]. Если вы заметили, разнесенные стебли считаются ветвями.

Типы вторичных структур и вложений

Прежде чем мы перейдем к вторичным субструктурам, обычно встречающимся в молекулах РНК, важно понять обозначения, которые мы можем использовать, чтобы лучше вписать эти структуры в данный контекст.

A-A-A-A-A-C-C-C-C-U-U-U-U-U
0-1-2-3-4-5-6-7-8-9-10-11-12-13
i <           k            > j

Мы можем предоставить индексы для каждого основания в последовательности и обозначить 5’ как i, а 3’ как j. Большинство алгоритмов, которые мы скоро рассмотрим, обычно находят подструктуры, начиная с середины с 2 индексами и продвигая каждый индекс наружу [начинать с центра диагонали на точечной диаграмме].

Обратите внимание, что j и i начинаются с разных значений, и мы начинаем с (4,6), а не (0,9). k представляет, происходит ли спаривание в заданном диапазоне после каждой итерации, но знайте, что это обозначение будет широко использоваться повсюду.

1. Стебель

Более одной пары оснований появляется в виде группы смежных пар оснований. Этот результирующий структурный мотив описывается как стебель.

Хороший пример формата структуры приведен на рисунке ниже.

На вторичном уровне мотив стебля выглядит плоским, но всегда может извиваться и поворачиваться на третичном уровне.

##A stem structure is determined by the base pair between i, j and those below/above it. 
GGCAUGCU
i      j
...
A-U   -> a stem is determined by whether 2 consecutive base
C-G      pairs are formed 
G-C   i+1 = G, j-1=C
G-U   i = G, j = U
...
In a similar fashion, the energy required for a conserved stem motif is calculated by the current and previous base pairs to 1) validate that it really is a stem structure & 2) include the biological significance of stems being more conserved assuming that nearby structures are less random/more stable
eS(i,j) = turner_energy((bp[i], bp[j]),(bp[i-1], bp[j-1]))

2. Шпилька

Две комплементарные последовательности [стебли] соединены непарными основаниями, имеющими форму петли [без связей].

Каждая шпилька в конечном итоге действует как маленькая петля на конце данного стебля и закрывает его, поэтому направление 5’ → 3’ по-прежнему сохраняется положением стебля.

В точках i, j [A-U] прямо перед шпилькой петля начинает формироваться из пар оснований, которые не могут соединиться вместе. Более аккуратная визуализация также обеспечивается в виде нотации с точками и квадратными скобками.

Здесь вы можете связать это обратно с диаграммой i → k ← j предыдущего типа и точечной диаграммой энергии, где каждый раз, когда выбирается энергетическое состояние, создается своего рода треугольный мост, который показывает спаривание двух оснований. Аналогичным образом нотация с точками-скобками упрощает эту идею, когда пары оснований, положение которых [i+n] совпадает с заданным «(», пары с основанием в положении [j-n], которое совпадает с «)», и «.» представляет пару оснований k, которая остается неспаренной.

Вот почему в первую очередь образуются петли, поскольку каждое основание соединяется с другим основанием в противоположной/отражающей позиции в последовательности. Идея симметрии может помочь здесь с интуицией.

Возвращаясь к нашему первоначальному примеру «AAAAACCCCUUUUU», обозначение этой последовательности в квадратных скобках указывает на то, что CCCC не будет связываться из-за отсутствия комплементарности.

##Because of lack of base pairing between C-C, no bonds are formed but loop structure is still conserved.  
GGCAUGCU
i      j
...
C≠C  ->  Since they can't pair, they align side by side and
C≠C      form loop as 5'...C-C-C-C...3'
...

3. Внутренний

Внутренняя петля представляет собой произведение непарных оснований на 2 антипараллельных нитях в структуре стебля. Между этими двумя стеблями с непарными основаниями между ними они образуют утолщения с обеих сторон.

Мы имеем в виду внутреннюю петлю для симметричных разрывных петель между стержнем, где количество оснований на каждой стороне/стороне стержня одинаково. Выпуклость тогда действительно просто непарная

n1, n2 represent both sides of the loop at 5' and 3'. The idea of a bulge and internal creates 3 secondary substructure possibilities: 
Possibility 1: 
     G-C
n_1a - - n2_a ]- 2 unpaired bases on both sides of the stem
n_1b - - n2_b    ∴ n1 == n2
     U-A
Possibility 2:
     G-C
n_1  - - ]- extra base pair on n1 side creates right-bulge
     G-C    ∴ n1>0,n=0 only unpaired on 5' strand [i=i'+1]
     G-U         
     U-A
Possibility 3:
     G-C
     - -  n2 ] - extra base pair on n2 side creates left-bulge
     G-C       ∴ n1=0,n2>0 only unpaired on 3' strand [j=j'+1]
     G-U         
     U-A

4. Многоветвевые петли

Эта вторичная структура действительно считается своего рода обобщением более сложных петель в молекуле мРНК. Как правило, они выглядят как соединения, ветви которых имеют предшествующие подструктуры.

Каждая многоразветвленная петля состоит из нескольких структур типа «стебель-петля», и поэтому, хотя большинство других петель легко обнаружить, просто пройдя по последовательности РНК с обоих концов, а затем внутрь, многопетли становятся немного более сложными.

range of base-pairs in a multi-branched loop consist of pairs
(i1,j1), (i2,j2), (ik, jk) with k base-pairs. 
If 3 or more stems branch off of a substructure, we can consider the unpaired region to be a multi-branched loop where pairs (ia,ja), (ib,jb), (ic,jc)

Мы вернемся к тому, почему это так, но знайте, что фактически у нас есть только два алгоритма сворачивания РНК: алгоритмы Нуссинова и Цукера. Оба они имеют небольшие различия, которые помогут Цукеру объяснить более реалистичные складки по сравнению с Нусиновым.

Условные обозначения стабильности, основанные на минимуме свободной энергии

Чтобы найти свободную энергию вторичной субструктуры, мы можем разложить каждую отдельную петлю, чтобы оценить устойчивость с точки зрения энергии. Мы делаем это для каждой пары оснований в подструктуре, закрывающей петлю, а затем используем другой набор правил для оценки стабильности петли.

Такие инструменты, как ViennaRNA, могут легко определять энергетические состояния, суммируя все полные энергетические состояния для всех видов петель и структур [мы скоро перейдем к этому].

Возвращаясь к нашей исходной модели, стабильность транскрипта мРНК определяется наличием последовательностей в мРНК, известных как цис-элементы. Однако это всего лишь означает, что молекулу труднее денатурировать, и поэтому она может выжить и функционировать в условиях высокой летучести.

Мы можем использовать определенные параметры, которые позволяют суммировать относительную стабильность каждой пары ближайших соседей в данном дуплексе.

Это все термодинамические параметры, по которым вы можете посмотреть на все возможные пары 2-нуклеотидов и пронаблюдать их относительную стабильность. Для стеблей их энергия определяется укладкой соседних пар оснований.

Большинство вычислительных алгоритмов, используемых для вычисления минимума свободной энергии, рассчитывают значение (q) с точки зрения больцмановского веса ​​свободной энергии.

такой, что свободная энергия (E) выражена в терминах β

Газовая постояннаяR и температура T – это меры, которые используются с весом Больцмана (β) для связи средней относительной кинетической энергии частиц в газе с термодинамической температурой газа, оценивающих факторы трансляции для мРНК.

Если мы сможем минимизировать эту функцию для свободной энергии заданной последовательности s для всех складчатых конформаций P , мы сможем найти оптимальную вторичную структуру для максимальной стабильности.

Стабильность также можно использовать для понимания взаимодействий РНК и белка в отношении того, как рибосома считывает молекулу мРНК, эффективна ли конформация свободной энергии для максимальной трансляции, а также других факторов взаимодействия с ферментами и т. Д.

Биологическое преимущество свободной энергии заключается в возможности обнаружения молекулы мРНК. В этом заключается различие между родственными (общая структура/сродство) и неродственными молекулами мРНК. Если молекула мРНК не родственная, низкое сродство между рибосомой и молекула вносит больше ошибок в распознавание и, следовательно, в точность и эффективность этапа трансляции.

Let 'c' be cognate frequency, 'nc' be non cognate frequency
∆∆𝐺𝑏𝑖𝑛𝑑 = ∆𝐺𝑏𝑖𝑛𝑑𝑐-∆𝐺𝑏𝑖𝑛𝑑𝑛𝑐 which is related to the populations or dissociation constants: 
∆∆𝐺𝑏𝑖𝑛𝑑 = −𝑅𝑇 ln(𝑃𝑐/𝑃𝑛𝑐) = −𝑅𝑇𝑙𝑛(𝐾𝑑𝑛𝑐/𝐾𝑑𝑐)
We define excess free energy difference between two states as ∆𝐺 = −𝛽^−1𝑙𝑛 (𝑍𝐵/𝑍𝐴) = −𝛽^−1𝑙𝑛〈exp(−𝛽∆𝑈)〉A

Чтобы упростить эти определения, мы можем изучить законы термодинамики как TLDR.

В конечном счете, вопрос, на который мы пытаемся ответить, заключается в том, почему энергия течет в определенных направлениях определенным образом? Что ж, мы описываем это в форме свободной энергии Гиббса, определения системы, находящейся под постоянным давлением.

Формула для свободной энергии Гиббса: G = H − TS, где H – мера энтальпии [потенциала для выполнения работы], T – абсолютная температура, а S – энтропия.

Изменение энтальпии также определяется как изменение теплоты. Если реакция получает увеличение кинетической энергии в реакции A + B = C, изменение энтальпии для C должно иметь большую энергию.

Свободная энергия Гиббса = изменение энтальпии реакции — (температура * изменение энтропии)

  • Изменение энтальпии = теплота реакции
  • Когда ваши реагенты имеют больше энергии, чем продукты, энтальпия отрицательна, что указывает на спонтанную реакцию, и наоборот [уменьшение энтальпии является экзотермической реакцией]
  • Изменение энтропии = теплопередача талому льду * температура
  • увеличение энтропии окружающей среды является экзотермической реакцией
  • Обратитесь к индексу для расчетов наблюдаемой свободной энергии по отношению к отдельным типам вторичных структур.

ViennaRNA, очень популярное программное обеспечение для сворачивания РНК, использует свободную энергию Гиббса в связи с методом ближайшего соседа. Здесь мы рассматриваем свободную энергию Гиббса (G) как всю доступную энергию. Цель состоит в том, чтобы найти структуру мРНК, энергетические потребности водородных связей которой ниже или равны минимальной свободной энергии Гиббса.

Следовательно, G является функцией полной энергии системы [H], энтропии [S] и температуры системы [T].

Enthalpy - what happens when system is in movement? A lot of the potential energy is turned into kinetic energy. Therefore, Total energy [H] or enthalpy has decreased since there is less potential energy after each second in the reaction. In the case of biology, potential energy is the hydrogen bonds or base-pairing bonds between the different nucleotide base pairs.
Entropy - when we increase disorder, typically referring to spontaneous reactions -> the random movement of all particles with respect to particles
Temperature - if you have increased temperature, you're ultimately increasing entropy due to movement of molecules

Следовательно, более высокая температура/энтропия уменьшит свободную энергию Гиббса, а более высокая энтальпия увеличит свободную энергию Гиббса.

  1. Если энергии Гиббса меньше, это указывает на то, что у нас больше энтропии и меньше энтальпии, что указывает на то, что только что произошла спонтанная реакция, поскольку больше кинетической и меньше потенциальной энергии [Экзергоническая]
  2. Если свободной энергии Гиббса больше, температура/энтропия уменьшаются, чтобы уменьшить хаос и, следовательно, не запускать спонтанные реакции [Эндергонические]
  3. Если свободная энергия Гиббса = 0, то существует равновесие между энтропией и температурой вместе с энтальпией [Равновесие]

Например, при клеточном дыхании мы разрываем связи в глюкозе, чтобы высвободить энергию, это увеличивает нашу кинетическую энергию и, таким образом, уменьшает свободную энергию Гиббса, следовательно, экзогенную реакцию или высвобождение тепла/энергии. В процессе фотосинтеза вы собираете энергию через CO2 и воду в виде глюкозы или крахмала, поэтому он является эндогенным там, где свободная энергия Гиббса выше.

Свободная энергия Гиббса нашей молекулы *измеряется в ккал/моль) основана на максимально возможном снижении общей энергии.

Если бы мы изобразили это на графике зависимости свободной энергии от хода реакции, мы бы хотели, чтобы самый нижний угол имел наименьшую свободную энергию во время реакции, когда молекула сворачивается.

Продолжение следует в Pt. 2 →А пока, почему бы вам не посмотреть что-нибудь еще?

| Гитхаб | ЛинкедИн | Средний |