Мутации структуры белковоподобного сополимера. Компьютерное моделирование
3.2.Модель молекулярной эволюции
При моделировании эволюционного процесса используются следующий алгоритм:[22]
1. Чтобы сконструировать начальную конфигурацию (G = 0), нужно сгенерировать цепь (притяжение между мономерами отсутствует) со случайным распределением Н звеньев. Эта цепь является начальной для данного рассчёта.
2. Готовится набухший полимерный клубок, присваивая па
раметры eНН и eРР нулю.
3. Складывание цепи происходит при eНН = 2 и данном значении eРР. Эта конформация приходит к равновесию после 4´105 шагов интегрирования.
4. Одна половина звеньев, имеющих наибольшую площадь доступной растворителю (SASA) и одновременно удалённые от центра масс глобулярного ядра, модифицируются в тип Р, остальные звенья, имеющие меньшие значения SASA и находящиеся вблизи центра масс глобулярного ядра превращают в тип Н. Благодаря такому модифицированию последовательность мутирет и переходит в следующую генерацию G ® G + 1. Состав последовательности строго определён, поэтому в цепи N/2 гидрофобных и N/2 гидрофильных звеньев. Чтобы вычислить статистические свойства данной последовательности, производят вычисление теоретико – информационные характеристик.
5. Чтобы вычислить термодинамические и структурные свойства, мы производили усреднение по большому числу шагов интегрирования, t2 = 4´105.
6. Повторяем алгоритм по пунктам 2 – 5 для последней генерации. Это даёт класс глобулярных сополимеров с другой первичной НР структурой.
В нашем исследовании шаги 2 –5 независимо повторяем 20 раз, начиная от различных случайных конформаций и тогда все результаты усредняются по этим расчетам, чтобы статистика была лучше. Каждую траекторию мы можем интерпретировать ряд последовательностей полученных по ходу эволюционного процесса, как различные ветви эволюции, получаемые от начльной конформации. Эти результаты могут быть важны для понимания основных возможностей эволюции последовательности.
Существует два основных различия в методике между алгоритмом предложенным нами и который использовался в статьях [23-25]. Во первых, наша вычислительная схема основана на динамических принципах, в то время как в методе, описанном статьях [23-25], используется стохастическая динамика. Грубо говоря, алгоритм дизайна первичной структуры цепей отбирает те желаемые последовательности, чьи соответствующие конформации имеют наименьшую потенциальную энергию. Ясно, что такой подход позволяет оптимизировать энергию данной конформации,в то время как в нашем подходе энергия не является ограничивающим параметром и может в принципе увеличиваться. Конечно, следует помнить, что наша модель молекулярной эволюции включает стохастическую составляющую. Во вторых, каждый шаг процедуры, использующей метод Монте Карло, является попытка парной замены, заключающаяся в случайном выборе двух звеньев и обмене их между собой (модель «точечных мутаций»). Сущность процедуры модификации, используемой в нашем эксперименте, является химическая модификация всех звеньев, окружённых растворителем. В реальном эксперименте это можно произвести при помощи растворённого реагента. Подчеркнём, что даже единичное модифицирование поверхности глобулы может резко изменять одномерную первичную последовательность цепи. Поэтому число получаемых последовательностей строго ограничено, фактически составляя ничтожную часть всех возможных последовательностей. Таким образом, данный подход существенно отличается по своей сути, физической природе, и также по его экспериментальной осуществимости. Также следует помнить, что последовательности, полученные при помощи этого подхода, не являются уникальными и нативными.
Так как при моделировании требуется существенное количество вычислении, наш анализ ограничивался только равновесными свойствами.
В проведённом компьютерном эксперименте было обнаружено, что в области малых значениях параметра eр происходит вырождение глобулы и образование структуры типа ²головастик², который состоит из плотного ядра и длинного хвоста. Также возможно образование длинной петли или двух ²хвостов².Можно предположить, что на начальном этапе эволюции глобулы образуются длинные петли. Затем одна из длинных петель вырождается в длинный хвост.[26]
На рис. 3.1. можно видеть типичную морфологии глобулы белково-подобного сополимера и структуру типа «головастик». Для количественного описания этого перехода было предложено ряд характеристик.
(а) (в)
Рис. 3.1. (а) Мицелоподобная структура, (в) структура типа ²головастик².
3.3. Методы анализа
Рассмотрим поподробнее характеристики, которые были предложены для описания перехода «глобула – головастик».
1. Среднеквадратичный радиус инерции.
Его можно рассчитать по формуле:
<R2g> = N-1 (ri – r0)2 (3.6)
где N – число частиц,
r0 – радиус вектор центра масс,
ri – радиус вектор i-й частицы
Этот параметр характеризует размер макромолекулы. Косвенным образом может характеризовать форму молекулы. Часто используют для изучению перехода клубок - глобула.
2.Длины «хвостов» .
Под «хвостом» понимают непрерывный участок Н или Р звеньев, который берёт начало с конца полимерной цепи. Так как в «головастике» длина хвоста достаточна велика, то вероятно это удачная характеристика для описания этого перехода. Однако, как будет показано в следующей главе, из-за недостаточного усреднения эта характеристика достаточно сильно флуктуирует.
3. Длины петель.
Подобно длинам хвостов – это также непрерывный участок Н и Р звеньев, однако этот участок не имеет начало с конца полимерной молекулы. Так в первичной структуре можно выделить достаточное число петель, то усреднение будет лучше и характеристика меньше флуктуирует во времени.
4. Размер заархивированного файла
характеристику можно объяснить следующим образом. Обозначим Н звенья как 0, а Р звенья - как 1. В результате первичную структуру сополимера можно представить как последовательность единиц и нулей. Такой цифровой код записывается в файл и подвергается архивированию. Размер заархивированного файла Lв, выраженным в байтах и характеризует первичную структуру, в частности, распределение в ней единиц и нулей. Мы использовали стандартный архиватор GZIP. Определение размера заархивированного файла показано на схеме в приложении 6.
Эта характеристика удобна тем, что при вырождении глобулы в «головастик» значение её резко уменьшается. Это обусловлено увеличением длин петель и «хвостов».
5. Индекс Шеннона. ( I )
Индекс Шеннона (Shannon’s index) вычисляется по формуле
I = Nlog2N - Nilog2Ni (3.7)
где Ni - количество элементов сорта i,
n - количество сортов элемента,
N - общее количество элементов,
Например в цепочке