Эволюционная дистанция (|fklZenkuugx ;nvmguenx)

Перейти к навигации Перейти к поиску

Эволюционная дистанция — величина, характеризующая генетические различия между двумя организмами. Находится путём сравнения нуклеотидных последовательностей гомологичных генов. Мерой генетических различий считается процент несовпадений нуклеотидов в соответствующих позициях гена[1].

Методы определения

[править | править код]

Попарная дистанция

[править | править код]

Простейшей величиной, характеризующей эволюционную дистанцию является доля несовпадающих нуклеотидов при попарном сравнении соответствующих позиций в гене. Эта величина называется «попарной дистанцией» (обычно обозначается символом p).

Например, при сравнении следующих двух участков гена

CAGACAGTCA
CACACTGCCA

на 10 нуклеотидов приходится три несовпадающих, p = 0,3.

Попарная дистанция недостаточно адекватно описывает эволюционные различия между организмами:

  • Так как для двух абсолютно произвольных последовательностей нуклеотидов вероятность их случайного совпадения в соответствующих позициях равна 25 %, то попарное расстояние между двумя совершенно чужеродными участками ДНК в среднем равно p = 0,75, тогда как по смыслу должно быть p = 1.
  • Попарное расстояние не учитывает разную вероятность различных замен нуклеотидов.
  • Попарное расстояние не учитывает возможность многократных мутаций в одной позиции.

Недостатки попарной дистанции устраняются использованием более сложных формул определения дистанции:

  • Метод Джукса-Кантора
  • Метод Тадзимы-Неи
  • Метод Кимуры
  • Метод Тамуры
  • Метод Тамуры-Неи

и другие методы.

Метод Джукса-Кантора

[править | править код]

Метод Джукса-Кантора[2] (англ. Jukes-Cantor Method) представляет собой простейшую попытку исключить из рассмотрения случайные совпадения нуклеотидов, вероятность которых составляет 25 %. Это однопараметрический метод, который в качестве параметра использует долю несовпадающих нуклеотидов (то есть попарную дистанцию p). Дистанция рассчитывается по следующей формуле

Метод предполагает, что все четыре нуклеотида (А, Ц, Т, Г) присутствуют в ДНК в одинаковых пропорциях, а вероятность замены одного нуклеотида на другой одинакова для любой пары нуклеотидов.

Как видно из формулы при p > 0,75 выражение не имеет смысла (отрицательное выражение под знаком логарифма). Это является недостатком метода, так как ситуации с p > 0,75 (более 75 % различающихся нуклеотидов) принципиально не исключены.

Формула была предложена в 1965 году, на заре исследований в области молекулярной биологии преподавателем химического факультета Калифорнийского университета Томасом Джуксом[англ.] и студентом того же факультета Чарлзом Кантором[англ.]. В середине 1960-х годов биохимические технологии достигли того уровня, когда стала возможной расшифровка отдельных фрагментов ДНК и аминокислотных последовательностей белков. Это позволило путём сравнения нуклеотидных последовательностей проследить эволюционную близость различных организмов и пути эволюции отдельных видов. Джукс и Кантор входили в число пионеров в деле формализации этого метода, а Кантор стал автором одной из первых компьютерных программ для анализа нуклеотидных последовательностей[3].

В качестве примера применения формулы можно привести фрагменты генов, кодирующих α- и β-гемоглобин человека. Считается, что около 400 млн лет назад оба гена произошли от одного предкового гена[3].

ACCAACGTCAAGGCCGCCTGGGGTAAGGTT (α-гемоглобин)
TCTGCCGTTACTGCCCTGTGGGGGAAGGTG (β-гемоглобин)

Сравнение фрагмента обнаруживает 12 различий на 30 нуклеотидов (p = 0,4). Однако простой подсчёт расхождений не учитывает вероятность того, что в некоторых позициях произошли многократные мутации, в том числе приведшие к восстановлению исходного нуклеотида. Формула Джукса-Кантора даёт дистанцию

Таким образом, из формулы следует, что с учётом кратных замен в рассматриваемом фрагменте ДНК произошло 0,572·30=17 мутаций.

Метод Кимуры

[править | править код]

Мотоо Кимура предложил метод вычисления дистанции, который получил название «двухпараметрическая дистанция Кимуры» (англ. Kimura 2-parameter distance, K2P). Модель Кимуры предполагает, что различные варианты замены нуклеотидов неравновероятны и рассматривает два типа замен:

  • Транзиция — замена нуклеотида без смены его типа, например, замена пуринового основания на пуриновое (А ↔ Г) или пиримидинового на пиримидиновое (Ц ↔ Т).
  • Трансверсия — смена типа основания с пуринового на пиримидиновый или наоборот (А или Г ↔ Ц или Т).

Дистанция в модели Кимуры определяется по формуле

где P — доля транзиций, Q — доля трансверсий.

Рассматривая в качестве примера эволюционную дистанцию между фрагментами генов α- и β-гемоглобина, получим:

ACCAACGTCAAGGCCGCCTGGGGTAAGGTT (α-гемоглобин)
TCTGCCGTTACTGCCCTGTGGGGGAAGGTG (β-гемоглобин)
Q PPQ   P QQ   QPQ     Q     Q

Метод Тадзимы — Нея

[править | править код]

В модели Тадзимы — Нея дистанция определяется следующими соотношениями[4]:

где

xij — относительные частоты пар нуклеотидов;
gi — относительные частоты нуклеотидов.

В качестве примера вычислим дистанцию между фрагментами генов, кодирующих α- и β-гемоглобин человека.

ACCAACGTCAAGGCCGCCTGGGGTAAGGTT (α-гемоглобин)
TCTGCCGTTACTGCCCTGTGGGGGAAGGTG (β-гемоглобин)
Нуклео-
тид
xij gi
A T C
A 10/60 = 0,167
T 1/30 = 0,0333 13/60 = 0,217
C 2/30 = 0,0667 3/30 = 0,100 15/60 = 0,250
G 1/30 = 0,0333 3/30 = 0,100 2/30 = 0,0667 22/60 = 0,367

В некоторых источниках дистанцией Тадзимы-Нея называется расчёт по более простой формуле

где

Для случая, когда все нуклеотиды встречаются с одинаковой частотой (gi = 0,25), эта формула совпадает с формулой Джукса-Кантора (b = 0,75).

Расчёты по этим формулам дают для того же примера

Примечания

[править | править код]
  1. Словарь терминов, используемых в молекулярной эволюции, популяционной генетике и молекулярной биологии Архивная копия от 28 января 2007 на Wayback Machine. На сайте СНК кафедры общей химии БГМУ.
  2. T. H. Jukes, C. R. Cantor (1969) Evolution of protein molecules. In H. N. Munro, ed., Mammalian Protein Metabolism, pp. 21-132, Academic Press, New York.
  3. 1 2 Thomas H. Jukes (April 30, 1990) How Many Nudeotide Substitutions Actually Took Place? Архивная копия от 21 октября 2012 на Wayback Machine Current Contests: 33(18), p. 21.
  4. Sudhir Kumar, Koichiro Tamura, and Masatoshi Nei. 4.1 Nucleotide Substitutions (англ.). MEGA: Molecular Evolutionary Genetics Analysis. Version 1.01. MEGA, Molecular Evolutionary Genetics Analysis[англ.] (1993). Дата обращения: 18 февраля 2015. Архивировано 6 февраля 2015 года.
  • Сайт СНК кафедры общей химии БГМУ (недоступная ссылка).
  • Distance. Phylogenetics: just methods. By Mark E. Siddall.
  • Manske C. L., Chapman D. J. (1987) Nonuniformity of nucleotide substitution rates in molecular evolution: computer simulation and analysis of 5S ribosomal RNA sequences (недоступная ссылка). J. Mol. Evol. 26(3):226-251. PubMed.
  • Aarta H. J. M., den Dunnen J. T., Leunissen J., Lubsen N. H., Schoenmakers J. G. G. (1988) The γ-crystallin gene families: sequence and evolutionary patterns (недоступная ссылка). J. Mol. Evol. 27:163-172. PubMed.
  • Tateno Y., Tajima F. (1986) Statistical properties of molecular tree consruction methods under the neutral mutation model (недоступная ссылка). J. Mol. Evol. 23:354-361. PubMed.
  • Aliabadian M., Kaboli M., Nijman V., Vences M. (2009) Molecular Identification of Birds: Performance of Distance-Based DNA Barcoding in Three Genes to Delimit Parapatric Species. PLoS ONE 4(1): e4119. doi:10.1371/journal.pone.0004119.
  • Thomas H. Jukes (March 2000) The Neutral Theory of Molecular Evolution. Genetics 154: 955—958.
  • Gillespie, J. H[англ.]. The Causes of Molecular Evolution (англ.). — Oxford University Press, New York, 1991. — ISBN 0-19-506883-1.
  • Graur, D. and Li, W-H. Fundamentals of Molecular Evolution, 2nd edition (англ.). — Sinauer Associates[англ.], 2000. — ISBN 0-87893-266-6.
  • Kimura, M. Evolutionary rate at the molecular level (англ.) // Nature. — 1968. — Vol. 217. — P. 624—626. — doi:10.1038/217624a0. — PMID 5637732. Архивировано 11 сентября 2008 года.
  • Kimura, M. The Neutral Theory of Molecular Evolution. — Cambridge University Press, Cambridge, 1983. — ISBN 0-521-23109-4..