Distanța evolutivă este o mărime care caracterizează diferențele genetice dintre două organisme. Se găsește prin compararea secvențelor de nucleotide ale genelor omoloage. O măsură a diferențelor genetice este procentul de nepotriviri de nucleotide în pozițiile corespunzătoare ale genei [1] .
Cea mai simplă valoare care caracterizează distanța evolutivă este proporția de nucleotide nepotrivite într-o comparație perechi a pozițiilor corespunzătoare din genă. Această mărime se numește „distanță în perechi” (notată de obicei prin simbolul p ).
De exemplu, când se compară următoarele două regiuni ale genei
CAGACAGTCA CA C AC T G C CAexistă trei nepotriviri la 10 nucleotide, p = 0,3.
Distanța în perechi nu descrie în mod adecvat diferențele evolutive dintre organisme:
Dezavantajele distanței pe perechi sunt eliminate prin utilizarea unor formule mai complexe pentru determinarea distanței:
si alte metode.
Metoda Jukes-Cantor [ 2] este cea mai simplă încercare de a exclude din considerare potrivirile aleatorii de nucleotide, a căror probabilitate este de 25%. Aceasta este o metodă cu un singur parametru care utilizează ca parametru proporția de nepotriviri de nucleotide (adică distanța p perechi ). Distanța se calculează folosind următoarea formulă
Metoda presupune că toate cele patru nucleotide (A, C, T, D) sunt prezente în ADN în aceleași proporții, iar probabilitatea de a înlocui o nucleotidă cu alta este aceeași pentru orice pereche de nucleotide.
După cum se poate observa din formulă, pentru p > 0,75, expresia nu are sens (expresie negativă sub semnul logaritmului). Acesta este un dezavantaj al metodei, deoarece situațiile cu p > 0,75 (mai mult de 75% din nucleotide diferite) nu sunt excluse în principiu.
Formula a fost propusă în 1965, în zorii cercetărilor în domeniul biologiei moleculare, de Thomas Jukes , profesor de chimie la Universitatea din California.și un student al aceleiași facultăți, Charles Cantor. La mijlocul anilor 1960, tehnologia biochimică a atins un nivel în care a devenit posibil să se descifreze fragmente individuale de ADN și secvențe de aminoacizi ale proteinelor. Acest lucru a făcut posibilă, prin compararea secvențelor de nucleotide, să se urmărească apropierea evolutivă a diferitelor organisme și căile evolutive ale speciilor individuale. Jukes și Kantor au fost printre pionierii în formalizarea acestei metode, iar Kantor a devenit autorul unuia dintre primele programe de calculator pentru analiza secvențelor de nucleotide [3] .
Ca exemplu de aplicare a formulei, pot fi citate fragmente de gene care codifică a- şi p-hemoglobina umană. Se crede că în urmă cu aproximativ 400 de milioane de ani ambele gene au provenit din aceeași genă ancestrală [3] .
ACCAACGTCAAGGCCGCCTGGGGTAAGGTT (α-hemoglobină) TCTGCCGTTACTGCCCTGTGGGGGAAGGTG (β-hemoglobină)Comparația fragmentelor relevă 12 diferențe la 30 de nucleotide ( p = 0,4). Cu toate acestea, un simplu calcul de discrepanță nu ia în considerare probabilitatea ca mutații multiple să apară în unele poziții, inclusiv cele care au condus la restaurarea nucleotidei originale. Formula Jukes-Cantor dă distanța
Astfel, din formulă rezultă că, ținând cont de substituții multiple, în fragmentul de ADN considerat au apărut 0,572·30=17 mutații.
Motoo Kimura a propus o metodă de calcul a distanței, care a fost numită „Kimura 2-parameter distance” ( în engleză Kimura 2-parameter distance, K2P ). Modelul Kimura presupune că diferitele variante de substituții de nucleotide nu sunt la fel de probabile și ia în considerare două tipuri de substituții:
Distanța în modelul Kimura este determinată de formulă
unde P este proporția tranzițiilor, Q este proporția transversiunilor.
Luând ca exemplu distanța evolutivă dintre fragmentele genelor de hemoglobină α- și β-hemoglobină, obținem:
ACCAACGTCAAGGCCGCCTGGGGTAAGGTT (α-hemoglobină) TCTGCCGTTACTGCCCTGTGGGGGAAGGTG (β-hemoglobină) Q PPQ P QQ QPQ QQÎn modelul Tajima- Ney , distanța este determinată de următoarele relații [4] :
Unde
x ij — frecvențele relative ale perechilor de nucleotide; g i - frecvenţele relative ale nucleotidelor.Ca exemplu, să calculăm distanța dintre fragmentele de gene care codifică α- și β-hemoglobina umană.
ACCAACGTCAAGGCCGCCTGGGGTAAGGTT (α-hemoglobină) TCTGCCGTTACTGCCCTGTGGGGGAAGGTG (β-hemoglobină)nucleotid _ |
xij _ | gi _ | ||
---|---|---|---|---|
A | T | C | ||
A | 10/60 = 0,167 | |||
T | 1/30 = 0,0333 | 13/60 = 0,217 | ||
C | 2/30 = 0,0667 | 3/30 = 0,100 | 15/60 = 0,250 | |
G | 1/30 = 0,0333 | 3/30 = 0,100 | 2/30 = 0,0667 | 22/60 = 0,367 |
În unele surse, distanța Tajima-Nei este numită calcul folosind o formulă mai simplă
Unde
Pentru cazul în care toate nucleotidele apar cu aceeași frecvență ( gi = 0,25 ), această formulă coincide cu formula Jukes-Cantor ( b = 0,75).
Calculele folosind aceste formule dau pentru același exemplu