Un cadru de citire deschis ( English Open Reading Frame , ORF) este o secvență de nucleotide din ADN sau ARN care este potențial capabilă să codifice o proteină . Semnul principal al prezenței ORF este absența codonilor stop (în cazul ARN, de obicei UAA, UGAși UAG) într-o secvență suficient de lungă după codonul de start (în marea majoritate a cazurilor, AUG). Deoarece în unele cazuri codonii de început și de terminare diferă de cei canonici și, de asemenea, datorită posibilității de suprimare (suprimare a acțiunii) a codonilor de oprire în timpul translațieiîn unele organisme, algoritmi sunt utilizați în determinarea cadrului de citire care explică aceste diferențe.
Existența unui cadru de citire deschis suficient de extins poate indica prezența în această regiune a unei gene care codifică o anumită polipeptidă . Trebuie luat în considerare faptul că marea majoritate a genelor eucariote au o structură mozaică în care regiunile codificante sunt întrerupte de regiuni necodante ( introni ). Intronii sunt excizați din moleculele pre- mARN în timpul îmbinării pentru a forma un cadru de citire intact în ARNm.
Prezența unui ORF este o condiție necesară, dar nu suficientă pentru afirmarea prezenței unei gene care codifică o polipeptidă într-o regiune dată. Pentru o transcriere și traducere eficiente , în plus, sunt necesare o serie de elemente de reglementare, în primul rând promotorul . Pe scurt, de la câțiva la câteva zeci de codoni, cadrele de citire sunt distribuite uniform în întreaga secvență de ADN din motive pur statistice și nu sunt luate în considerare în analiză.
Secvențele de codificare pot fi localizate pe oricare dintre cele două catene de ADN (dacă ADN-ul nu este monocatenar, ca în multe virusuri ), în oricare dintre cele trei faze posibile: câte trei, începând de la codonul de început AUG , câte trei de la +1 nucleotide din AUG, și așa mai departe. În analiză, sunt luate în considerare toate cele șase opțiuni, deoarece în absența informațiilor suplimentare sunt echivalente. Pentru comoditate, este utilizată secvența catenei de ADN complementară cu catena de codificare (plus catena), deoarece secvența sa corespunde secvenței de ARNm.
Cadrele deschise de citire din genele reale se suprapun rareori. Cu toate acestea, la eucariotele superioare , splicing-ul alternativ este larg răspândit, în care o genă codifică un număr de proteine similare, care, împreună cu prezența intronilor, complică semnificativ căutarea genelor eucariote in silico (folosind metode computerizate) în comparație cu procariotele .