Conceptul de similaritate moleculară (sau similaritate chimică , similaritate chimică ) este unul dintre conceptele cheie ale chimioinformaticii [1] [2] . Joacă un rol important în abordările moderne de predicție a proprietăților compușilor chimici , proiectarea de noi compuși cu proprietăți predeterminate și, în special, în căutarea de noi medicamente prin screeningul bazelor de date mari de compuși chimici disponibili (sau potențial disponibili). O astfel de căutare se bazează pe principiul similarității proprietăților formulat de Johnson și Maggiora: compușii chimici similari au proprietăți similare [1] .
Măsura asemănării moleculare este adesea descrisă ca reciproca distanței sau ca o distanță constantă minus în spațiul descriptorului.
Screening- ul virtual bazat pe similaritate (o variație a screening-ului virtual bazat pe liganzi) se bazează pe presupunerea că toți compușii din baza de date care sunt similari cu un anumit compus au activitate biologică similară. Deși această ipoteză nu este întotdeauna adevărată [3] , de multe ori setul de structuri chimice selectate în cursul unei astfel de screening-uri se dovedește a fi semnificativ îmbogățit cu compuși care au tipul dorit de activitate biologică [4] . Pentru a obține o eficiență mai mare în screening-ul virtual bazat pe similaritate, structurile chimice sunt de obicei descrise folosind ecrane moleculare ( chei structurale ) sau amprente moleculare de dimensiune fixă sau variabilă. Deși ecranele moleculare și amprentele moleculare pot fi generate atât din informații de conectivitate moleculară pur topologică (2D), cât și din informații (3D) despre structura spațială a moleculelor, amprentele digitale topologice, care sunt o formă de descriptori de fragmente binari, domină acest domeniu. . În timp ce cheile structurale, precum cheile MDL [5] , sunt destul de potrivite pentru lucrul cu baze de date chimice de dimensiuni mici și medii , atunci pentru lucrul eficient cu baze de date mari este de preferat să se utilizeze amprente moleculare cu o densitate mai mare de informații. Exemple sunt amprentele moleculare bazate pe fragmente de la Daylight [6] , BCI [7] și Tripos [8] . Cea mai comună măsură a similitudinii pentru structurile reprezentate de amprente moleculare este coeficientul Tanimoto (Jakara) T . Două structuri chimice sunt de obicei considerate similare dacă (pentru amprentele moleculare ale Daylight).