Chimioinformatica ( informatica chimică , informatica moleculară ) este aplicarea metodelor informatice pentru a rezolva probleme chimice.
Domenii de aplicare ale chimioinformaticii: predicția proprietăților fizico-chimice ale compușilor chimici (în special, lipofilitatea , solubilitatea în apă), proprietățile materialelor, activitatea toxicologică și biologică, ADME/T, proprietățile ecotoxicologice, dezvoltarea de noi medicamente și materiale.
Termenul de chimioinformatică a fost inventat de F.C. Brown [1] [2] în 1998:
Chimioinformatica înseamnă partajarea resurselor informaționale pentru a transforma datele în informații și informațiile în cunoștințe pentru a lua mai rapid cele mai bune decizii în căutarea compușilor de vârf în dezvoltarea medicamentelor și optimizarea acestora.
Mai târziu această definiție a fost extinsă de J. Gasteiger [3] [4] :
Chimioinformatica este aplicarea metodelor informatice pentru a rezolva probleme chimice.
G. Paris de la Novartis a dat următoarea definiție a chimioinformaticii [5] :
Chimioinformatica este o disciplină științifică care acoperă proiectarea, crearea, organizarea, managementul, regăsirea, analiza, diseminarea, vizualizarea și utilizarea informațiilor chimice.
Conform definiției date de A. Warnek și I. Baskin [6] [7] :
Chimioinformatica este o ramură a chimiei teoretice bazată pe propriul model molecular; Spre deosebire de chimia cuantică, în care moleculele sunt reprezentate ca ansambluri de electroni și nuclee, și modelarea moleculară bazată pe forță, care se ocupă de „atomi” și „legături” clasice, chimioinformatica consideră moleculele ca obiecte în spațiul chimic.
Definiția cea mai completă și detaliată a chimioinformaticii ca disciplină științifică este conținută în Declarația Obernay [8] :
Chimioinformatica este o disciplină științifică care a apărut în ultimii 40 de ani în zona de graniță dintre chimie și matematica computațională. S-a realizat că în multe domenii ale chimiei, cantitatea mare de informații acumulate în cursul cercetărilor chimice nu putea fi procesată și analizată decât cu ajutorul computerelor. Mai mult, multe dintre problemele din chimie sunt atât de complexe încât sunt necesare noi abordări bazate pe aplicarea metodelor informatice pentru a le rezolva. Pe baza acesteia, s-au dezvoltat metode pentru construirea de baze de date despre compuși și reacții chimice, pentru prezicerea proprietăților fizice, chimice și biologice ale compușilor și materialelor, pentru căutarea de noi medicamente, analiza informațiilor spectrale, pentru prezicerea cursului reacțiilor chimice și planificare. sinteza organica.
Chimioinformatica se află la intersecția dintre chimie și informatică . Chimioinformatica se bazează pe ideea unui spațiu chimic - totalitatea tuturor obiectelor chimice disponibile (compuși chimici, reacții, amestecuri, soluții, sisteme catalitice, materiale etc.). O trăsătură distinctivă a chimioinformaticii este că, în cadrul acesteia, predicția proprietăților obiectelor chimice se realizează prin transferul (interpolare) valorilor cunoscute ale proprietăților de la obiecte chimice similare. În cele mai multe cazuri, obiectele chimice pot fi reprezentate ca grafice moleculare și, prin urmare , metodele teoriei grafurilor sunt utilizate pe scară largă în chimioinformatică. Abordarea tradițională a procesării informațiilor chimice este însă de a mapa spațiul chimic pe un spațiu de descriptor format din vectori de descriptori moleculari calculați pentru fiecare obiect chimic - caracteristici numerice care descriu obiectele chimice (în special, grafice moleculare ). Acest lucru face posibilă aplicarea metodelor de statistică matematică și de învățare automată (inclusiv data mining ) pentru a lucra cu obiecte chimice.
Fundamentele chimioinformaticii sunt prezentate în manuale [3] [9] [10] [11] [12] [13] , monografii [4] [5] [14] [15] și articole de recenzie [1] [2] [ 7] .
În chimioinformatică, pentru reprezentarea internă a structurilor compușilor chimici, se folosesc de obicei grafice moleculare , care pot fi completate, dacă este necesar, cu informații despre coordonatele tridimensionale ale atomilor, precum și despre dinamica modificării acestora în timp. Stocarea pe termen lung a informațiilor chimice și schimbul acesteia între aplicații se realizează folosind fișiere organizate în conformitate cu tipurile de reprezentare externă a informațiilor chimice.
Cel mai simplu tip de reprezentare externă a structurilor compușilor chimici sunt notațiile liniare sub forma unui șir de caractere. Din punct de vedere istoric, notația liniară Wieswesser (WLN) a fost primul tip de notație liniară. Șirurile SMILES sunt în prezent cel mai comun tip de notație liniară . În plus, sunt folosite și notațiile liniare SLN ( Sybyl Line Notation , Tripos, Inc.; conține și posibilitatea de a specifica structuri Markush), SMARTS (extensia SMILES pentru interogări de căutare în baze de date chimice), ROSDAL. Pentru a codifica structurile chimice, IUPAC a propus o notație liniară universală InChI.
Al doilea tip de reprezentare externă a structurilor compușilor chimici și a reacțiilor dintre aceștia se bazează pe codarea directă a matricei de adiacență a graficului molecular. Formatele comune, cum ar fi MOL, SDF și RDF, care sunt în prezent standard pentru schimbul de informații chimice, pot fi considerate modalități de a reprezenta matricea de adiacență a unui grafic molecular într-un fișier text. Același scop este servit de formatele specifice MOL2, HIN, PCM etc., concepute pentru a funcționa cu programe comune de modelare moleculară.
În cele din urmă, al treilea tip de reprezentare externă a structurilor compuse chimice se bazează pe tehnologia XML . Cel mai comun limbaj pentru descrierea informațiilor chimice bazate pe aceste principii este CML.
Reprezentarea informatică a informațiilor chimice este discutată în detaliu în manual [10] .
O caracteristică a managementului bazelor de date în chimie este că oferă următoarele tipuri de căutare, tipice pentru informațiile chimice> [10] :
Software pentru lucrul cu baze de date ale structurilor chimice (stocare, căutare):
Baze de date publice care conțin informații chimice:
Bazele de date de chimie sunt discutate în detaliu în manualul [11] .
Predicția proprietăților compușilor chimici în chimioinformatică se bazează pe utilizarea statisticii matematice și a metodelor de învățare automată pentru a construi modele care să permită prezicerea proprietăților acestora (activitate fizică, chimică, biologică) din descrierea structurilor compușilor chimici. Modelele care fac posibilă prezicerea caracteristicilor cantitative ale activității biologice au primit istoric denumirea în limba engleză Quantitative Structure-Activity Relationship (QSAR). Abrevierea QSAR este adesea interpretată în sens larg pentru a se referi la orice model de structură-proprietate.
Un farmacofor este un set de caracteristici spațiale și electronice necesare pentru a asigura interacțiuni supramoleculare optime cu o țintă biologică specifică care poate provoca (sau bloca) răspunsul său biologic. Căutarea farmacoforului caută o corespondență între descrierea farmacoforului și caracteristicile moleculelor din baza de date care sunt în conformații acceptabile.
Asemănarea moleculară (sau asemănarea chimică, similitudinea chimică ) este proximitatea, asemănarea, asemănarea structurilor compușilor chimici. Ca măsură cantitativă a similitudinii moleculare, este adesea considerată o valoare care crește odată cu scăderea distanței dintre compușii chimici din spațiul descriptorului. Căutarea similarității chimice se bazează pe presupunerea că compușii similari au activitate biologică sau catalitică similară.
Screeningul virtual este o procedură de calcul care implică parcurgerea automată a unei baze de date de compuși chimici și selectarea celor despre care se prevede că au proprietățile dorite. Cel mai adesea, screening-ul virtual este utilizat în dezvoltarea de noi medicamente pentru a căuta compuși chimici cu tipul dorit de activitate biologică.
Sinteza computerizată este un domeniu al chimioinformaticii, acoperind metode, algoritmi și programe de calculator care le implementează, asistând chimistul în planificarea sintezei compușilor organici, prezicerea rezultatelor și proiectarea de noi tipuri de reacții organice bazate pe generalizarea datelor privind transformările sintetice cunoscute.
Una dintre sarcinile centrale ale chimioinformaticii este vizualizarea și cartografierea spațiului chimic, navigarea și identificarea zonelor neexplorate din acesta [7] . Analiza spațiului chimic se bazează de obicei fie pe reprezentarea obiectelor chimice (structuri și reacții) ca vectori ai descriptorilor de dimensiune fixă, fie pe descrierea obiectelor chimice folosind grafice moleculare. În acest din urmă caz, arborii cu schelete moleculare sunt adesea folosiți pentru a reprezenta spațiul chimic.
Una dintre cele mai importante sarcini ale chimioinformaticii este proiectarea moleculară a compușilor chimici cu proprietățile dorite. Aceasta se referă la generarea direcționată de structuri de compuși chimici (grafice moleculare), care, în conformitate cu anumite modele, trebuie să aibă una sau un set de proprietăți predeterminate. Când se utilizează în acest scop modelele QSAR și QSPR, obținute ca urmare a căutării relațiilor cantitative structură-proprietate , atunci se vorbește de „QSAR invers”, „QSPR invers”, sau rezolvarea unei probleme inverse în problema structură-proprietate [ 16] . Aceste abordări se bazează pe utilizarea generatoarelor de grafice moleculare. Când se utilizează un model fizic care descrie interacțiunea ligand-proteină, se vorbește despre metode de proiectare a structurii chimice de novo.
de chimie computațională | Secțiuni|
---|---|