Datele semi-structurate ( date semi-structurate sau slab structurate ) sunt o formă de date structurate care nu se conformează structurii stricte a tabelelor și relațiilor din modelele de baze de date relaționale , cu toate acestea, această formă de date conține etichete și alți markeri pentru a separa semantice. elemente și să ofere o structură ierarhică a înregistrărilor și câmpurilor din setul de date [1] . Astfel, acest tip de date pot fi numite fără schemă, iar structura este auto-descriptivă.
În datele semi-structurate, entitățile care aparțin aceleiași clase pot avea atribute diferite, chiar dacă clasele aparțin aceluiași grup. Nici ordinea atributelor nu este importantă.
Datele semi-structurate devin un subiect important pentru cercetare din mai multe motive [2] :
Astfel, datele semi-structurate devin din ce în ce mai frecvente, deoarece odată cu dezvoltarea internetului, documentele și bazele de date full-text necesită un format de date care să acționeze ca intermediar de informații. Datele semi-structurate se găsesc adesea în bazele de date orientate pe obiecte .
XML [3] și alte limbaje de marcare, mesajele de e- mail și EDI sunt toate exemple de date semi-structurate.
Modelul de schimb de date (OEM) [4] a precedat XML și a fost o structură de date auto-descriere.