Limbajul de regăsire a informațiilor
Limbajul de regăsire a informațiilor (IPL) este un limbaj artificial care reprezintă un set de instrumente de descriere a structurii formale și de conținut pentru căutare (prin indexare ) la cererea utilizatorului .
Structura
În ILP, se pot distinge alfabetul , vocabularul și gramatica .
- Alfabetul - un set de caractere specifice pentru scrierea cuvintelor și expresiilor. În multe limbi, simbolurile în limbaj natural sunt folosite pentru aceasta : chirilic, alfabet latin, cifre arabe și romane, semne de punctuație.
- Vocabular - totalitatea tuturor cuvintelor folosite în limbă - unități lexicale.
- Gramatica - regulile de compunere a expresiilor. Gramatica în multe ISL-uri este formală, iar în unele nu există deloc.
Relațiile paradigmatice, adică relațiile semantice dintre unitățile lexicale, servesc la organizarea unităților lexicale în construcția vocabularului. Aceste relații sunt stabilite și fixate în dicționarul limbii, pe baza nevoilor de regăsire a informațiilor.
Tipuri și tipuri de IIP
Metoda de precizare a unităților lexicale
- Limbile controlate sunt limbi al căror vocabular este definit și controlat folosind dicționare și tabele. Acestea includ diverse sisteme de clasificare ( UDC , LBC , clasificarea Dewey ).
- Limba titlurilor de subiecte . Pe baza clasificării ierarhice se construiesc cataloage sistematice. Pe baza limbajului titlurilor de subiecte, se construiesc cataloage de subiecte. Cataloage alfabetice - căutare manuală.
- Descriptorul IPN , precum și limba cuvintelor cheie - căutare automată.
- Necontrolat - vocabularul nu este stabilit de dicționar, ci este construit pe baza alegerii termenilor din limbajul natural. Astfel de PIP-uri au fost utilizate pe scară largă în ultimii ani.
Ordinea scrierii unităților lexicale
- Limbile necoordonate sunt cele care nu permit coordonarea unităților lor lexicale (nu există nicio legătură între ele) nici în procesul de indexare, nici în procesul de căutare. (sistemul de aranjare a cărților în fondul bibliotecii, conform numerelor de inventar ).
- ISL-urile coordonate sunt limbi în care unitățile lexicale sunt legate, coordonate între ele, fie în procesul de indexare, fie în procesul de utilizare.
- Precoordonate - legăturile dintre unitățile lexicale se stabilesc înainte de căutare.
- Postcoordonat - atunci când legăturile între unitățile lexicale sunt stabilite numai în timpul căutării.
Link -uri