Web semantic

Versiunea actuală a paginii nu a fost încă examinată de colaboratori experimentați și poate diferi semnificativ de versiunea revizuită pe 22 martie 2022; verificările necesită 2 modificări .

Rețeaua semantică  este un model informațional al domeniului subiectului , are forma unui grafic direcționat . Vârfurile graficului corespund obiectelor domeniului subiect, iar arcele (marginile) definesc relația dintre ele. Obiectele pot fi: concepte , evenimente , proprietăți, procese [1] . Astfel, rețeaua semantică este una dintre modalitățile de reprezentare a cunoștințelor .

Numele combină termeni din două științe: semantica în lingvistică studiază semnificația unităților de limbaj, iar o rețea în matematică este un fel de grafic  - un set de vârfuri conectate prin arce (margini), cărora li se atribuie un anumit număr. În rețeaua semantică, rolul nodurilor este jucat de conceptele bazei de cunoștințe, iar arcurile (mai mult, dirijate) definesc relația dintre ele. Astfel, rețeaua semantică reflectă semantica disciplinei sub formă de concepte și relații.

Este greșit să echivalăm conceptele de „Rețea semantică” ( ing.  Rețea semantică ) și „ Web semantic ” ( ing.  Web semantic ). Deși aceste concepte nu sunt echivalente, ele sunt totuși legate (a se vedea mai jos ).

Istorie

Ideea de sistematizare pe baza oricăror relații semantice a fost propusă de oamenii de știință din știința timpurie. Un exemplu în acest sens este clasificarea biologică a lui Carl Linnaeus din 1735. Considerată ca o rețea semantică, această clasificare folosește o relație de subset, AKO modern (din engleză „A Kind Of”, „variety”).

Progenitorii rețelelor semantice moderne pot fi considerați grafice existențiale propuse de Charles Pierce în 1909 . Au fost folosite pentru a reprezenta afirmații logice sub formă de diagrame speciale. Peirce a numit această metodă „logica viitorului”.

O direcție importantă în studiul rețelelor a fost lucrarea psihologului german Otto Selz în 1913 și 1922. În ele, pentru a organiza structurile conceptelor și asocierilor, precum și pentru a studia metodele de moștenire a proprietăților, a folosit grafice și relații semantice. Cercetătorii M. Anderson (1973), D. Norman (1975) și alții au folosit aceste lucrări pentru a modela memoria umană și proprietățile intelectuale.

Rețelele semantice computerizate au fost dezvoltate în detaliu de Richard Richens  în 1956 , ca parte a proiectului de traducere automată al Cambridge Language Learning Center . Procesul de traducere automată este împărțit în 2 părți: traducerea textului sursă într-o formă intermediară de reprezentare, iar apoi această formă intermediară este tradusă în limba dorită. Rețelele semantice erau doar o astfel de formă intermediară. În 1961, a apărut Masterman în care , printre altele, a definit un vocabular de bază pentru 15.000 de concepte. Aceste studii au fost continuate de Robert Simmons (1966), J. Wilkes (1972) și alți oameni de știință.  

Lucrările despre rețele semantice se referă adesea la lucrările psihologului american Ross Quillian despre „ memoria semantică[2] .

Structura

Matematica îți permite să descrii majoritatea fenomenelor din lumea din jurul tău sub formă de enunțuri logice. Rețelele semantice au apărut ca o încercare de a vizualiza formule matematice. Principala reprezentare a rețelei semantice este graficul . Totuși, nu uitați că în spatele imaginii grafice există cu siguranță o notație matematică strictă și că ambele forme arată același lucru.

Reprezentare grafică

Principala formă de reprezentare a rețelei semantice este un grafic. Conceptele rețelei semantice sunt scrise în ovale sau dreptunghiuri și sunt conectate prin săgeți cu titluri - arce (vezi Fig.). Aceasta este cea mai convenabilă formă percepută de o persoană. Neajunsurile sale apar atunci când începem să construim rețele mai complexe sau încercăm să ținem cont de caracteristicile limbajului natural. Schemele rețelelor semantice, pe care sunt indicate direcțiile relațiilor de navigație, se numesc hărți de cunoștințe, iar totalitatea lor, care permite acoperirea unor secțiuni mari ale rețelei semantice, se numește atlas de cunoștințe.

Notație matematică

În matematică , un graf este reprezentat printr-o mulțime de vârfuri V și o mulțime de relații între ele E. Folosind aparatul logicii matematice, concluzionăm că fiecărui vârf îi corespunde un element al mulțimii obiectelor, iar arcului îi corespunde un predicat . .

Notație lingvistică

În lingvistică, relațiile sunt înregistrate în dicționare și tezaure . În dicționare, în definiții prin gen și diferență specifică, conceptul generic ocupă un anumit loc. În tezaure, în articolul fiecărui termen, pot fi indicate toate legăturile posibile cu alți termeni înrudiți. Dintre astfel de tezaure este necesar să se distingă tezaurele de regăsire a informațiilor cu liste de cuvinte cheie din articole care sunt destinate funcționării motoarelor de căutare de descriptori.

Clasificarea rețelelor semantice

Pentru toate rețelele semantice este valabilă împărțirea după aritate și numărul de tipuri de relații.

În plus față de graficele conceptuale, există și alte modificări ale rețelelor semantice, aceasta este o altă bază pentru clasificare ( prin implementare ). Consultați secțiunea relevantă de mai jos pentru mai multe detalii .

Relații semantice

Numărul de tipuri de relații din rețeaua semantică este determinat de creatorul acesteia, pe baza unor obiective specifice. În lumea reală, numărul lor tinde spre infinit. Fiecare relație este, de fapt, un predicat, simplu sau compus. Viteza de lucru cu baza de cunoștințe depinde de cât de eficient sunt implementate programele de procesare a relațiilor necesare.

Ierarhic

Cel mai adesea este nevoie de a descrie relațiile dintre elemente, mulțimi și părți ale obiectelor. Relația dintre un obiect și o mulțime, care indică faptul că obiectul aparține acestei mulțimi, se numește relație de clasificare ( ISA ). Se spune că o mulțime (clasă) își clasifică instanțele . [3] (exemplu: „Balloon is a dog” = Balonul este un obiect de tip câine ). Uneori, această relație este numită și MemberOf, InstanceOf sau similar. Comunicarea ISA presupune că proprietățile unui obiect sunt moștenite de la o mulțime. Relația inversă cu ISA este folosită pentru a desemna exemple, motiv pentru care se numește „Exemplu” sau în rusă „Exemplu”. Relațiile ierarhice formează o structură arborescentă .

Adesea, în rețelele semantice, este necesară definirea relației dintre sinonimie și antonimie . Aceste conexiuni fie sunt duplicate explicit în rețea însăși, fie sunt determinate de componenta algoritmică.

Auxiliar

În rețelele semantice sunt deseori folosite și următoarele relații :

Această listă poate fi continuată la nesfârșit: în lumea reală, numărul de relații este uriaș. De exemplu, relația „lucruri complet diferite” sau similar poate fi folosită între concepte: Не_имеют_отношения_друг_к_другу(Солнце, Кухонный_чайник).

Caracteristici ale utilizării unor tipuri de relații

În rețeaua semantică, conceptele pot fi atât instanțe de obiecte, cât și mulțimi ale acestora. Folosirea acelorași relații atât pentru elemente, cât și pentru colecții poate duce la confuzie. Erori similare în funcționarea unor sisteme timpurii au fost descrise în articolul Drew McDermottInteligenta artificială se confruntă cu prostia naturală ”

Să aruncăm o privire la patru propoziții:

  1. Pavel are un tată pe nume Alexei.
  2. Pentru Pavel există un tată din mulți oameni.
  3. Există o persoană pentru care Alexei este tată.
  4. Fiecare persoană are un tată a mai multor bărbați.

Pentru o persoană, sensul acestor fraze este clar, iar mulți, fără ezitare, ar pune în toate cele patru cazuri relația este tată . Totuși, aceasta este o greșeală: în primul caz, într-adevăr, este descrisă relația dintre două instanțe, dar în al doilea și al treilea - între o instanță și un set, iar în al patrulea - o relație între reprezentanți din două seturi. În notația matematică, arată astfel, respectiv, pentru propozițiile 1-4:

I. ∃ pavel & ∃ alexey: tată (alexey, paul); IIa. ∃ paul → ∃ x ∈ bărbați : tată(x, paul); IIb. ∃ alexey → ∃ y ∈ oameni : tată(alexey, y); III. ∀ y ∈ oameni → ∃ x ∈ bărbați : tată(x, y);

Vedem că cazurile IIa și IIb diferă doar în ordinea variabilelor din predicat, dar aceasta poate juca un rol important pentru corectitudinea rețelei. În exemplu, sunt enumerate doar 4 tipuri de relații, dar există nouă dintre ele pentru o rețea binară. Ele diferă în cuantificatorii ∃ și ∀, precum și în ordinea variabilelor.

Grafic, pentru a distinge toate aceste cazuri, se folosesc forme speciale de marcare a relațiilor pe grafic: de exemplu, relațiile de primul fel sunt lăsate neschimbate, al doilea tip este conturat cu un cadru dreptunghiular de puncte, al treilea este o liniuță și al patrulea este un punct. Sau puteți scrie indexul tipului de relație lângă el.

Cea mai frecventă confuzie apare în legătură cu relația ISA . Prin urmare, în multe lucrări moderne se acceptă că ISA denotă relația dintre o instanță și o mulțime (cazul IIb de mai sus): Murka ISA cat . Un singur cadru nu este utilizat în acest caz. Dacă se cere definirea unei relații de echivalență (cazul I), se poate introduce o relație specială pentru aceasta (deși pentru rețeaua semantică nu este nevoie de ea). ISA poate fi folosit pentru a indica apariția elementelor unui set în altul (cazul III), dar acest lucru nu este recomandat. Pentru a desemna submulțimi, se folosește o altă relație specială - AKO . Diferența dintre ISA într-o cutie și AKO este că acesta din urmă este, de asemenea, responsabil pentru moștenirea proprietăților seturilor în sine, și nu doar a elementelor.

Utilizarea rețelelor semantice

Semantizare

Semantizarea este procesul de modificare a textelor în care relațiile semantice se disting fără a le modifica conținutul. Wikipedia are proiecte de semantizare a articolelor și Arborele de categorii.

Web-ul semantic

Conceptul de organizare hipertext seamănă cu o rețea semantică binară omogenă , dar există o diferență semnificativă:

  1. Conexiunea realizată printr-un hyperlink nu are semantică, adică nu descrie sensul acestei conexiuni. Scopul rețelei semantice este de a descrie relațiile dintre obiecte și nu informații suplimentare despre domeniul subiectului. O persoană își poate da seama de ce este nevoie de acest sau acel hyperlink, dar această conexiune nu este clară pentru computer.
  2. Paginile cu hyperlink sunt documente care descriu, de regulă, situația problemă în ansamblu. Într-un web semantic, vârfurile (ce leagă de relații) reprezintă concepte sau obiecte din lumea reală .

O încercare de a crea un web semantic bazat pe World Wide Web a fost numită Web Semantic . Acest concept implică utilizarea RDF (un limbaj de marcare bazat pe XML ) și are scopul de a oferi link-urilor un sens pe care sistemele informatice îl pot înțelege. Acest lucru va transforma Internetul într-o bază de cunoștințe distribuită la scară globală.

Software

Vezi și

Note

  1. Roussopoulos ND Un model de rețea semantică de baze de date.  — TR nr. 104, Departamentul de Informatică, Universitatea din Toronto, 1976.
  2. Quillian, M. R. (1968). memorie semantică. Prelucrarea informației semantice, 227-270.
  3. Concepte de bază . Consultat la 15 aprilie 2007. Arhivat din original pe 25 ianuarie 2007.