Relevanță (recuperarea informațiilor)

Versiunea actuală a paginii nu a fost încă examinată de colaboratori experimentați și poate diferi semnificativ de versiunea revizuită pe 10 mai 2018; verificările necesită 11 modificări .

Relevanța ( English  relevance  - relevance, relevance ) în regăsirea informațiilor  - corespondența intenției (intenția de căutare) încorporată în cerere și rezultatele motorului de căutare obținute ca urmare a acestei solicitări. Utilizatorul care introduce o interogare într-un motor de căutare se așteaptă ca rezultatele să se potrivească cu intenția pe care a introdus-o în interogare, cu alte cuvinte, va primi o ieșire relevantă.

Există mai multe abordări pentru a evalua relevanța. Relevanța conținutului este corespondența răspunsurilor la o solicitare de informații, determinată în mod informal [1] . Relevanța formală este o corespondență determinată prin compararea imaginii interogării de căutare cu imaginea de căutare a răspunsului conform unui anumit algoritm [1] .

Una dintre metodele comune de evaluare a relevanței este metoda TF-IDF . Sensul său se rezumă la faptul că, cu cât este mai mare frecvența locală a termenului (interogare) în document (TF) și mai mare este „raritatea” (adică apare mai rar în alte documente) a termenului în colectare (IDF), cu atât ponderea acestui răspuns este mai mare în raport cu termenul - adică răspunsul va fi dat mai devreme în rezultatele căutării pentru acest termen. Autorul metodei este Gerard Salton , dezvoltat în continuare de  Karen Spark Jones [2] .

Pertinența ( lat.  pertineo - atinge, relaționează ) - corespondența rezultatelor găsite de sistemul de regăsire a informațiilor cu nevoile de informații ale utilizatorului, indiferent de cât de complet și cât de exact este exprimată această nevoie de informații în textul cererii de informații. Cu alte cuvinte, acesta este raportul dintre cantitatea de informații utile și cantitatea totală de informații primite [1] .

Factori care afectează relevanța

Factorii care afectează relevanța sunt de obicei împărțiți în externi și interni . Cele externe includ masa de referință, cele interne - componentele tehnice și conținutul.

Greutatea legăturii. Cu cât mai multe link-uri tematice și de calitate conduc la paginile resursei, cu atât este mai probabilă valoarea resursei pentru utilizator.  

Componente tehnice. Un grup mare de parametri prin care motorul de căutare evaluează atât site-ul ca întreg, cât și paginile individuale (de exemplu, prezența meta-etichetelor, absența erorilor în marcajul HTML și așa mai departe).

Conţinut. Factorul cheie de care depinde relevanța paginii și a conversiei . Conținutul site-ului trebuie să fie unic și „pentru oameni”.

Vezi și

Note

  1. 1 2 3 Dicționar de cibernetică / Editat de academicianul V. S. Mikhalevich . - al 2-lea. - Kiev: Ediția principală a Enciclopediei sovietice ucrainene numită după M. P. Bazhan, 1989. - 751 p. - (C48). — 50.000 de exemplare.  - ISBN 5-88500-008-5 .
  2. Jones KS O interpretare statistică a specificității termenului și aplicarea sa în regăsire  // Journal of Documentation : journal. - Universitatea MCB: MCB University Press, 2004. - V. 60 , Nr. 5 . - S. 493-502 .

Literatură

Link -uri