Cuvinte de zgomot

Cuvinte oprite , sau cuvinte zgomote , este un termen din teoria regăsării informațiilor prin cuvinte cheie .

Cuvintele stop pot fi împărțite în general și dependente .

Cele obișnuite includ prepoziții , sufixe , participii , interjecții , numere , particule etc. Cuvintele de zgomot obișnuite sunt întotdeauna excluse din interogarea de căutare (cu excepția căutării după potrivirea strictă a expresiei de căutare), de asemenea, sunt ignorate la construirea unui index inversat . Se crede că fiecare dintre cuvintele stop comune se găsește în aproape toate documentele din colecție .

Cuvintele stop dependente depind de expresia de căutare. Ideea este de a lua în considerare absența cuvintelor simple din interogare și a cuvintelor stop dependente din interogare într-un mod diferit în documentul găsit.

De exemplu, atunci când căutați Pușkin Alexander Sergeevich , este logic să afișați toate documentele care conțin:

Dar nu are sens să afișați documente care conțin doar:

Adică, în această interogare, cuvintele de zgomot sunt Alexander și Sergeevich .

Cuvintele stop dependente diferă prin aceea că ar trebui luate în considerare în interogarea de căutare numai dacă există cuvinte cheie semnificative în documentul căutat.

Vezi și

Literatură