Cuvinte oprite , sau cuvinte zgomote , este un termen din teoria regăsării informațiilor prin cuvinte cheie .
Cuvintele stop pot fi împărțite în general și dependente .
Cele obișnuite includ prepoziții , sufixe , participii , interjecții , numere , particule etc. Cuvintele de zgomot obișnuite sunt întotdeauna excluse din interogarea de căutare (cu excepția căutării după potrivirea strictă a expresiei de căutare), de asemenea, sunt ignorate la construirea unui index inversat . Se crede că fiecare dintre cuvintele stop comune se găsește în aproape toate documentele din colecție .
Cuvintele stop dependente depind de expresia de căutare. Ideea este de a lua în considerare absența cuvintelor simple din interogare și a cuvintelor stop dependente din interogare într-un mod diferit în documentul găsit.
De exemplu, atunci când căutați Pușkin Alexander Sergeevich , este logic să afișați toate documentele care conțin:
Dar nu are sens să afișați documente care conțin doar:
Adică, în această interogare, cuvintele de zgomot sunt Alexander și Sergeevich .
Cuvintele stop dependente diferă prin aceea că ar trebui luate în considerare în interogarea de căutare numai dacă există cuvinte cheie semnificative în documentul căutat.
Optimizare motor de căutare | |
---|---|
Excepții | |
Marketing |
|
Marketing de căutare |
|
Spam |
|
Legături |
|
Alte |
|
procesarea limbajului natural | |
---|---|
Definiții generale | |
Analiza textului |
|
Referire |
|
Traducere automată |
|
Identificarea și colectarea datelor | |
Model tematic | |
Evaluare inter pares |
|
Interfață în limbaj natural |