Filtru de conținut

Filtru de conținut sau program de restricționare a conținutului web (  de exemplu , software de control al conținutului sau software de filtrare web ) - un dispozitiv sau software pentru filtrarea site- urilor după conținutul lor, care nu permite accesul la anumite site-uri sau servicii de internet . Sistemul vă permite să blocați site-uri web cu conținut care nu este destinat vizionarii.

Filtrul de conținut funcționează după principiul statistic, adică numără cuvintele predefinite ale textului și determină categoria căreia îi aparține conținutul site-ului. Scopul unor astfel de dispozitive sau programe este de a restricționa accesul la internet pentru școli, afaceri, organizații religioase etc. Cel mai adesea, filtrele de conținut sunt folosite pentru a restricționa accesul copiilor și adolescenților din instituțiile de învățământ, biblioteci și locuri de muncă din diverse instituții, de asemenea cluburi de jocuri și internet cafe -uri .

Cum funcționează

Adesea, filtrarea are loc la nivelul solicitărilor HTTP . Pentru a face acest lucru, adresa URL a site-ului solicitat este verificată pe lista neagră folosind expresii regulate . Astfel de liste trebuie actualizate în mod regulat; protecția cu ajutorul lor este considerată ineficientă. Mai avansate sunt metodele de recunoaștere a modelelor și procesarea limbajului natural . Pentru a clasifica site-urile în funcție de diferite criterii (de exemplu, „pornografie/non-pornografie”, „ catalog warez / freeware ”, etc.), textul paginii solicitate este analizat pentru un număr de cuvinte cheie diferite (de exemplu, „gratuit). ”, „descărcare”, etc.). d.). Acestea și alte proprietăți ale textului sunt folosite pentru a calcula probabilitatea de a intra într-o categorie periculoasă. Dacă această probabilitate depășește un anumit nivel (de exemplu, 95%), accesul la pagină este blocat.

Cele mai simple programe vă permit să introduceți cuvinte pe care sistemul le va căuta manual. Cele mai complexe dispozitive au deja un vocabular mare și necesită o bază de referință gata făcută, care este deja clasificată. De regulă, producătorii asigură actualizarea periodică a bazei de legături pentru dispozitive complexe. Acele site-uri web care nu au fost recunoscute automat sunt vizualizate de o persoană și atribuite manual categoria site-ului.

O cerință evidentă pentru programele de restricție de acces este viteza de clasificare.

Critica

Uneori, o greșeală în evaluarea pericolului unui site duce la o restricție a accesului la informații inofensive.

Vezi și