DataparkSearch

DataparkSearch
Tip de motor de căutare
Dezvoltator Maxim Zaharov
Scris in C
Sistem de operare FreeBSD , GNU / Linux , Sun Solaris
ultima versiune 4.54 ( 3 decembrie 2016 )
Licență Licență publică generală GNU
Site-ul web www.dataparksearch.org

DataparkSearch Engine este un motor de căutare open source scris în limbaj C. Distribuit sub licența GNU GPL . Conceput pentru a organiza căutările pe unul sau mai multe servere web .

DataparkSearch poate indexa în mod independent text, HTML și XML , precum și multe alte date folosind parsere externe .

Aparatul este pregătit pentru indexarea site-urilor multilingve: sunt acceptate multe codificări și limbi diferite, precum și detectarea automată a acestora; folosește tehnologia de reconciliere a conținutului pentru a indexa copii ale aceleiași pagini în limbi diferite; poate căuta fără a ține cont de accentele caracterelor (semnele diacritice); și împărțit în cuvinte și expresii în chineză, coreeană, thailandeză și japoneză. Este posibil să utilizați sinonime, acronime și toate formele morfologice ale cuvântului pentru a extinde rezultatele căutării.

Utilizează tehnologia proprie de clasificare a legăturilor bazată pe o rețea neuronală . Această tehnologie se numește Neo Popularity Rank. Rezultatele căutării pot fi sortate după relevanță , popularitate, data ultimei modificări și importanță (relevanță înmulțită cu popularitate).

Pentru a rafina clasamentul site-urilor, poate construi automat rezumate ale paginilor indexate, constând din cele mai importante trei propoziții.

Link -uri