YaCy

Versiunea actuală a paginii nu a fost încă examinată de colaboratori experimentați și poate diferi semnificativ de versiunea revizuită la 11 iulie 2020; verificările necesită 12 modificări .
YaCy
Tip de Rețea de suprapunere , motor de căutare
Dezvoltator Comunitatea YaCy
Scris in Java [1]
Sistem de operare Software multiplatformă
Prima editie 2004
Platformă hardware Mașină virtuală Java
ultima versiune 1.924 (9 februarie 2021)
Licență GNU GPL 2+ [2]
Site-ul web yacy.net
 Fișiere media la Wikimedia Commons

YaCy (din engleză  Yet another Cyberspace , Another Cyberspace ; în consonanță cu engleza.  Ya see ) este un motor de căutare descentralizat distribuit gratuit , construit pe principiul unei rețele peer-to- peer (P2P). Există versiuni pentru Windows, Linux, MacOSX. Modulul software principal , scris în Java , rulează pe câteva mii de computere (din 2011) ale membrilor rețelei YaCy. Fiecare participant la proiect explorează în mod independent Internetul, analizând și indexând paginile găsite și adaugă rezultatele indexării la o bază de date comună (așa-numitul index), care este partajată de toți utilizatorii YaCy pe o bază P2P.

Spre deosebire de motoarele de căutare parțial distribuite, rețeaua YaCy se caracterizează printr-o arhitectură descentralizată. Toate nodurile sunt echivalente și nu există un server central . Programul poate funcționa ca robot de căutare sau ca server proxy local , indexând paginile vizitate de utilizator (în timp ce ignoră paginile cu semne de date personale - cookie-uri etc.).

Accesul la funcționalitatea de căutare este oferit de un server web care rulează local, care generează o pagină de căutare cu un câmp pentru introducerea interogărilor de căutare și returnează rezultatele căutării în același format ca și alte motoare de căutare populare.

Programul este distribuit sub licență GPL . Proiectul este susținut de Free Software Foundation Europe (FSFE). [3]

Proiectul YaCy a fost fondat de Michael Christen în 2003 . 

Avantaje și dezavantaje

Beneficii

Dezavantaje

Program

Motorul de căutare este diferit de alte motoare de căutare - nu este un server central, ci un program client de rețea peer-to-peer care rulează pe mai multe computere în același timp. Rezultatele căutării sunt afișate ca o pagină web pe site- ul web local , care acționează și ca o interfață web pentru personalizarea motorului de căutare la nevoile utilizatorului.

În combinație cu sisteme P2P suplimentare, este utilizat un proxy care indexează automat paginile vizitate. Indexarea nu se efectuează în cazurile în care datele sunt transmise prin GET sau POST, sau sunt utilizate cookie -uri (cookie-uri) sau autentificare HTTP (de exemplu, pagini incluse într-o anumită zonă protejată prin parolă). [6] Acest lucru asigură că numai datele disponibile publicului sunt efectiv indexate.

Alte caracteristici

Tehnologie

Programul se bazează pe un server web, care este și un proxy de cache . Utilizatorul serverului web poate accesa shell-ul de căutare și își poate gestiona propria gazdă. Proxy-ul are un cod comun cu scanerul, ceea ce înseamnă că toate paginile vizitate prin intermediul acestuia, care nu sunt personale, sunt înregistrate automat în index în mod implicit. În plus, YaCy oferă propriul domeniu în rețeaua YaCy, care este accesibil printr-un server proxy. Solr și Lucene sunt integrate pentru căutare în YaCy (pentru versiunea 1.6, aceasta este versiunea 4.3)

Index distribuit

Spre deosebire de serviciile de partajare a fișierelor, rezultatele căutării P2P trebuie să fie disponibile imediat. Pentru a realiza acest lucru, YaCy utilizează o tabelă hash distribuită (DHT). Aceasta înseamnă că toate adresele URL și cuvintele recunoscute de program sunt trimise la noduri care sunt potrivite pentru stocarea sumelor de control corespunzătoare ale cuvintelor, nodurilor sau linkurilor. Când căutați, funcționează invers: căutarea are loc numai pe nodurile care sunt potrivite pentru stocarea hash-urilor URL-ului pentru acel cuvânt.

Astfel, doar o parte a nodurilor este folosită pentru a obține rezultatele.

Tipuri de noduri

Rețeaua YaCy este formată din patru tipuri diferite de noduri:

Incepator Aceste noduri nu pot fi găsite deoarece noul venit nu are conexiune la rețea. Astfel, te vezi doar dacă nodul este nou. Jr Gazda se află în spatele unui firewall . Alții îl clasifică drept nod junior sau potențial [7] , văd doar ultima lui cerere și nu au de unde să stabilească dacă este încă online. Senior Bătrânul poate fi accesat din exterior și este membru cu drepturi depline al rețelei YaCy. În statisticile rețelei, nodurile mai vechi care funcționează în prezent sunt numite active , inactiv- pasive . [7] Principal Unul mai vechi care aruncă o listă de semințe utilizate pentru conexiunea inițială la alte noduri.

Protocol

Protocolul YaCy constă din servlet -uri bazate pe text furnizate de serverul web încorporat la /yacy/servletname.html. Alte gazde trimit date prin parametrii GET și primesc un răspuns în text simplu, formatul exact diferă pentru servlet-uri.

Bootstrap

În timpul bootstrapping-ului, nodul încearcă să comunice cu alte noduri din rețeaua YaCy. În primul rând, sunt căutate liste de noduri. Prima adresă din superseed.txt este folosită pentru a descărca noduri YaCy stabile. seeds.txt sunt legături către alte noduri, luând astfel contact cu rețeaua YaCy. Data viitoare când porniți YaCy, gebootstrapt este creat din gazde cunoscute din rularea anterioară. În continuare, listele de noduri vor fi necesare numai atunci când majoritatea legăturilor vechi nu mai sunt disponibile.

Vezi și

Note

  1. Proiectul Yacy Open Source pe Open Hub: Pagina de limbi - 2006.
  2. GitHub  (engleză) - 2007.
  3. Căutare pe Web de către oameni, pentru oameni: YaCy 1.0 . Data accesului: 14 decembrie 2011. Arhivat din original la 30 noiembrie 2011.
  4. 1 2 3 YaCy Bugfix Versiunea 1.01 cu noi contribuții ale comunității . Preluat la 6 martie 2012. Arhivat din original la 12 februarie 2012.
  5. Statistici cantitative: grafic pentru 2011.
  6. Marea Britanie:Confidențialitate - YaCyWiki  (link în jos)
  7. 1 2 /Network.html

Literatură

Link -uri