Captcha [1] (din CAPTCHA - în limba engleză , testul Turing complet automatizat pentru a spune computerelor și oamenilor o parte - un test Turing public complet automat pentru a face distincția între computere și oameni ) este un test computerizat utilizat pentru a determina dacă utilizatorul al sistemului este un om sau un computer.
Termenul „Captcha” a apărut în 2000. Ideea principală a testului este de a oferi utilizatorului o sarcină care este ușor de rezolvat de către o persoană, dar extrem de dificilă și consumatoare de timp pentru un computer. Începând cu 2013, aproximativ 320 de milioane de captchas sunt introduse în fiecare zi de către utilizatori de pe întreaga planetă [2] .
CAPTCHA este o marcă înregistrată a Universității Carnegie Mellon , care a dezvoltat acest test.
În cea mai comună versiune de captcha, utilizatorul introduce caracterele afișate în imagine (adesea cu adăugarea de zgomot sau transluciditate), dar în așa fel încât recunoașterea automată a textului este foarte dificilă. Conform standardelor general acceptate de accesibilitate la Internet pentru persoanele cu deficiențe de vedere, un astfel de captcha ar trebui completat cu o variantă bazată pe recunoașterea vorbirii (captcha audio). Există, de asemenea, captcha-uri în care trebuie să selectați imaginea corectă din listă [3] .
De asemenea, pot fi folosite și alte sarcini prost algoritmice: de exemplu, aflați ce este în imagine, marcați toate imaginile cu pisici sau răspundeți la o întrebare legată de cunoștințele sau mentalitatea oamenilor (de exemplu, ghicitoarea: „o peră atârnă , nu o poți mânca”). Cu toate acestea, recunoașterea caracterelor a devenit standard: nu este legată de nicio cultură (obstacolul principal este vederea slabă), funcționează chiar și pe browserele mobile și un utilizator experimentat recunoaște rapid o imagine ca un captcha. Captch-urile combinate sunt, de asemenea, posibile.
Dezavantajul captcha este că nu este întotdeauna posibil să îl analizați. Din această cauză, uneori trebuie să introduceți captcha de mai multe ori.
Să presupunem că imaginea cu numerele 1234 este numită de codul:
< img src = "/captcha.php?code=1234" />În loc să treacă captcha, aparatul citește adresa URL și introduce răspunsul 1234 .
Cu calificări insuficiente ale unui programator web, un bot poate emite un răspuns fără a trece testul. De exemplu, conform unor informații conținute în pagină, computerul în sine, fără intervenție umană, este capabil să răspundă corect la o întrebare la care probabil doar o persoană ar putea răspunde. Sau o persoană trece testul o dată, iar computerul fabrică multe cereri cu același răspuns.
Este folosit în principal pentru captch-uri „netradiționale” cu un număr mic de opțiuni de răspuns (1000 sau mai puțin). Robotul „ghiceste” trimițând răspunsuri aleatorii, iar unele dintre ele se dovedesc a fi corecte.
Această abordare este eficientă atunci când întrebările sunt pregătite de administrator și nu sunt generate de mașină. Cu ajutorul bazelor de date, puteți parcurge multe opțiuni captcha netradiționale: de exemplu, marcați toate imaginile cu pisici.
După tăiere, se formează un model aleatoriu pe litere, deci nu există o garanție de 100% că toate caracterele vor fi recunoscute (în PWNtcha, ratingul acestui CAPTCH este de 99%). Dar restul de unu la sută este complet irelevant.
Noul thread de forum phpBB (3.xx) este implicit la un CAPTCHA îmbunătățit folosind Biblioteca de grafică GD .
Există programe (de exemplu: PWNtcha) care recunosc implementări specifice de captcha. În plus, este posibil să conectați module din programe de recunoaștere a textului de uz general (de exemplu: FineReader , OmniPage ) la programe terțe pentru recunoașterea imaginilor captcha.
În legătură cu recunoașterea automată, există conceptele de „captcha slab” și „captcha puternic”. Printre „puncte slabe” se numără un font fix, o poziție fixă a caracterelor, fără distorsiuni, separarea caracterelor de fundal folosind o cheie de culoare sau estompare Gaussiană , separarea ușoară a caracterelor unele de altele etc. Cu toate acestea, uneori se întâmplă ca un captcha puternică este greu de recunoscut și pentru o persoană, ceea ce este deja o extremă inacceptabilă. Ocazional există un captcha care este ușor de citit de un computer și cu mare dificultate de către o persoană (de exemplu, cu o imagine cu contrast redus), un astfel de captcha nu corespunde deloc scopului captcha-ului ca atare.
Dacă imaginea generată s-a dovedit a fi ilizibilă, utilizatorul, de regulă, are posibilitatea de a obține una nouă. Un captcha puternic ar trebui să returneze o imagine cu un răspuns diferit [4] .
Multe variante de captcha netradiționale s-au dovedit, de asemenea, slabe - „rezistente la robot” [5] [6] .
Există o metodă de „recunoaștere” care folosește o resursă umană din site-uri foarte vizitate. Robotul descarcă captcha de pe serviciul de Internet necesar și îl prezintă vizitatorului site-ului. În schimb, vizitatorul site-ului are acces la resursă, iar robotul recunoaște codul afișat în imagine și îl introduce pe site-ul „asaltat”. Un vizitator al site-ului poate nici măcar să nu bănuiască că fiecare videoclip pe care îl urmărește se transformă în înregistrarea unei noi căsuțe poștale pentru trimiterea de spam.
Pentru a proteja (nu complet) de această metodă de ocolire a captcha, site-ul schimbă automat imaginea captcha dacă răspunsul la aceasta nu a fost introdus imediat (într-o perioadă scurtă de timp), în mod regulat de fiecare dată după o anumită perioadă de timp, sau când încearcă să înceapă un răspuns întârziat.
Există și site-uri specializate pentru schimbul sau vânzarea de captchas.
Numai Captcha nu poate opri spammerii . Pe de altă parte, această metodă de protecție poate provoca mari neplăceri oamenilor.
În plus, captcha este abuzat, de exemplu, de găzduirea fișierelor , care aduce servicii de recunoaștere a captcha în masă și îl face și mai ineficient [7] .
reCAPTCHA este un proiect care folosește un cuvânt ilizibil pentru OCR , care este unul dintre multele fragmente distorsionate ale cărților scanate, pe lângă un cuvânt generat de computer, ca element de lucru pentru răspunsurile utilizatorului la o solicitare captchaAcest serviciu ține cont de metodele de utilizare și de capacitățile programelor de digitizare a textelor cărților . Pentru fiabilitate, același cuvânt este oferit mai multor utilizatori de site-uri diferite. Când diferiți utilizatori dau același răspuns la o solicitare CAPTCHA, se presupune că au introdus cuvântul corect.
Dicționare și enciclopedii | |
---|---|
În cataloagele bibliografice |
|