Captcha

Captcha [1] (din CAPTCHA  - în limba engleză ,  testul Turing complet automatizat pentru a spune computerelor și oamenilor o parte - un test Turing  public complet automat pentru a face distincția între computere și oameni ) este un test computerizat utilizat pentru a determina dacă utilizatorul al sistemului este un om sau un computer.

Termenul „Captcha” a apărut în 2000. Ideea principală a testului este de a oferi utilizatorului o sarcină care este ușor de rezolvat de către o persoană, dar extrem de dificilă și consumatoare de timp pentru un computer. Începând cu 2013, aproximativ 320 de milioane de captchas sunt introduse în fiecare zi de către utilizatori de pe întreaga planetă [2] .

CAPTCHA  este o marcă înregistrată a Universității Carnegie Mellon , care a dezvoltat acest test.

Opțiuni de implementare

În cea mai comună versiune de captcha, utilizatorul introduce caracterele afișate în imagine (adesea cu adăugarea de zgomot sau transluciditate), dar în așa fel încât recunoașterea automată a textului este foarte dificilă. Conform standardelor general acceptate de accesibilitate la Internet pentru persoanele cu deficiențe de vedere, un astfel de captcha ar trebui completat cu o variantă bazată pe recunoașterea vorbirii (captcha audio). Există, de asemenea, captcha-uri în care trebuie să selectați imaginea corectă din listă [3] .

De asemenea, pot fi folosite și alte sarcini prost algoritmice: de exemplu, aflați ce este în imagine, marcați toate imaginile cu pisici sau răspundeți la o întrebare legată de cunoștințele sau mentalitatea oamenilor (de exemplu, ghicitoarea: „o peră atârnă , nu o poți mânca”). Cu toate acestea, recunoașterea caracterelor a devenit standard: nu este legată de nicio cultură (obstacolul principal este vederea slabă), funcționează chiar și pe browserele mobile și un utilizator experimentat recunoaște rapid o imagine ca un captcha. Captch-urile combinate sunt, de asemenea, posibile.

Defecte

Dezavantajul captcha este că nu este întotdeauna posibil să îl analizați. Din această cauză, uneori trebuie să introduceți captcha de mai multe ori.

Metode pentru trecerea captcha de către un robot

Exploatarea vulnerabilităților

Vulnerabilitatea în CAPTCHA

Să presupunem că imaginea cu numerele 1234 este numită de codul:

< img src = "/captcha.php?code=1234" />

În loc să treacă captcha, aparatul citește adresa URL și introduce răspunsul 1234 .

Cu calificări insuficiente ale unui programator web, un bot poate emite un răspuns fără a trece testul. De exemplu, conform unor informații conținute în pagină, computerul în sine, fără intervenție umană, este capabil să răspundă corect la o întrebare la care probabil doar o persoană ar putea răspunde. Sau o persoană trece testul o dată, iar computerul fabrică multe cereri cu același răspuns.

ghicind

Este folosit în principal pentru captch-uri „netradiționale” cu un număr mic de opțiuni de răspuns (1000 sau mai puțin). Robotul „ghiceste” trimițând răspunsuri aleatorii, iar unele dintre ele se dovedesc a fi corecte.

Utilizarea bazelor de date

Această abordare este eficientă atunci când întrebările sunt pregătite de administrator și nu sunt generate de mașină. Cu ajutorul bazelor de date, puteți parcurge multe opțiuni captcha netradiționale: de exemplu, marcați toate imaginile cu pisici.

Recunoaștere automată

Captcha foarte slab (folosind phpBB ca exemplu ) Decuparea luminozității este aplicată imaginii de sus (tot ce este mai întunecat decât un anumit prag devine negru, restul este alb). Granițele caracterelor sunt determinate și fiecare dintre ele este comparată cu baza caracterului. Pentru a analiza un astfel de CAPTCHA, nici măcar recunoașterea optică a caracterelor nu este necesară , deoarece are mai multe puncte slabe simultan:
  • Ușurință în separarea caracterelor de fundal folosind o cheie de culoare,
  • Ușurința de a separa personajele unele de altele,
  • Font fix și nedistorsionat.

După tăiere, se formează un model aleatoriu pe litere, deci nu există o garanție de 100% că toate caracterele vor fi recunoscute (în PWNtcha, ratingul acestui CAPTCH este de 99%). Dar restul de unu la sută este complet irelevant.

Noul thread de forum phpBB (3.xx) este implicit la un CAPTCHA îmbunătățit folosind Biblioteca de grafică GD .

Există programe (de exemplu: PWNtcha) care recunosc implementări specifice de captcha. În plus, este posibil să conectați module din programe de recunoaștere a textului de uz general (de exemplu: FineReader , OmniPage ) la programe terțe pentru recunoașterea imaginilor captcha.

În legătură cu recunoașterea automată, există conceptele de „captcha slab” și „captcha puternic”. Printre „puncte slabe” se numără un font fix, o poziție fixă ​​a caracterelor, fără distorsiuni, separarea caracterelor de fundal folosind o cheie de culoare sau estompare Gaussiană , separarea ușoară a caracterelor unele de altele etc. Cu toate acestea, uneori se întâmplă ca un captcha puternică este greu de recunoscut și pentru o persoană, ceea ce este deja o extremă inacceptabilă. Ocazional există un captcha care este ușor de citit de un computer și cu mare dificultate de către o persoană (de exemplu, cu o imagine cu contrast redus), un astfel de captcha nu corespunde deloc scopului captcha-ului ca atare.

Dacă imaginea generată s-a dovedit a fi ilizibilă, utilizatorul, de regulă, are posibilitatea de a obține una nouă. Un captcha puternic ar trebui să returneze o imagine cu un răspuns diferit [4] .

Multe variante de captcha netradiționale s-au dovedit, de asemenea, slabe - „rezistente la robot” [5] [6] .

Recunoaștere prin procură

Există o metodă de „recunoaștere” care folosește o resursă umană din site-uri foarte vizitate. Robotul descarcă captcha de pe serviciul de Internet necesar și îl prezintă vizitatorului site-ului. În schimb, vizitatorul site-ului are acces la resursă, iar robotul recunoaște codul afișat în imagine și îl introduce pe site-ul „asaltat”. Un vizitator al site-ului poate nici măcar să nu bănuiască că fiecare videoclip pe care îl urmărește se transformă în înregistrarea unei noi căsuțe poștale pentru trimiterea de spam.

Pentru a proteja (nu complet) de această metodă de ocolire a captcha, site-ul schimbă automat imaginea captcha dacă răspunsul la aceasta nu a fost introdus imediat (într-o perioadă scurtă de timp), în mod regulat de fiecare dată după o anumită perioadă de timp, sau când încearcă să înceapă un răspuns întârziat.

Există și site-uri specializate pentru schimbul sau vânzarea de captchas.

Utilitatea captcha împotriva spamului

Numai Captcha nu poate opri spammerii . Pe de altă parte, această metodă de protecție poate provoca mari neplăceri oamenilor.

În plus, captcha este abuzat, de exemplu, de găzduirea fișierelor , care aduce servicii de recunoaștere a captcha în masă și îl face și mai ineficient [7] .

Servicii CAPTCHA cunoscute

reCAPTCHA este un proiect care folosește un cuvânt ilizibil pentru OCR , care este unul dintre multele fragmente distorsionate ale cărților scanate, pe lângă un cuvânt generat de computer, ca element de lucru pentru răspunsurile utilizatorului la o solicitare captchaAcest serviciu ține cont de metodele de utilizare și de capacitățile programelor de digitizare a textelor cărților . Pentru fiabilitate, același cuvânt este oferit mai multor utilizatori de site-uri diferite. Când diferiți utilizatori dau același răspuns la o solicitare CAPTCHA, se presupune că au introdus cuvântul corect.

Vezi si

Note

  1. Ekaterina Nikolaevna Shagalova  - Dicționar al celor mai recente cuvinte străine: sfârșitul secolului XX-începutul secolului XXI; AST, 2009; p.576; ISBN 5-17-061402-0 , ISBN 978-5-17-061402-8
  2. Louis von Ahn: Massive Online Collaboration Arhivat 6 iunie 2012 la conferința Wayback Machine // TED , 2011
  3. Basec Captcha . Consultat la 4 aprilie 2015. Arhivat din original pe 4 decembrie 2017.
  4. Algoritm de verificare  . CAPTCHA.com. Preluat la 4 decembrie 2011. Arhivat din original la 16 aprilie 2013.
  5. Soluție CAPTCHA MintEye în 23 de rânduri de cod/Habrahabr . Data accesului: 21 ianuarie 2013. Arhivat din original pe 2 februarie 2013.
  6. Algoritm de recunoaștere KeyCaptcha . Arhivat din original pe 17 octombrie 2012.
  7. Întrebări frecvente Captcha - Comunitatea JD . Preluat la 3 mai 2020. Arhivat din original la 19 ianuarie 2021.

Legături