Adresă URL care poate fi citită de om

Adresa URL ușor de înțeles de către om (abreviar CNC , de asemenea URL semantic , URL prietenoasă în engleză   ) este o cale URL constând din cuvinte ușor de înțeles [1] [2] [3] [4] , în loc de identificatori și care reflectă structura fișierului a site-ului . De exemplu, în loc de sau va fi . /c14/3/97//index.php?cat=10&subcat=2&id=41/product/phone/Samsung/

Căile ușor de înțeles de om îmbunătățesc uzabilitate În plus, ele permit numelui link-ului să presupună conținutul paginii de pe acesta [5] [1] [6] și să reprezinte structura site-ului [1] [6] .

Din punct de vedere tehnic, o adresă URL poate conține doar litere latine și unele simboluri. Toate celelalte caractere, inclusiv literele rusești, sunt codificate ( codare procentuală ) și pot arăta ca %D0%9B%D1%83%D0%BA. Prin urmare, de obicei litere latine sunt folosite în adrese pentru a evita complicațiile utilizatorilor [7] .

Concept

Adresele URL semantice sunt concepute pentru a îmbunătăți gradul de utilizare și accesibilitatea unui site web sau a unui serviciu web , fiind în același timp naturale și intuitive pentru utilizatorii nespecializați . Astfel de scheme URL caută să reflecte structura conceptuală a unui set de informații și să decupleze interfața cu utilizatorul de reprezentarea internă a informațiilor de pe server. Alte motive pentru utilizarea URL-urilor curate includ optimizarea motorului de căutare (SEO) [8] , conformarea cu o arhitectură software în stil REST și asigurarea faptului că resursele web individuale rămân constant la aceeași adresă URL. Acest lucru face ca World Wide Web să fie un sistem mai stabil și mai util și oferă marcaje de resurse web mai durabile și mai fiabile ( URL marcabil ) care nu vor primi cookie -uri sau date de sesiune de la alt computer [9] .

De asemenea, URL-ul semantic nu conține detaliile de implementare ale aplicației web pe care se bazează pagina. Acest lucru beneficiază de reducerea complexității modificării implementării resursei la un moment dat. De exemplu, multe adrese URL non-semantice includ numele de fișier al unui script de pe server , cum ar fi example.php , example.asp sau cgi-bin . Dacă implementarea de bază a resursei s-ar modifica, acele adrese URL ar trebui să se schimbe odată cu aceasta. De asemenea, atunci când URL-ul este non-semantic, dacă baza de date a site-ului a fost mutată sau restructurată, exista posibilitatea ca link-uri întrerupte atât de la site-uri interne, cât și de la cele externe, acestea din urmă ar putea duce la eliminarea lor din listările motoarelor de căutare . Utilizarea unui URL semantic oferă diferiților agenți de utilizator o locație consecventă pentru resurse independente de structura internă. Un alt beneficiu potențial al utilizării URL-urilor semantice este că ascunderea informațiilor interne ale serverului sau aplicației poate îmbunătăți securitatea sistemului .

Adresa URL prietenoasă nu conține multe caractere suplimentare [10] (cum ar fi ?sau &[5] ). Această adresă URL este mai memorabilă, iar utilizatorul poate deduce ce va fi afișat pe pagina [5] .

„Adresele URL care pot fi citite de oameni” implică scurtarea adreselor paginilor pentru a fi cât mai concise și de înțeles posibil. Ele creează o aparență de structură logică de date naturală pentru o persoană de pe server, prezentând-o sub forma unei structuri ierarhice (de tip arbore), similară unui sistem de fișiere . Astfel de adrese sunt mai ușor de citit, înțeles și reprodus. În plus, ajută la navigarea în structura logică a site-ului, doar privind imbricarea directoarelor. Nu este necesar să mergeți pe pagină pentru a afla ce este postat pe ea. În unele cazuri, pentru a merge în directoarele părinte, trebuie doar să ștergeți adresa în locul potrivit, iar pentru a merge la pagina principală, totul este șters, cu excepția numelui de domeniu .

Astfel de adrese sunt afișate de motoarele de căutare direct în rezultatele căutării [11] , inclusiv căutările de cuvinte cheie la aceste adrese . CNC este utilizat în metodele de optimizare a motoarelor de căutare ( SEO ) .

Titlu

Utilizarea adreselor URL complexe în locul directoarelor „lizibile de către om” s-a remarcat deja în primele 10 greșeli de design web în 1996 [12] . În 1998, Tim Berners-Lee a scris un articol despre „URI-uri cool”. Artemy Lebedev a scris despre o adresă URL curată și de înțeles în martie 2000 în Ghid. Termenul „NC” înseamnă „URL înțeles de om”, o altă opțiune - litere. „url ușor de înțeles uman”, unde argoul „url” este adresa URL [13] . Versiunea principală a apariției acestui termen în limba rusă este aceea că, în septembrie-noiembrie 2000, nota „CNC și PHP” de pe un blog personal [14] a fost publicată ca articol pe mai multe site-uri de programare web specializate, iar prevalența ulterioară a link-urile către acest articol au dat naștere utilizării pe scară largă a acestui termen.

Google numește o astfel de adresă „adresă URL simplă de înțeles” [3] sau „adresă URL simplă” [15] . Microsoft SharePoint folosește adresa URL prietenoasă cu termenii numelui sau adresa URL cu text integral. Alte nume folosite sunt: ​​URL semantic (lit. URL semantic), URL curat [16] , URL RESTful , URL destul de , URL prietenos [17] (FURL), URL prietenos pentru motorul de căutare (URL SEF) [18] [19] , Adresă URL prietenoasă pentru optimizarea motoarelor de căutare (URL prietenos cu SEO) , adresă URL prietenoasă pentru oameni, adresă URL ușor de utilizat și adresă URL care poate fi citită de oameni .

Structura

De obicei, o adresă URL non-semantică constă dintr-o cale , un nume de script și un șir de interogare . Parametrii șirului de interogări definesc conținutul afișat pe pagină și includ adesea informații greu de înțeles sau care nu sunt relevante pentru utilizatori, cum ar fi identificatori numerici interni pentru valorile din baza de date , „ codificare procentuală ”, ID-uri de sesiune , detalii despre implementări și așa mai departe. URL-urile semantice, pe de altă parte, conțin doar calea resursei, care reflectă o structură logică în ierarhie, astfel încât utilizatorii să o poată interpreta și manipula cu ușurință.

Organizarea conținutului ar trebui să fie astfel încât URL-urile să aibă o structură logică [4] . În CNC, motoarele de căutare au o mai bună înțelegere a imbricației [2] . Prin eliminarea părții obscure „inutile” a adresei URL non-NC, utilizatorul primește un link întrerupt [3] . Pentru a trece prin nivelurile ierarhiei structurii site-ului, ei folosesc și un CNC similar, duplicând navigarea [6] . Dacă ultimul cuvânt din CNC este șters înaintea barei oblice , utilizatorul va fi plasat într-o categorie superioară [2] . URL-ul poate afișa calea de la un director de pe server la un fișier. În același timp, CNC-ul trebuie să conțină aceleași informații pentru același fișier pe care le primește scriptul non-CNC în linia de parametri [8] . Pentru a face acest lucru, utilizați diferite moduri de a rescrie adresa URL .

Adresă URL non-semantică URL semantic
http://example.com/index.php?page=name http://example.com/name
http://example.com/index.php?page=consulting/marketing http://example.com/consulting/marketing
http://example.com/products?category=2&pid=25 http://example.com/products/2/25
http://example.com/cgi-bin/feed.cgi?feed=news&frm=rss http://example.com/news.rss
http://example.com/services/index.jsp?category=legal&id=patents http://example.com/services/legal/patents
http://example.com/kb/index.php?cat=8&id=41 http://example.com/kb/8/41
http://example.com/index.php?mod=profiles&id=193 http://example.com/profiles/193
http://en.wikipedia.org/w/index.php?title=Semantic_URL http://en.wikipedia.org/wiki/Semantic_URL

Optimizare pentru motoarele de căutare (SEO)

Adresa URL trebuie să fie scurtă și descriptivă și poate conține cratime între cuvinte în loc de liniuțe de subliniere. Evitarea caracterelor speciale se datorează și faptului că roboții de căutare nu indexează adresa URL în continuare ?, presupunând că nu există informații valoroase după aceasta. [douăzeci]

În tehnicile de optimizare a motoarelor de căutare ( SEO ), CNC-ul este umplut cu cuvinte cheie relevante care descriu pe scurt conținutul [21] și cuvintele irelevante sunt eliminate. Cuvintele obișnuite care sunt eliminate includ articole și conjuncții , în timp ce cuvintele cheie descriptive sunt adăugate pentru a crește ușurința de utilizare și pentru a îmbunătăți clasamentul în motoarele de căutare [8] .

Posibile probleme

Implementare

Implementarea URL-urilor semantice include „mapping URL” prin potrivirea modelelor sau „Rewrite engine”  - metode transparente de rescriere a URL -urilor. Deoarece acest lucru se întâmplă de obicei pe partea serverului, adesea singura formă vizibilă pentru utilizator va fi URL-ul semantic.

Identificatorul de fragment poate fi inclus la sfârșitul adresei URL semantice pentru link-urile din pagină și nu trebuie să fie înțeles de utilizator. [23]

Slug

Unele sisteme definesc un slug ca parte a unei adrese URL care identifică o pagină în cuvinte cheie care pot fi citite de om [24] [25] De obicei este partea de sfârșit a URL-ului, care poate fi interpretată ca numele resursei în sine, ca numele de bază într- un nume de fișier sau titlu de pagină. Acest nume „slug” provine din utilizarea de către mass -media a cuvântului slug

De obicei, slug-ul este generat automat din titlul paginii, dar poate fi și introdus sau modificat manual, astfel încât, în timp ce titlul paginii rămâne destinat pentru afișare și lizibilitate umană, slug-ul său poate fi optimizat pentru concizie sau pentru procesarea motorului de căutare. Titlurile lungi ale paginilor pot fi, de asemenea, trunchiate pentru a menține adresa URL finală la o lungime rezonabilă.

Practic, slug-ul se face în întregime cu litere mici, caracterele diacritice sunt înlocuite cu litere latine, iar caracterele cu spații albe sunt înlocuite cu cratime sau liniuțe de subliniere pentru a evita „codarea procentuală”. Semnele de punctuație sunt în mare parte eliminate, la fel ca unele cuvinte scurte comune, cum ar fi conjuncțiile . De exemplu:

Implementare pe diverse servere

Interpretarea adreselor paginilor, așa cum s-a menționat mai sus, este gestionată de server și de software-ul site-ului. Fiecare implementare de server are propriul modul care implementează această funcționalitate.

Pe serverul IIS , această funcționalitate este implementată de modulul gratuit URLRewriter. În același timp, există un modul mod_rewrite pentru serverul Apache , care este configurat prin fișierul .htaccess .

De exemplu, prin specificarea următorului cod, webmasterul va putea primi toți parametrii trecuți în PHP printr-un array $_SERVER['REQUEST_URI'], iar punctul de intrare pentru orice solicitare va fi index.php [26] .

Motor de rescrie pornit RewriteCond %{REQUEST_FILENAME} !-f RewriteCond %{REQUEST_FILENAME} !-d RewriteRule ^(.*)$ index.php [L,QSA]

În cadrele web ( CodeIgniter , Django , Node.js , Ruby on Rails sau Zend Framework ), serverul web nu accesează scriptul, ci se uită la un fișier special pentru setările căii specificate. O astfel de cale este indicată fie prin expresii regulate, fie într-un limbaj special.

De exemplu, în Ruby on Rails, pentru a specifica că o metodă de clasă va fi apelată la un apel /users/loginși o  metodă de showclasă userspe un caz , se folosește următorul cod: /users/indexusers

Sine :: Aplicație . trasee . draw do get 'users' , to : 'users#index' get 'users/:id' , to : 'users#show' end

În unele instrumente web, astfel de constructe nu sunt necesare, iar toate adresele depind de metoda clasei și sunt determinate de numele acesteia și de numărul de argumente.

De exemplu, așa funcționează Ramaze . Când apelați show/id/, unde id este o variabilă (în acest caz, clasa trebuie să fie un controler):

class CommentsController < Ramaze :: Controller def index # Creați sfârșitul listei de comentarii def show ( id ) # Afișează un comentariu cu sfârșitul ID - ului dorit

Vezi și

Note

  1. 1 2 3 § 48. Luptăm pentru puritatea url-urilor .
  2. 1 2 3 Google Inc. Ghid de pornire pentru optimizarea motoarelor de căutare . - S. 8 .
  3. 1 2 Structura URL .
  4. 1 2 3 Rob Allen, Nick Lo, Steven Brown. Cadrul Zend în acțiune . — Manning, 2009-01-01. - S. 27. - 438 p. — ISBN 9781933988320 .
  5. 1 2 3 § 49. Navigare duplicat .
  6. Tim Berners-Lee. Publicare electronică și viziuni ale hipertextului  // Physics World. - 1992-06. - T. 5 , nr. 6 . — S. 14–18 . — ISSN 2058-7058 0953-8585, 2058-7058 . - doi : 10.1088/2058-7058/5/6/16 .
  7. 1 2 3 Opitz, Pascal Curățați adresele URL pentru o mai bună clasare în motoarele de căutare . Content with Style (28 februarie 2006). Consultat la 9 septembrie 2010. Arhivat din original pe 6 ianuarie 2012.
  8. Berners-Lee, Tim Cool URI-urile nu se schimbă . Ghid de stil pentru hipertext online . W3C (1998). Preluat: 6 martie 2011.
  9. Quentin Zervaas. Aplicații practice Web 2.0 cu PHP . — Apress, 11-03-2008. - S. 5. - 580 p. — ISBN 9781430204756 .
  10. Sefurl - Localizator de resurse uniform pentru motoarele de căutare  (germană) .
  11. Nielsen, Iacob . Original Top 10 greșeli în design web . www.nngroup.com (1996-05-1). Data accesului: 16 iunie 2017.
  12. Andrey Dykan. Client SEO . — Litri, 20-02-2016. - S. 323. - 414 p. — ISBN 9785040002634 .
  13. Spectator.ru - Nota nr. 161 - CNC și PHP (5 septembrie 2000). Consultat la 16 iunie 2017. Arhivat din original la 17 februarie 2001.
  14. Google Inc. Ghidul pentru începători pentru optimizarea motoarelor de căutare . - S. 8 .
  15. Pasul 6: Configurați adrese URL curate .
  16. URL prietenos .
  17. Cum se creează o structură URL compatibilă cu SEO .
  18. Jennifer Marriott, Alyn Waring. URL SEF // Joomla! 3.0. Ghid oficial . - Sankt Petersburg. : Editura Piter, 2013. - S. 464. - 496 p. — ISBN 9785496006637 .
  19. ↑ Factorii Hussien AS afectează optimizarea motoarelor de căutare  // Jurnalul Internațional de Știința Informatică și Securitatea Rețelelor (IJCSNS). - 2014. - T. 14 , Nr. 9 . - S. 29 .
  20. Duane Forrester. Transformați clicurile în clienți: tehnici de marketing dovedite pentru transformarea traficului online în venituri: dovedite . — McGraw Hill Professional, 2010-01-08. - S. 14. - 238 p. — ISBN 9780071638685 .
  21. RFC 3986 - Caractere nerezervate .
  22. Uniform Resource Identifier (URI): Sintaxă generică . RFC 3986 . Grupul operativ de inginerie a internetului. Preluat: 2 mai 2014.
  23. Slug în glosarul WordPress
  24. Slug în glosarul Django .
  25. CNC în PHP. Stai departe de regulile ModeRewrite. Punct unic de intrare .

Link -uri