IRI ( Internationalized Resource Identifier ) este un identificator de resursă internaționalizat . În engleză, „IRI” se pronunță /aɪɑraɪ/ , în rusă se pronunță uneori [ iri ]. IRI este o scurtă secvență de caractere care identifică o resursă abstractă sau fizică în orice limbă din lume. IRI-urile sunt menite să înlocuiască URI -urile în viitor .
IRI este un șir de caractere care vă permite să identificați orice resursă: document , imagine, fișier , serviciu, căsuță de e -mail etc. În primul rând, vorbim, desigur, despre resursele Internetului și ale World Wide Web-ului . IRI-urile au fost create ca înlocuitor pentru Uniform Resource Identifier ( URI ) pentru a evita restricțiile lor de caractere: URI-urile pot conține doar caractere latine și semne de punctuație din setul de caractere US- ASCII (aproximativ 60 de caractere în total). Drept urmare, dacă dorim să folosim caractere chirilice , hieroglife sau, să zicem, caractere specifice franceze și esperanto în URI , atunci va trebui să codificăm URI -ul în același mod în care Wikipedia codifică adresele URL cu caractere Unicode . De exemplu, o linie ca:
http://ru.wikipedia.org/wiki/Cyrilliccodificat în adresa URL ca:
http://ru.wikipedia.org/wiki/%D0%9A%D0%B8%D1%80%D0%B8%D0%BB%D0%BB%D0%B8%D1%86%D0%B0Consultați adresa URL pentru detalii despre codificare .
Drept urmare, URI-urile din toate limbile bazate pe latină , cu excepția de bază, își pierd lizibilitatea umană . Acest lucru este în conflict cu principiul internaționalismului , proclamat de toate organizațiile de conducere ale Internetului, inclusiv W3C și ISOC . IRI-urile sunt concepute special pentru a rezolva această problemă. IRI-urile pot conține orice caracter Unicode (Unicode/ ISO 10646) în forma lor pură, fără nicio codificare. IRI-urile nu încalcă drepturile altor limbi și conduc la un grad mai mare de egalitate pentru utilizatorii de internet.
În caz contrar, IRI-urile sunt aproape identice cu URI-urile până acum. Există o posibilitate de conversie simplă ( mapping engleză ) între URI și IRI.
Dezvoltarea IRI a început în jurul lunii noiembrie 2001 la World Wide Web Consortium . Prima versiune a specificației a apărut în aprilie 2002 . Standardul a fost oficializat în RFC 3987 în ianuarie 2005 . Lucrările la specificația IRI sunt în desfășurare în Grupul de lucru pentru internaționalizare al World Wide Web Consortium.
În prezent, IRI este deja utilizat în următoarele tehnologii:
Există, de asemenea, o propunere de a utiliza Unicode (în format UTF-8 ) în DNS Domain Name System, un sistem pe Punycode
Pentru a identifica în mod unic o adresă, de exemplu, într-un link, va trebui să utilizați metode speciale - de exemplu, design suplimentar pentru diferite caractere cu același stil (de exemplu, caracterele A, B, E, K, M, H , O, P, C, T, X în chirilică și latină ) - diferite fonturi, culori etc., sau proprietarul, să zicem, al domeniului „example.com” va fi obligat să achiziționeze toate domeniile care conțin astfel de caractere în orice combinație, care în acest caz sunt mai multe: două „e”, „x”, „a” și „p”, pentru a evita acțiunile intrușilor care pot transmite un astfel de domeniu „mixt” ca site-ul proprietar al domeniului „example.com” și primiți informații confidențiale de la vizitatori prin intermediul formularelor.
De asemenea, va fi necesar să se înregistreze domeniile dorite în toate limbile lumii, parțial din aceleași motive. În cazul mărcilor, problema poate fi rezolvată prin mijloace legale, dar cu site-uri precum „a.com” și „a.com” situația este diferită. Va fi dificil pentru vizitator însuși să se ocupe de astfel de adrese dacă, de exemplu, acestea sunt paginile de pornire ale cuiva . Acest lucru este valabil și pentru adrese precum „dom.ru” și „dom.ru”.
niste[ cine? ] cred că limitarea unui nume de domeniu la caractere latine este la fel de naturală ca și pentru operatorii din limbaje de programare. Problema numelor de fișiere și secțiuni poate fi rezolvată cu succes de browsere: de exemplu, Opera 8.5 și Firefox 3.0 afișează adresa „ http://ru.wikipedia.org/wiki/Кириллица” în acest fel, codificând-o doar pentru a trimite o solicitare către server .