Etichetă (metadate)

O etichetă este un cuvânt cheie  asociat care se referă la o informație (acestea pot fi marcaje ale browserului , imagini digitale, videoclipuri și alte fișiere ). Astfel de metadate ajută la descrierea acestor informații și la găsirea rapidă a acestora printr-o interogare de căutare . Depinde de sistemul folosit, dar în general etichetele sunt folosite fără reguli stricte și rapide de către persoana care creează sau vizualizează datele.

Etichetarea a devenit populară datorită site-urilor și serviciilor Web 2.0 folosite acolo. Acum a devenit și parte a unor programe de calculator.

Istorie

Etichetarea sau etichetarea a fost creată ca un instrument pentru a ajuta la clasificarea , marcarea apartenenței, marcarea limitelor, definirea identității . Poate fi un cuvânt, o imagine sau orice altă etichetă de identificare. Un analog în lumea reală sunt inventarele topografice și indexurile cardurilor de referință științifice ale exponatelor muzeale. Identificarea și clasificarea obiectelor și informațiilor folosind cuvinte au apărut cu mult înainte de apariția computerelor. Cu toate acestea, interogările de căutare accelerează semnificativ studiul înregistrărilor.

Bazele de date web și Internet, precum și primele site-uri de internet, folosesc etichete atunci când publică date pentru a ajuta utilizatorii finali să găsească conținut. Încă din zilele Web 1.0 , utilizatorii au acceptat conceptul de etichetă ca orice literă sau descriere a unui cuvânt și nu o mai rafina.

În 2003, site-ul social de marcaje Delicious și-a încurajat utilizatorii să adauge etichete la marcajele lor pentru a accelera căutările ulterioare. De asemenea, a devenit posibil să vedeți toate informațiile legate de o anumită etichetă într-un singur loc. Flickr a încurajat utilizatorii să adauge propriile etichete de text la fiecare dintre fotografiile lor, creând un sistem de metadate flexibil și simplu pentru a accelera căutările de imagini. Dezvoltarea cu succes a Flickr și influența Delicious a făcut ideea cunoscută pe scară largă, iar alte rețele sociale și software  - YouTube , Technorati , Last.fm  - au susținut-o. Alte aplicații de computer și de internet au adoptat și ele ideea sub formă de „etichete” în Gmail sau capacitatea de a adăuga și edita etichete în iTunes sau Winamp .

În versiunile timpurii ale site-urilor web, etichetele erau folosite de designeri pentru a informa motoarele de căutare despre conținutul paginilor. Astăzi, metaetichetele sunt folosite în aceste scopuri .

Etichetele de cuvinte cheie au fost utilizate pentru prima dată în platforma Jumper 2.0 a Jumper Networks , lansată în septembrie 2008 . A fost primul motor de căutare colaborativ care a folosit metoda de etichetare bogată în managementul cunoștințelor .

Site-urile web care folosesc etichete afișează adesea selecții de etichete populare în norii de etichete . Etichetele personalizate sunt la fel de utile atât pentru utilizatorii înșiși, cât și pentru alți vizitatori ai site-ului.

Etichetele pot avea un tip de clasificare „de jos în sus”, spre deosebire de una ierarhică „de sus în jos” . În sistemele ierarhice tradiționale bazate pe taxonomie , există un număr limitat de termeni folosiți pentru a identifica corect fiecare entitate. Etichetarea vă permite să aveți un număr nelimitat de etichete pentru clasificare. În loc să aparțină unei singure categorii, un obiect poate avea mai multe etichete diferite. Unii cercetători experimentează combinând structura ierarhică și etichetele „plate” atunci când caută informații [1] .

Exemple

Multe platforme de bloguri permit autorilor să-și eticheteze liber postările împreună cu (sau în loc de) atribuirea unei categorii. De exemplu, un articol poate fi etichetat „hochei” și „bilete”. Fiecare dintre aceste etichete devine un hyperlink care duce la o listă cu toate articolele cu acea etichetă. Un blog poate avea o bară laterală cu o listă a tuturor etichetelor de pe acel site, fiecare element ducând la o colecție aferentă. Pentru a revizui etichetele, autorul poate edita lista de etichete. Toate legăturile dintre articole și liste sunt actualizate automat de motorul blogului, eliminând nevoia de a muta manual un articol de la o categorie la alta.

Este obișnuit să se asocieze evenimente și conferințe cu etichete pentru a fi utilizate în publicații, cum ar fi bloguri, reportaje foto și prezentări. Motoarele de căutare le pot indexa pentru colecții de subiecte conexe atunci când returnează rezultate.

Cercetătorii pot lucra cu un număr mare de obiecte (citări, bibliografii, imagini) în formă digitală. Dacă este necesar, acestea pot fi legate de etichetele sau grupurile de etichete dorite.

Tipuri speciale de etichete

Etichete triple

Etichetele triple speciale sau etichetele de mașină folosesc o sintaxă specifică pentru a specifica informații semantice suplimentare despre etichete, făcându-le mai clare sau mai informative pentru procesarea programelor de calculator. Astfel de etichete constau din trei părți - spațiu de nume , predicat și valoare. De exemplu, „geo:long=50,123456” este o etichetă de longitudine geografică cu coordonata 50,123456. Acest triplu construct corespunde modelului de date al Resource Description Framework .

Etichetele triple au fost introduse pentru geolicious [2] în noiembrie 2004 pentru a afișa marcajele Delicious pe hartă . Mai târziu, au fost folosite după ce Mappr și GeoBloggers [3] au fost reproiectate pentru fotografii în Flickr .

Metadatele specializate pentru identificarea geografică sunt acum cunoscute ca geoetichetare . Etichetele de mașină sunt utilizate și în alte scopuri, cum ar fi identificarea fotografiilor anumitor evenimente sau denumirea tipurilor de nomenclatură biologică .

Hashtag -uri

Hashtag-urile sunt un tip de metadate a căror intrare începe cu un caracter #(hash). Acest tip de etichetă este comună în microblogging și rețelele sociale  - Twitter , Facebook , Google+ , VKontakte și Instagram . Principala diferență față de etichetele obișnuite este că acestea fac parte din conținutul în sine, nu din descrierea acestuia.

Etichete de cunoștințe

Etichetele de cunoștințe sunt un tip de meta -informații care descriu sau definesc un anumit aspect al resurselor informaționale (cum ar fi documente , imagini digitale , tabele de bază de cunoștințe sau pagini web ). Etichetele de cunoștințe descriu obiectele într-un mod ceva mai larg decât cuvintele cheie tradiționale neierarhice . Acesta este un tip de metadate care reprezintă cunoștințe sub formă de formulare-profile speciale care conțin o descriere, categorie, clasă, semantică, comentarii, note, note, hyperlinkuri sau referințe. Astfel de profiluri inventează informațiile aflate pe o resursă de stocare terță parte, adesea eterogenă. Etichetele de cunoștințe sunt instrumente de gestionare a cunoștințelor Enterprise 2.0 pentru înregistrarea perspectivelor , experiențelor, proprietăților, dependențelor sau relațiilor asociate cu datele de informații. În general, etichetele sunt mai flexibile decât alte sisteme de clasificare a managementului cunoștințelor.

Un inventar de cunoștințe etichetat implică multe forme diferite, de exemplu: cunoștințe faptice (găseate în cărți și date), cunoștințe conceptuale (găsite în perspective și concepte), cunoștințe evaluative (care necesită judecăți și presupuneri), cunoștințe metodologice (derivate din raționamente și strategii) . [4] Asemenea forme de cunoaștere depășesc datele și se bazează pe experiență personală, perspectivă sau judecată. Cunoașterea este informații din mintea unui individ - o înțelegere subiectivă personală a faptelor, operațiunilor, conceptelor, explicațiilor, ideilor, vederilor de ansamblu și judecăților, care pot fi sau nu unice, utile, adevărate sau structurate. Etichetele de cunoștințe extind limitele informațiilor și adaugă noi semnificații, contexte, explicații. [5] Etichetele de cunoștințe sunt valoroase pentru inteligența organizațională de protecție, care este adesea pierdută din cauza schimbării, pentru împărtășirea cunoștințelor stocate în mintea indivizilor, care sunt de obicei izolate și nevalorificate de organizație și pentru conectarea cunoștințelor care sunt adesea pierdute sau deconectate. dintr-o resursă de informare. [6]

Avantaje și dezavantaje

Într-un sistem de etichetare tipic, nu există informații fixe despre semnificațiile sau semantica fiecărei etichete; utilizatorii pot folosi cu ușurință noile etichete împreună cu cele vechi. Înrădăcinat într-o cultură sau un timp de creație, un sistem ierarhic este greu sau lent de schimbat. [7] Flexibilitatea etichetării permite utilizatorilor să-și clasifice colecțiile în orice mod consideră potrivit, dar varietatea reprezentărilor personale creează probleme în procesele de căutare și explorare.

Când utilizatorilor li se oferă libertatea de a alege etichete ( folksonomie în loc să aleagă termeni din vocabulare controlate), în metadate apar omonime (aceleași etichete cu semnificații diferite) și sinonime (etichete multiple cu același înțeles) , ceea ce poate duce la asocieri inadecvate între obiecte şi căutări zadarnice de informaţii.despre obiect. [8] De exemplu, eticheta „lock” ar putea avea ca rezultat o construcție sau un mecanism , în timp ce obiectele care se referă la versiunea nucleului Linux ar fi etichetate cu „Linux”, „kernel”, „Penguin” sau alte cuvinte. Utilizatorii pot introduce etichete în cuvinte modificate , de exemplu la singular sau la plural [9] , complicând astfel navigarea în sistemele în care nu există rădăcină . Problemele pe scară largă ale folksonomiei obligă utilizatorii să aibă grijă de o înțelegere uniformă a termenilor sistemului lor prin acceptarea unor acorduri parțiale și astfel să simplifice accesul la informații. Un alt dezavantaj este o anumită încetinire a procesorului datorită faptului că stabilirea unei corespondențe între tipul unei instrucțiuni și tipul de date, care la calculatoarele convenționale se realizează în etapa de compilare, este transferată în etapa de execuție a programului atunci când se utilizează Etichete. [zece]


Spam

Sistemele de etichetare disponibile sunt predispuse la dezordine. În speranța de a atrage vizitatori (cum ar fi pe YouTube ), oamenii etichetează informații cu un număr excesiv de etichete sau etichete care nu au nicio legătură cu subiectul informațiilor. Acest fenomen este combatet prin verificarea umană sau prin metode statistice de identificare a spam-ului. [11] O altă modalitate este de a limita numărul de etichete.

Sintaxă

Unele sisteme de etichetare au un singur câmp de text pentru introducerea cuvintelor, astfel încât acestea trebuie separate pentru analiza lexicală . Cei mai populari delimitatori sunt spațiu și virgula . Pentru a utiliza aceste caractere, sistemul trebuie să accepte delimitatori de nivel înalt, cum ar fi ghilimele sau evadarile de caractere . Unele sisteme evită cu totul delimitatorii, permițând introducerea unui singur cuvânt, crescând astfel timpul necesar pentru introducerea mai multor etichete.

Compatibilitatea sintaxelor cu HTML se realizează prin utilizarea etichetelor rel de microformat , care au o relație semantică cu o valoare „etichetă” ( rel="tag"), ceea ce înseamnă că paginile legate sunt etichete pentru o anumită informație. [12]

Vezi și

Alte

Note

  1. Tag Hierarchies Arhivat 25 iunie 2016 la Wayback Machine , note de cercetare de Paul Heymann.
  2. Maron, Mikel geo.lici.us: servicii găzduite de geotagging (5 noiembrie 2004). Data accesului: 22 mai 2016. Arhivat din original la 28 aprilie 2007.
  3. Advanced Tagging and TripleTags de reverendul Dan Catt, Geobloggers , 11 ianuarie 2006.
  4. Wiig, KM (1997), Knowledge Management: An Introduction and Perspective , Journal of Knowledge Management vol . 1 (1): 6–14, doi : 10.1108/13673279710800682 , < http://www.mendeley.com/c/ 67997727/Wiig-1997-Knowledge-Management-An-Introduction-and-Perspective/ >  
  5. Cambria, Erik și Hussain, Amir (2012), album Sentic: Sistem de gestionare a fotografiilor personale online bazat pe conținut, concept și context , Cognitive Computation vol. 4(4): 477-496 , DOI 10.1007/s12559-012 -9145-4 
  6. Alavi, Maryam & Leidner (1999), Knowledge Management Systems: Issues, Challenges, and Benefits , Communications of the Association for Information Systems vol . 1(7) , < http://www.belkcollege.uncc.edu/jpfoley/ Readings/artic07.pdf > Arhivat 25 decembrie 2010 la Wayback Machine 
  7. ^ Smith, Gene (2008). Etichetare: Metadate bazate pe oameni pentru web-ul social. Berkeley, CA: Călăreți noi. ISBN 0-321-52917-0
  8. Golder, Scott A. Huberman, Bernardo A. (2005). „ Structura sistemelor de etichetare colaborative , arhivată la 1 noiembrie 2014 la Wayback Machine ”. Laboratorul de dinamică a informațiilor, laboratoarele HP. Vizitat pe 24 noiembrie 2005.
  9. Singular vs. etichete plural într-un sistem de clasificare bazat pe etichete Arhivat din original pe 24 mai 2007. de Keith Devens, 24 decembrie 2004.
  10. Etichete și descriptori. Date autodefinite. . Arhivat din original pe 31 martie 2022.
  11. Tag Spam Arhivat 6 august 2016 la Wayback Machine , note de cercetare de Paul Heymann.
  12. rel tag microformat specification Arhivat la 20 ianuarie 2010 la Wayback Machine , Microformats Wiki, 10 ianuarie 2005.

Principal

Link -uri