Norul de etichete ( cloud de cuvinte , sau listă ponderată, prezentată vizual ) este o reprezentare vizuală a unei liste de categorii (sau etichete, numite și etichete, etichete, cuvinte cheie etc.) [1] Utilizat de obicei pentru a descrie etichete (metadate) pe site-uri web sau pentru a reprezenta text simplu. Cuvintele cheie sunt cel mai adesea cuvinte individuale, iar importanța fiecărui cuvânt cheie este indicată de dimensiunea sau culoarea fontului . Această reprezentare este convenabilă pentru perceperea rapidă a termenilor cei mai faimoși și pentru distribuirea termenilor după popularitate unul față de celălalt . Atunci când cuvintele cheie sunt folosite pentru a facilita navigarea pe site-uri web, termenii sunt hyperlinkați la conceptele care sunt înțelese prin cuvintele cheie. Cu toate acestea, cloud-ul nu poate fi singurul element de navigare, iar utilizarea căutării text este mai convenabilă pentru căutare dacă există informații mai specifice despre ceea ce căutați [2] .
În limbajul de design vizual, un nor de etichete (sau un nor de cuvinte) este un tip de „listă ponderată” utilizat în mod obișnuit pe hărțile geografice pentru a arăta dimensiunea relativă a orașelor folosind dimensiunile fonturilor. Unul dintre cele mai vechi exemple ale unei liste ponderate de cuvinte cheie în limba engleză este lista de „fișiere subliminale de computer” din romanul Slaves of Microsoft de Douglas Copeland (1995). O listă de cuvinte germane a apărut în 1992 [3] .
Reprezentarea vizuală specifică și diseminarea termenului „nor de etichete” a început în primul deceniu al secolului XXI. Ca o caracteristică a site- urilor și blogurilor din era Web 2.0 , a fost folosit în principal pentru a vizualiza distribuția frecvenței cuvintelor cheie metadate care descriu conținutul unui site web și ajută la navigare.
Primele nori de etichete de pe site-uri web proeminente au apărut pe Flickr , un site de stocare și distribuire a fotografiilor digitale . Norii de etichete au fost create de co-fondatorul și designerul Flickr Stuart Butterfield în 2004. Această implementare s-a bazat pe cartea lui James Flanagan Search Referral Zeitgeist [4] , care descrie vizualizarea link-urilor site-urilor web. Aproximativ în același timp, site-urile web Delicious și Technorati au ajutat la răspândirea norului de etichete .
Excesul de nori de tag-uri și ambivalența cu privire la utilitatea lor ca ajutoare de navigare web a dus la o scădere marcată a utilizării lor pe site-uri de pionierat [5] . (Creatorii Flickr și-au „cerat scuze” comunității web în discursul lor Webby Awards , unde pur și simplu au spus „îmi pare rău pentru norii de etichete” [6] .)
A doua generație de dezvoltare software a scos la iveală o gamă largă de aplicații pentru nori de etichete ca principale metode de vizualizare a datelor text. Au fost propuse și unele extensii ale acestor elemente de navigare. De exemplu, nori de tag-uri paralele [7] , sparkClouds [8] și nori de etichete de prefix [9] .
În acest moment, norul de etichete nu are o asemenea popularitate și, în unele cazuri, chiar afectează negativ promovarea site-ului pe motorul de căutare . Deci, dacă faceți un nor, atunci pentru un anumit scop, astfel încât să poarte o sarcină semantică pentru utilizatorii unei resurse de Internet.
Există trei utilizări principale pentru norii de etichete în software- ul social , care diferă mai mult ca scop decât ca aspect:
În primul tip de nor de etichete, dimensiunea este de câte ori o etichetă a fost aplicată unui element [10] . Acest lucru este util ca o modalitate de a afișa metadate despre un articol care a fost „votat” de mai multe ori și când nu sunt furnizate date exacte. Un exemplu de această utilizare este Last.fm (pentru a determina genul muzicii trupei) și LibraryThing (pentru a determina cuvintele cheie pentru cărți).
În al doilea tip, dimensiunea corespunde numărului de articole la care a fost aplicată eticheta, ceea ce indică popularitatea etichetei. Exemple de acest tip de nor de etichete pot fi găsite pe site-ul de stocare și distribuție a fotografiilor digitale Flickr , agregatorul RSS Technorati și tastând DeeperWeb într-o interogare de căutare Google .
Al treilea tip folosește etichete ca o modalitate de a clasifica articolele. Etichetele sunt prezentate în cloud, unde etichetele mari reprezintă numărul de articole din acea categorie.
Există mai multe abordări pentru a construi un cluster de etichete în loc de un nor de etichete, cum ar fi utilizarea etichetelor de co-ocurență în documente [11] .
Mai general, aceeași reprezentare vizuală poate fi utilizată pentru a afișa non-etichete [12] , cum ar fi un nor de etichete sau nori de date.
Termenul cloud de cuvinte cheie este uneori folosit ca termen de marketing pentru motoarele de căutare , unde se referă la grupuri de cuvinte cheie legate de un site web. În ultimii ani, norii de etichete au devenit populari datorită importanței lor în marketingul în motoarele de căutare a paginilor web, alături de a ajuta utilizatorii să navigheze eficient pe site-uri [13] . Norii de etichete, ca mijloc de navigare, vă permit să legați mai strâns resursele unui site web [14] , ocolirea unor astfel de resurse de către un robot de căutare poate îmbunătăți poziția site-ului în rezultatele motorului de căutare [15] . Din perspectiva interfeței cu utilizatorul, norii de etichete sunt adesea folosiți pentru a ajuta utilizatorul să găsească mai rapid informații despre un anumit sistem prin rezumarea rezultatelor căutării [16] .
Norii de etichete sunt de obicei prezentate ca elemente HTML inline . Etichetele pot fi sortate alfabetic, aleator, după greutate etc. Uneori sunt modificate alte proprietăți vizuale, cum ar fi culoarea, luminozitatea sau lățimea, pe lângă dimensiunea fontului [17] . Cea mai comună reprezentare este sub forma unui dreptunghi, în care etichetele sunt ordonate alfabetic și afișate rând cu linie. Alegerea locației etichetei în linii se potrivește obiectivelor utilizatorului. Uneori se acordă preferință grupării etichetelor semantice (etichetele similare ca semnificație vor fi afișate una lângă alta) [18] [19] [20] . Euristica poate fi utilizată pentru a reduce dimensiunea norului de etichete, indiferent dacă se realizează sau nu clusterizarea .
Un nor de date este date care utilizează o culoare și/sau o dimensiune diferită a fontului pentru a reprezenta datele numerice [21] . Norii de date sunt similari norilor de etichete [22] , dar în loc de numărare a cuvintelor, sunt afișate date precum densitatea populației sau prețurile bursiere .
Un nor de text sau un nor de cuvinte este o vizualizare a frecvenței cuvintelor dintr-un text ca o listă ponderată [24] . Recent, această tehnică a fost folosită pentru a vizualiza conținutul tematic al discursurilor politice [25] .
Dezvoltând principiile norilor de text , norii de cuvinte oferă un aspect mai concentrat textului sau compoziției . În loc de întregul text, norul de fraze se concentrează pe utilizarea cuvintelor individuale. Norul rezultat conține cuvinte care sunt adesea folosite în combinație cu cuvântul original. Aceste expresii reprezintă frecvența evidențiată de dimensiunea fontului, împreună cu puterea legăturii evidențiate de luminozitate. Acest lucru vă permite să învățați interactiv limba [26] .
Norii de etichete au fost studiati în mai multe studii pentru utilizarea lor. Următoarea listă se bazează pe cercetările lui Lohmann et al.:
În general, dimensiunea fontului unei etichete dintr-un nor de etichete este determinată de prevalența etichetei. Pentru un nor de cuvinte, cum ar fi categoriile de blog, frecvența corespunde numărului de postări de blog atribuite categoriei respective. Pentru frecvențe mai mici, puteți specifica direct dimensiunile fontului, de la unul la dimensiunea maximă a fontului utilizată. Pentru frecvențe mai mari, scalarea este necesară . De exemplu, folosind o transformare liniară, greutatea unei etichete este scalată pe o scară de multiplicatori de la 1 la f , unde și se determină intervalul de greutăți permise.
pentru ; in caz contrar
Deoarece numărul de elemente numărate per etichetă este de obicei distribuit conform unei legi de distribuție exponențială [29] , prin urmare, pentru intervale mari de valori, este logic să se utilizeze o reprezentare logaritmică [30] .
Implementarea norului de etichete include, de asemenea, analizarea și filtrarea etichetelor inutile, cum ar fi prepozițiile, pronumele, numerele și semnele de punctuație.
Există, de asemenea, site-uri web care creează nori de etichete artificiali sau distribuiti aleatoriu în scopuri publicitare sau umoristice.