Webometrics ( ing. webometrics ) este o secțiune de informatică , în cadrul căreia sunt explorate aspectele cantitative ale proiectării și utilizării resurselor informaționale, structurilor și tehnologiilor în relație cu World Wide Web [1] .
Termenul a fost introdus de Tomas C. Almind și Peter Ingwersen în 1997 în Informetric analysis on the World Wide Web: Methodological approaches to "webometrics" [2] .
Webometria este o componentă a infometricei .
De la mijlocul anilor 90, Cybermetrics Lab a fost implicat în cercetarea webometrică și clasarea site-urilor web ale universităților din întreaga lume .
Webometrics include patru domenii principale de cercetare:
Webometria este una dintre componentele infometricii. În plus, webometria este legată de bibliometrie și se suprapune într-o anumită măsură cu scientometria [1] .
Infometria este o disciplină științifică, al cărei subiect este măsurarea cantitativă a informațiilor stocate și utilizate [4] .
Bibliometria este o disciplină științifică care se ocupă cu studiul documentelor pe baza unei analize cantitative a surselor primare și secundare de informații folosind metode formalizate în vederea obținerii de date privind eficacitatea, dinamica, structura și modelele de dezvoltare a ariilor studiate [4]. ] .
Scientometria este o disciplină științifică care studiază metode cantitative pentru dezvoltarea științei ca proces informațional [5] .
Cibermetria este o disciplină științificăcare se ocupă cu analiza cantitativă a noilor posibilități de prelucrare a informațiilor stocate în formă electronică și vizualizarea acesteia [6] .
Laboratorul Spaniol de Cybermetrics a dezvoltat o metodologie pentru clasarea resurselor web ale universităților și institutelor de cercetare.
În conformitate cu această metodologie , un algoritm de clasare a site -ului este construit pe baza a patru indicatori [7] :
Indicator | Abreviere | Sens | motoare de căutare |
---|---|---|---|
Vizibilitate | V | Numărul de link-uri de pe alte site-uri | Google, Yahoo, Live Search și Exalead |
mărimea | S | Numărul total de pagini ale site-ului | Yahoo Search, Live Search și Exalead |
Fișiere bogate | R | Numărul de fișiere text integral | |
Savant | sc | Numărul de articole postate pe site și citările acestora | Google Academic |
Site-urile sunt clasificate în funcție de următorul algoritm:
Există o serie de deficiențe în activitatea metodei de clasificare a site-urilor web propusă de Cybermetrics Lab [7] :
Legături primite - numărul de pagini web care leagă la această pagină web sau la acest site web [9] . Acest indicator este folosit ca indicator al semnificației unei anumite pagini web de către algoritmii PageRank și HITS . Acești algoritmi se bazează pe găsirea de pagini care sunt relevante pentru interogarea de căutare și pe clasarea ulterioară a listei rezultate, ținând cont de linkurile primite. Paginile cu cele mai multe link-uri de intrare se clasează mai sus. În continuare, lista paginilor web este sortată în funcție de rangul lor.
Unele hyperlinkuri pot fi create doar în scopul navigării între site-uri. Astfel de hyperlinkuri ar trebui ignorate, deoarece nu determină valoarea paginii web țintă. În plus, pe unele site-uri pot exista repetiții multiple ale acelorași link-uri. În acest caz, o singură legătură de intrare ar trebui luată în considerare și toate celelalte trebuie ignorate.
Deoarece metodologia de clasificare a resurselor web propusă de Cybermetrics Lab are o serie de dezavantaje [7] și, în plus, nu utilizează motoarele de căutare rusești (de exemplu, Yandex ), proiectele sunt dezvoltate în Rusia pentru a-și crea propriile evaluări webometrice ale științifice. instituții, fără dezavantajele de mai sus.
Sub conducerea lui Andrei Anatolyevich Pechnikov a fost creat evaluarea webometrică a instituțiilor științifice din Rusia [10] . Acest proiect implică numai site-urile web oficiale ale instituțiilor științifice din Rusia. Clasamentul se bazează pe metodologia propusă de Cybermetrics Lab, dar ținând cont de utilizarea motorului de căutare rusesc Yandex și a crawler-ului BeeCrawler [ 11] . Metodologia utilizată pentru clasarea site-urilor este descrisă în lucrarea „Cu privire la evaluarea site-urilor oficiale ale instituțiilor științifice din nord-vestul Rusiei” [12] .
Unul dintre proiectele acestui institut este realizarea Evaluării site-urilor instituțiilor științifice ale SB RAS , sub conducerea lui Yu. I. Shokin . Pentru a calcula numărul de linkuri externe (V) și numărul de pagini de pe site (S), pe lângă motoarele de căutare Google și Yandex, este folosit și Bing [13] . Pentru a găsi valoarea rezultată a lui V și S este media aritmetică. Pentru a găsi indexul de citare (Sc), sunt folosite Google Scholar și Yandex Citation Index. Metodologia utilizată pentru clasarea site-urilor este descrisă în lucrarea „Evaluarea site-urilor organizațiilor științifice ale filialei din Siberia a Academiei Ruse de Științe” [14] .
Sub îndrumarea doctorului în științe tehnice A. B. Antopolsky, a fost creat Indexul webometric al universităților și institutelor de cercetare din Rusia . Listele oficiale ale instituțiilor postate pe portalurile academiilor de stat și o listă a instituțiilor de învățământ acreditate sunt folosite ca surse pentru lista resurselor web analizate [15] . Pentru formarea indicelui se folosesc principalii indicatori webometrici [16] . Indicatorii V, S și R se bazează pe rezultatele muncii motoarelor de căutare Google și Yandex, iar indicatorul Sc este calculat pe baza citației instituției conform RSCI . Metodologia de clasare a site-urilor utilizată este descrisă în lucrarea „Măsurarea prezenței instituțiilor de învățământ pe internet” [17] .
Serviciul de cercetare webometrică pentru site-uri științifice este conceput pentru a analiza site-urile organizațiilor științifice ale filialei din Orientul Îndepărtat a Academiei Ruse de Științe, Departamentului de Științe ale Pământului al Academiei Ruse de Științe și alte site-uri științifice. Serviciul a fost creat sub îndrumarea d.g.-m.s. Naumova V.V. Motoarele de căutare Google, Yandex, Bing și Yahoo [18] sunt utilizate pentru a calcula principalii indicatori webometrici . Următoarea formulă este utilizată pentru a calcula rangul webometric:
Metodologia utilizată pentru clasarea site-urilor este descrisă în lucrarea „Spațiul de informații al filialei din Orientul Îndepărtat al Academiei Ruse de Științe” [19] .
Evaluarea site-urilor web ale universităților și institutelor oferă universităților cele mai complete informații actualizate despre starea site-urilor lor web în ceea ce privește webometria. Pentru a face acest lucru, evaluarea este actualizată săptămânal și istoricul modificărilor indicatorului este salvat. Metodologia de calcul al ratingului este similară cu metodologia Cybermetrics Lab. Rangul webometric se calculează după următoarea formulă [20] :
Calculul principalilor parametri webometrici se poate baza pe rezultatele diferitelor motoare de căutare. Mai jos este un tabel comparativ cu utilizarea motoarelor de căutare de către fiecare dintre instituțiile de mai sus și numărul de resurse web procesate de acestea.
institut | Vizibilitate | mărimea | Fișiere bogate | Savant | Numărul de resurse web procesate |
---|---|---|---|---|---|
Institutul de Cercetări Matematice Aplicate KarRC RAS | Google, BeeCrawler | Yandex, Google, BeeCrawler | Yandex, Google | Google Academic | 343 (2013) [21] |
Institutul de Tehnologii Computaționale SB RAS | Yandex, Google, Bing | Yandex, Google, Bing | Yandex, Google | Yandex Citation Index, Google Scholar | 94 (2013) [22] |
Institutul de Informații Științifice și Pedagogice al Academiei Ruse de Educație | Yandex, Google | Yandex, Google | Yandex, Google | Citarea instituției conform RSCI | 1843 (2012) [23] |
Institutul Geologic din Orientul Îndepărtat, Filiala din Orientul Îndepărtat a Academiei Ruse de Științe | Google, Yandex, Bing, Yahoo | Google, Yandex, Bing, Yahoo | Google, Yandex, Bing, Yahoo | Google Academic | 121 (2013) [24] |
Universitatea Federală Siberiană SibFU | SEO majestuos | Google Academic | 657 (2013) [25] |