Analiza citărilor este studiul frecvenței, modelelor și orarului citărilor din documente. Folosește modelul de citat, legături de la un document la altul, pentru a descoperi proprietățile documentelor. Un obiectiv tipic este identificarea celor mai importante documente dintr-o colecție. Un exemplu clasic este citarea dintre lucrările academice și cărți. [1] [2] Hotărârile judecătorești din sistemul juridic anglo-saxon , pentru a-și confirma deciziile, se referă la hotărâri luate în cauze anterioare, deci este importantă analiza citării în context juridic. Un alt exemplu sunt brevetele care conțin invenții anterioare, brevete citate anterior referitoare la revendicarea actuală.
Documentele pot fi asociate cu multe alte caracteristici în afară de citări, cum ar fi autori, editori, reviste, precum și textele lor reale. Analiza generală a colecțiilor de documente se numește bibliometrie , iar analiza citațiilor este o parte cheie a acestei direcții. De exemplu, legătura bibliografică și partajarea sunt valori asociate bazate pe analiza citărilor (citări partajate sau citate partajate). Citările dintr-o colecție de lucrări pot fi, de asemenea, prezentate sub forma următoarelor grafice de citare, așa cum a remarcat Derek de Solla Price în articolul din 1965 „Networks of Scientific Papers”. [3] Aceasta înseamnă că analiza citărilor se bazează pe aspecte ale analizei rețelelor sociale și ale științei rețelelor.
Un exemplu timpuriu de indexare automată a citărilor a fost CiteSeer , care a fost folosit pentru citări în rapoartele științifice, iar Google Scholar este un exemplu de sistem modern care include mai mult decât cărți și articole academice și reflectă o gamă mai largă de surse de informații. Astăzi, indexarea automată a citărilor [4] a schimbat natura cercetării de analiză a citărilor, permițând analizarea a milioane de citate pentru modele la scară largă și descoperirea cunoștințelor. Instrumentele de analiză a citărilor pot fi folosite de oamenii de știință pentru a calcula diferite grade de impact pe baza datelor indicelui de citare . [5] [6] [7] Ei au aplicații care variază de la identificarea judecătorilor experți la revizuirea documentelor și a propunerilor de granturi, până la furnizarea de date transparente pentru a sprijini deciziile privind meritul academic, mandatul și luarea deciziilor. Această competiție pentru resurse limitate poate duce la un comportament discutabil din punct de vedere etic pentru citări crescute. [8] [9]
Practica utilizării naive a analizei citărilor pentru a compara impactul diferitelor articole științifice fără a lua în considerare alți factori care pot influența tiparele de citare a fost puternic criticată. [10] Dintre critici, una se concentrează în mod constant pe „independența industriei”, și anume faptul că practicile de citare dintr-un domeniu al științei diferă de practica din altul și chiar între ramurile de cercetare din cadrul unei discipline. [unsprezece]
În timp ce indicii de citare au fost dezvoltați inițial pentru regăsirea informațiilor , ei sunt din ce în ce mai folosiți pentru studii bibliometrice și alte studii care implică evaluarea cercetării. Datele de citare sunt, de asemenea, baza coeficientului de influență al unui jurnal popular .
Există o mulțime de literatură despre analiza citărilor, uneori denumită scientometrie , un termen inventat de Vasily Nalimov , sau mai precis bibliometrie . Industria a început să înflorească odată cu apariția Science Citation Index, care acoperă literatura publicată din 1900. Cele mai importante reviste din industrie sunt Scientometria , Informatica și Jurnalul Asociației pentru Știința și Tehnologia Informației. Acesta din urmă organizează și o listă de corespondență electronică numită Sigmetrica la ATIT. [12] Această metodă este reînviată prin adoptarea pe scară largă a bazelor de date, abonamentele Web Science și Scopus la multe universități și instrumente publice gratuite de citare, cum ar fi CiteBase, CiteSeerX , Google Scholar și fostul program Windows Live Academic (acum disponibil cu funcții suplimentare precum la fel ca Microsoft Academic Search). Metodele de cercetare a analizei citatelor includ abordări calitative, cantitative și computaționale. Obiectivele principale ale unor astfel de studii scientometrice au fost evaluarea performanței, clasamentele de cercetare instituțională, clasificarea revistelor [13] cu privire la stabilirea factorilor de performanță și a standardelor de proprietate, [14] evaluarea impactului lucrărilor științifice de top, [15] urmărirea traiectoriei unei științe sau industria tehnologiei [16] , și dezvoltarea profilurilor autorilor și instituțiilor de frunte în ceea ce privește rezultatele cercetării. [17]
Analiza citației legale este o tehnică de analiză a citațiilor pentru analiza documentelor juridice care facilitează înțelegerea documentelor normative conexe prin examinarea citațiilor care leagă o prevedere de alte dispoziții din același document sau între documente diferite. Analiza citațiilor legale utilizează un grafic de citare preluat dintr-un document de reglementare care poate completa descoperirea electronică, un proces care influențează inovația tehnologică în analiza datelor mari . [18] [19] [20] [21]
Într-o lucrare din 1965, Derek de Solla Price a descris proprietatea inerentă de legare a SCI ca „o rețea de lucrări științifice”. Legăturile dintre citate și lucrările citate au devenit dinamice când SCI a început să publice online. Social Science Citation Index a fost una dintre primele baze de date instalate în sistemul Dialog [22] în 1972. Odată cu apariția CD-urilor, referințele au devenit și mai simple, permițând utilizarea legăturilor bibliografice pentru a găsi înregistrări aferente. În 1973, Henry Small și-a publicat lucrarea clasică despre analiza co-citării, care a devenit un sistem de clasificare auto-organizat care a condus la experimente cu gruparea documentelor și, în cele din urmă, la Atlasul științei, care mai târziu a devenit Research Reviews.
Natura topologică și grafică inerentă a rețelei mondiale de citate care este inerentă literaturii științifice a fost descrisă de Ralph Garner (Universitatea Drexel) în 1965. [23]
Utilizarea scorurilor de citare în reviste clasificate a fost o practică obișnuită în prima jumătate a secolului al XIX-lea, dar măsurarea sistematică continuă a acestor scoruri pentru reviste academice a fost inițiată de Eugene Garfield de la Institutul pentru Informații Științifice, care a devenit și sursa principală. pentru utilizarea acestor scoruri pentru a evalua autorii și articolele. Într-o lucrare de referință din 1965, el și Irving Sher au arătat relația dintre frecvența și creșterea citărilor, demonstrând că câștigătorii Premiului Nobel și-au publicat lucrările de cinci ori în medie, în timp ce lucrările lor au fost citate de 30-50 de ori în medie. Garfield a raportat acest fenomen într-o serie lungă de eseuri despre Nobel și alte premii. Scorul final obișnuit este cunoscut sub numele de raportul de influență , numărul de citări în reviste în ultimii doi ani împărțit la numărul de articole publicate în acei ani. Este utilizat pe scară largă atât în scopuri obișnuite, cât și în scopuri speciale, în special, utilizarea sa pentru evaluarea autorilor și a documentelor este destul de controversată .
Într-un studiu de la începutul anului 1964, folosind analiza citărilor în scrierea istoriei ADN-ului , Garfield și Sher au demonstrat potențialul de a produce istoriografie , hărți topologice ale etapelor majore din istoria subiectelor științifice. Această lucrare a fost ulterior automatizată de E. Garfield, A. I. Pudovkin de la Institutul de Biologie Marină al Academiei Naționale de Științe și V. S. Istomin de la Centrul pentru Predare, Învățare și Tehnologie, Universitatea de Stat din Washington și a condus la crearea software-ului Histcite [ 24] până în 2002.
Indexarea automată a citărilor a fost introdusă în 1998 de Lee Giles, Steve Lawrence și Kurt Bollacker și a permis ștergerea automată algoritmică și gruparea citărilor pentru orice document digital academic și științific. Acolo unde pre-retragerea citațiilor a fost un proces manual, ratele de citare pot fi acum crescute și calculate pentru orice ramură sau loc academic, nu doar pentru cele alocate de organizații precum ISI. Acest lucru a condus la crearea de noi sisteme de indexare a citărilor publice și automate, primul dintre care a fost CiteSeer (acum CiteSeerX , în curând moștenit de sistemul Cora, care s-a concentrat în primul rând pe informatică și informatică . Mai târziu, sistemele majore de nume de domenii academice, cum ar fi ca Google Scholar și Microsoft Academic Această indexare offline a citatelor nu a fost încă perfecționată în extragerea citatelor sau în gruparea citatelor, cu o rată de eroare estimată a fi undeva în jur de 10%, deși nu a fost încă efectuată o eșantionare statistică atentă. Autori precum Ann Arbor , Milton Keynes și Walton Hall au produs o cantitate uriașă de rezultate academice.25 SCI pretinde că creează indexarea automată a citărilor prin metode pur programatice. Chiar și intrările mai vechi au aceeași marjă de eroare.
Analiza citațiilor pentru documentele juridice este o abordare care ajută la înțelegerea și analiza documentelor normative aferente prin examinarea citărilor care leagă o prevedere de alte prevederi din cadrul aceluiași document și între diferite documente. Analiza citațiilor folosește un grafic de citare derivat dintr-un document normativ care ar putea completa descoperirea electronică, un proces care conduce inovația tehnologică în analiza datelor mari. [26]
Publicații electronice . Datorită creșterii fără precedent a disponibilității resurselor electronice, una dintre întrebările arzătoare care sunt acum studiate a devenit întrebarea „cât de des sunt citate resursele electronice pe internet în industria mea?”. [27] De exemplu, s-a susținut că accesul online la literatura de informatică duce la rate mai mari de citare, [28] cu toate acestea , articolele umaniste pot avea de suferit dacă nu există în tipărire.
Auto-citare . Practica autorilor de a se „juca” cu sistemul prin acumularea de citări, prin supracitarea [29] , a fost foarte criticată . În același timp, de exemplu, s-a constatat că bărbații se citează mai des decât femeile.