Analiza citatelor

Analiza citărilor  este studiul frecvenței, modelelor și orarului citărilor din documente. Folosește modelul de citat, legături de la un document la altul, pentru a descoperi proprietățile documentelor. Un obiectiv tipic este identificarea celor mai importante documente dintr-o colecție. Un exemplu clasic este citarea dintre lucrările academice și cărți. [1] [2] Hotărârile judecătorești din sistemul juridic anglo-saxon , pentru a-și confirma deciziile, se referă la hotărâri luate în cauze anterioare, deci este importantă analiza citării în context juridic. Un alt exemplu sunt brevetele care conțin invenții anterioare, brevete citate anterior referitoare la revendicarea actuală.

Documentele pot fi asociate cu multe alte caracteristici în afară de citări, cum ar fi autori, editori, reviste, precum și textele lor reale. Analiza generală a colecțiilor de documente se numește bibliometrie , iar analiza citațiilor este o parte cheie a acestei direcții. De exemplu, legătura bibliografică și partajarea sunt valori asociate bazate pe analiza citărilor (citări partajate sau citate partajate). Citările dintr-o colecție de lucrări pot fi, de asemenea, prezentate sub forma următoarelor grafice de citare, așa cum a remarcat Derek de Solla Price  în articolul din 1965 „Networks of Scientific Papers”. [3] Aceasta înseamnă că analiza citărilor se bazează pe aspecte ale analizei rețelelor sociale și ale științei rețelelor.

Un exemplu timpuriu de indexare automată a citărilor a fost CiteSeer , care a fost folosit pentru citări în rapoartele științifice, iar Google Scholar este un exemplu de sistem modern care include mai mult decât cărți și articole academice și reflectă o gamă mai largă de surse de informații. Astăzi, indexarea automată a citărilor [4] a schimbat natura cercetării de analiză a citărilor, permițând analizarea a milioane de citate pentru modele la scară largă și descoperirea cunoștințelor. Instrumentele de analiză a citărilor pot fi folosite de oamenii de știință pentru a calcula diferite grade de impact pe baza datelor indicelui de citare . [5] [6] [7] Ei au aplicații care variază de la identificarea judecătorilor experți la revizuirea documentelor și a propunerilor de granturi, până la furnizarea de date transparente pentru a sprijini deciziile privind meritul academic, mandatul și luarea deciziilor. Această competiție pentru resurse limitate poate duce la un comportament discutabil din punct de vedere etic pentru citări crescute. [8] [9]

Practica utilizării naive a analizei citărilor pentru a compara impactul diferitelor articole științifice fără a lua în considerare alți factori care pot influența tiparele de citare a fost puternic criticată. [10] Dintre critici, una se concentrează în mod constant pe „independența industriei”, și anume faptul că practicile de citare dintr-un domeniu al științei diferă de practica din altul și chiar între ramurile de cercetare din cadrul unei discipline. [unsprezece]

Prezentare generală

În timp ce indicii de citare au fost dezvoltați inițial pentru regăsirea informațiilor , ei sunt din ce în ce mai folosiți pentru studii bibliometrice  și alte studii care implică evaluarea cercetării. Datele de citare sunt, de asemenea, baza coeficientului de influență al unui jurnal popular .

Există o mulțime de literatură despre analiza citărilor, uneori denumită scientometrie , un termen  inventat de Vasily Nalimov , sau mai precis bibliometrie . Industria a început să înflorească odată cu apariția Science Citation Index, care acoperă literatura publicată din 1900. Cele mai importante reviste din industrie sunt Scientometria , Informatica și Jurnalul Asociației pentru Știința și Tehnologia Informației. Acesta din urmă organizează și o listă de corespondență electronică numită Sigmetrica la ATIT. [12] Această metodă este reînviată prin adoptarea pe scară largă a bazelor de date, abonamentele Web Science și Scopus la multe universități și instrumente publice gratuite de citare, cum ar fi CiteBase, CiteSeerX , Google Scholar și fostul program Windows Live Academic (acum disponibil cu funcții suplimentare precum la fel ca Microsoft Academic Search). Metodele de cercetare a analizei citatelor includ abordări calitative, cantitative și computaționale. Obiectivele principale ale unor astfel de studii scientometrice au fost evaluarea performanței, clasamentele de cercetare instituțională, clasificarea revistelor [13] cu privire la stabilirea factorilor de performanță și a standardelor de proprietate, [14] evaluarea impactului lucrărilor științifice de top, [15] urmărirea traiectoriei unei științe sau industria tehnologiei [16] , și dezvoltarea profilurilor autorilor și instituțiilor de frunte în ceea ce privește rezultatele cercetării. [17]

Analiza citației legale este o tehnică de analiză a citațiilor pentru analiza documentelor juridice care facilitează înțelegerea documentelor normative conexe prin examinarea citațiilor care leagă o prevedere de alte dispoziții din același document sau între documente diferite. Analiza citațiilor legale utilizează un grafic de citare preluat dintr-un document de reglementare care poate completa descoperirea electronică, un proces care influențează inovația tehnologică în analiza datelor mari . [18] [19] [20] [21]

Istorie

Într-o lucrare din 1965, Derek de Solla Price a descris proprietatea inerentă de legare a SCI ca „o rețea de lucrări științifice”. Legăturile dintre citate și lucrările citate au devenit dinamice când SCI a început să publice online. Social Science Citation Index a fost una dintre primele baze de date instalate în sistemul Dialog [22] în 1972. Odată cu apariția CD-urilor, referințele au devenit și mai simple, permițând utilizarea legăturilor bibliografice pentru a găsi înregistrări aferente. În 1973, Henry Small și-a publicat lucrarea clasică despre analiza co-citării, care a devenit  un sistem de clasificare auto-organizat  care a condus la experimente cu gruparea documentelor și, în cele din urmă, la Atlasul științei, care mai târziu a devenit Research Reviews.

Natura topologică și grafică inerentă a rețelei mondiale de citate care este inerentă literaturii științifice a fost descrisă de Ralph Garner (Universitatea Drexel) în 1965. [23]

Utilizarea scorurilor de citare în reviste clasificate a fost o practică obișnuită în prima jumătate a secolului al XIX-lea, dar măsurarea sistematică continuă a acestor scoruri pentru reviste academice a fost inițiată de Eugene Garfield de la Institutul pentru Informații Științifice, care a devenit și sursa principală. pentru utilizarea acestor scoruri pentru a evalua autorii și articolele. Într-o lucrare de referință din 1965, el și Irving Sher au arătat relația dintre frecvența și creșterea citărilor, demonstrând că câștigătorii Premiului Nobel și-au publicat lucrările de cinci ori în medie, în timp ce lucrările lor au fost citate de 30-50 de ori în medie. Garfield a raportat acest fenomen într-o serie lungă de eseuri despre Nobel și alte premii. Scorul final obișnuit este cunoscut sub numele de raportul de influență , numărul de citări în reviste în ultimii doi ani împărțit la numărul de articole publicate în acei ani. Este utilizat pe scară largă atât în ​​scopuri obișnuite, cât și în scopuri speciale, în special, utilizarea sa pentru evaluarea autorilor și a documentelor este destul de controversată .

Într-un studiu de la începutul anului 1964, folosind analiza citărilor în scrierea istoriei ADN-ului , Garfield și Sher au demonstrat potențialul de a produce istoriografie , hărți topologice ale etapelor majore din istoria subiectelor științifice. Această lucrare a fost ulterior automatizată de E. Garfield, A. I. Pudovkin de la Institutul de Biologie Marină al Academiei Naționale de Științe și V. S. Istomin de la Centrul pentru Predare, Învățare și Tehnologie, Universitatea de Stat din Washington și a condus la crearea software-ului Histcite [ 24] până în 2002.

Indexarea automată a citărilor a fost introdusă în 1998 de Lee Giles, Steve Lawrence și Kurt Bollacker și a permis ștergerea automată algoritmică și gruparea citărilor pentru orice document digital academic și științific. Acolo unde pre-retragerea citațiilor a fost un proces manual, ratele de citare pot fi acum crescute și calculate pentru orice ramură sau loc academic, nu doar pentru cele alocate de organizații precum ISI. Acest lucru a condus la crearea de noi sisteme de indexare a citărilor publice și automate, primul dintre care a fost CiteSeer (acum CiteSeerX , în curând moștenit de sistemul Cora, care s-a concentrat în primul rând pe informatică și informatică . Mai târziu, sistemele majore de nume de domenii academice, cum ar fi ca Google Scholar și Microsoft Academic Această indexare offline a citatelor nu a fost încă perfecționată în extragerea citatelor sau în gruparea citatelor, cu o rată de eroare estimată a fi undeva în jur de 10%, deși nu a fost încă efectuată o eșantionare statistică atentă. Autori precum Ann Arbor , Milton Keynes și Walton Hall au produs o cantitate uriașă de rezultate academice.25 SCI pretinde că creează indexarea automată a citărilor prin metode pur programatice. Chiar și intrările mai vechi au aceeași marjă de eroare.

Analiza citatelor pentru acte juridice

Analiza citațiilor pentru documentele juridice este o abordare care ajută la înțelegerea și analiza documentelor normative aferente prin examinarea citărilor care leagă o prevedere de alte prevederi din cadrul aceluiași document și între diferite documente. Analiza citațiilor folosește un grafic de citare derivat dintr-un document normativ care ar putea completa descoperirea electronică, un proces care conduce inovația tehnologică în analiza datelor mari. [26]

Critica

Publicații electronice . Datorită creșterii fără precedent a disponibilității resurselor electronice, una dintre întrebările arzătoare care sunt acum studiate a devenit întrebarea „cât de des sunt citate resursele electronice pe internet în industria mea?”. [27] De exemplu, s-a susținut că accesul online la literatura de informatică duce la rate mai mari de citare, [28] cu toate acestea , articolele umaniste pot avea de suferit dacă nu există în tipărire.

Auto-citare . Practica autorilor de a se „juca” cu sistemul prin acumularea de citări, prin supracitarea [29] , a fost foarte criticată . În același timp, de exemplu, s-a constatat că bărbații se citează mai des decât femeile.

Vezi și

Note

  1. Rubin, Richard. Fundamente ale biblioteconomiei și științei informației  (engleză) . — al 3-lea. - New York: Neal-Schuman Publishers, 2010. - ISBN 978-1-55570-690-6 .
  2. Garfield, E. Citation Indexing - Its Theory and Application in Science, Technology and Humanities Philadelphia: ISI Press, 1983. . Preluat la 29 august 2018. Arhivat din original la 9 martie 2018.
  3. Derek J. de Solla Price. Networks of Scientific Papers  (engleză)  // Science  : journal. - 1965. - 30 iulie ( vol. 149 , nr. 3683 ). - P. 510-515 . - doi : 10.1126/science.149.3683.510 . - . — PMID 14325149 .
  4. Giles, C. Lee; Bollacker, Kurt D. & Lawrence, Steve (1998), CiteSeer: un sistem automat de indexare a citatelor. , Biblioteci digitale 98 : The Third ACM Conference on Digital Libraries, 23–26 iunie 1998, Pittsburgh, PA (New York: Association for Computing Machinery): 89–98, ISBN 0-89791-965-3 , doi : 10.1145/ 276675.276685 , < http://doi.acm.org/10.1145/276675.276685 > . Preluat la 7 iulie 2011. 
  5. Exemplele includ instrumente bazate pe abonament, bazate pe date proprietare, cum ar fi Web of Science și Scopus , și instrumente gratuite bazate pe date deschise, cum ar fi Scholarometer Arhivat la 18 aprilie 2022 la Wayback Machine de Filippo Menczer și echipa sa.
  6. Kaur, Jasleen. Scholarometer: A Social Framework for Analyzing Impact across Disciplines  (Engleză)  // PLoS ONE  : jurnal. - 2012. - Vol. 7 , nr. 9 . - doi : 10.1371/journal.pone.0043235 . - Cod biblic . — PMID 22984414 .
  7. Hoang, D.; Kaur, J. & Menczer, F. (2010), Crowdsourcing Scholarly Data , Proceedings of the WebSci10: Extending the Frontiers of Society On-Line, 26-27 aprilie 2010, Raleigh, NC: SUA , < http:/ /jurnal .webscience.org/321/ > . Preluat la 29 august 2018. Arhivat la 17 aprilie 2015 la Wayback Machine 
  8. Anderson, MS van.  Efectele perverse ale competiției asupra muncii și relațiilor oamenilor de știință  // Etica în știință și inginerie : jurnal. - 2007. - Vol. 4 , nr. 13 . - P. 437-461 . - doi : 10.1007/s11948-007-9042-5 .
  9. Wesel, M. van. Evaluare prin citare: tendințe în comportamentul publicării, criteriile de evaluare și eforturile pentru publicații cu impact mare   // Etica în știință și inginerie : jurnal. - 2016. - Vol. 22 , nr. 1 . - P. 199-225 . - doi : 10.1007/s11948-015-9638-0 . — PMID 25742806 .
  10. Ce măsoară numărul de citări? O revizuire a studiilor privind comportamentul citat  //  Journal of Documentation : jurnal. - 2008. - Vol. 64 , nr. 1 . - P. 45-80 . - doi : 10.1108/00220410810844150 .
  11. Anauati, Maria Victoria și Galiani, Sebastian și Gálvez, Ramiro H., Quantifying the Life Cycle of Scholarly Articles Across Fields of Economic Research (11 noiembrie 2014). Disponibil la SSRN: http://ssrn.com/abstract=2523078 Arhivat 17 noiembrie 2014.
  12. Societatea Americană pentru Știința și Tehnologia Informației (link inaccesibil) . Societatea informațională pentru era informațională . Preluat la 21 mai 2006. Arhivat din original la 3 octombrie 2019. 
  13. Lowry, Paul Benjamin; Moody, Gregory D.; Gaskin, James; Galletta, Dennis F.; Humpherys, Sean; Barlow, Jordan B.; și Wilson, David W. (2013). „ Evaluarea calității revistei și a coșului de reviste a Asociației pentru Sisteme Informaționale (AIS) Senior Scholars prin măsuri bibliometrice: Evaluările expertilor din reviste adaugă valoare? Arhivat la 21 martie 2019 la Wayback Machine , MIS Quarterly (MISQ), vol. 37(4) , 993 - 1012. De asemenea, YouTube vezi o narațiune video a acestei lucrări la: https://www.youtube.com/watch?v=LZQIDkA-ke0&feature=youtu.be Arhivat 21 martie 2019 la Wayback Machine .
  14. Dean, Douglas L; Lowry, Paul Benjamin; și Humpherys, Sean (2011). Profiling the research productivity of permanent information systems faculty at US instituts Arhivat 9 ianuarie 2016 la Wayback Machine , MIS Quarterly (MISQ), vol . 35(1), pp. 1-15 ( ISSN 0276-7783 ).
  15. Karuga, Gilbert G.; Lowry, Paul Benjamin; și Richardson, Vernon J. (2007). Evaluarea impactului cercetării în timp a sistemelor informaționale de prim rang, Comunicațiile Asociației pentru Sisteme Informaționale, vol. 19(7), pp. 115-131 (http://aisel.aisnet.org/cais/vol19/iss1/7) Arhivat 25 ianuarie 2016 la Wayback Machine
  16. Liu, John S. O abordare integrată pentru analiza căii principale: Dezvoltarea indicelui Hirsch ca exemplu  //  Journal of the American Society for Information Science and Technology : jurnal. - 2012. - 1 martie ( vol. 63 , nr. 3 ). - P. 528-542 . — ISSN 1532-2890 . - doi : 10.1002/asi.21692 .
  17. Lowry, Paul Benjamin; Karuga, Gilbert G.; și Richardson, Vernon J. (2007). Evaluarea instituțiilor de top, a facultăților și a articolelor în reviste de cercetare de prim rang în sistemele informaționale, Communications of the Association for Information Systems, vol. 20(16), pp. 142-203 (http://aisel.aisnet.org/cais/vol20/iss1/16). Arhivat pe 9 ianuarie 2016 la Wayback Machine
  18. http://ieeexplore.ieee.org/search/wrapper.jsp?arnumber=5070630&tag=1  (link descendent din 29.08.2018 [1517 zile])
  19. Mohammad Hamdaqa și A. Hamou-Lhadj, „Citation Analysis: An Approach for Facilitating the Understanding and the Analysis of Regulatory Compliance Documents”, În Proc. a celei de-a 6-a Conferințe Internaționale despre Tehnologia Informației, Las Vegas, SUA
  20. E-Discovery Special Report: The Rising Tide of Nonlinear Review . Hudson Global . Preluat la 1 iulie 2012. Arhivat din original la 3 iulie 2012. de Cat Casey și Alejandra Perez
  21. Ce ne învață descoperirea electronică asistată de tehnologie despre rolul oamenilor în tehnologie - Re-Humanizing Technology-Assisted Review . Forbes . Preluat la 1 iulie 2012. Arhivat din original la 18 iunie 2012.
  22. Dialog, A Thomson Business . „Dialog a inventat serviciile de informare online” . Consultat la 21 mai 2006. Arhivat din original la 13 ianuarie 2004.
  23. Copie arhivată . Preluat la 29 august 2018. Arhivat din original la 9 septembrie 2017.
  24. ^ Eugene Garfield Istoriografie legată de citații algoritmice—Mapping the Literature of Science . A prezentat ASIS&T 2002: Informații, conexiuni și comunitate. Cea de-a 65-a întâlnire anuală a ASIST din Philadelphia, PA. 18–21 noiembrie 2002 (2002). Preluat la 21 mai 2006. Arhivat din original la 20 octombrie 2016.
  25. Postellon DC Hall și Keynes se alătură lui Arbor în indexurile de citare  // Nature  :  journal. - 2008. - Martie ( vol. 452 , nr. 7185 ). - doi : 10.1038/452282b . — . — PMID 18354457 .
  26. Hamdaqa, M.; Un Hamou-Lhadj. Analiza citatelor: o abordare pentru facilitarea înțelegerii și analizei  documentelor de conformitate cu reglementările . - Las Vegas, NV: Institutul de Ingineri Electrici și Electronici , 2009. - P. 278-283. - ISBN 978-1-4244-3770-2 . - doi : 10.1109/ITNG.2009.161 .
  27. Zhao, Lisa. „Cum a folosit bibliotecarul resursele electronice – O analiză a citărilor în CCQ”. Cataloging & Classification Quarterly 42(1) (2006): 117-131.
  28. Lawrence, Steve. Disponibilitatea online gratuită crește substanțial impactul unei lucrări. Volumul Nature 411 (numărul 6837) (2001): 521. De asemenea, online la http://citeseer.ist.psu.edu/online-nature01/ Arhivat la 9 iunie 2010 la Wayback Machine
  29. Gálvez RH Evaluarea autocitației autorului ca mecanism de difuzare a cunoștințelor relevante  //  Scientometria : jurnal. - 2017. - Martie ( vol. 111 , nr. 3 ). - P. 1801 . - doi : 10.1007/s11192-017-2330-1 .