Academia Google

Google Academic
URL scholar.google.com
Comercial Nu
Tip site Căutare după publicații științifice
Înregistrare Opțional
limbi) 40 de limbi acceptate
Proprietar Google
Începutul lucrării 20 noiembrie 2004
Statusul curent Lucrări
 Fișiere media la Wikimedia Commons

Google Scholar este un  motor de căutare gratuit pentru publicații de cercetare lansat în noiembrie 2004 la inițiativa inginerilor Google Alex Verstak și Anurag Acharya . Cu ajutorul roboților de căutare , portalul indexează metadatele și efectuează căutări de text integral în literatura științifică, inclusiv articole de reviste, preprinturi , disertații, cărți și rapoarte tehnice. Utilizatorii pot căuta lucrările dorite după autori, cuvinte cheie, titlul revistei. Căutarea aprofundată vă permite să clasificați materialele după publicație, dată și domeniu.

Academia Google nu furnizează date despre numărul exact de lucrări indexate, totuși, conform estimărilor preliminare, au existat cel puțin 390 de milioane în 2019. În ciuda lipsei de date fiabile cu privire la dimensiunea bazei de date, portalul este considerat cel mai important din lume. cel mai mare motor de căutare academic, cu o acoperire de până la 90 % din toate articolele în limba engleză.

Istorie

Ideea creării Academiei Google aparține lui Alex Verstak și Anurag Acharya . La începutul anilor 2000, inginerii au colaborat pentru a îmbunătăți indexarea Google pe web a publicațiilor științifice . Ulterior, au decis să creeze un motor de căutare similar pentru literatura științifică [1] [2] [3] . Potrivit lui Acharya, el a conceput un proiect similar în timp ce studia încă la Institutul Indian de Tehnologie . Apoi, inginerul a întâlnit prima dată problema paywall -urilor , din cauza căreia lucrările științifice nu au intrat în rezultatele căutării, iar oamenii de știință au trebuit să facă o muncă dublă pentru a compila o analiză a literaturii [4] [5] [3] [6] . Workbench și Acharya au căutat să faciliteze accesul la cunoștințele științifice. Sloganul Academiei Google era sintagma „ Standing on the shoulders of giants “, atribuită lui Bernard de Chartres și Isaac Newton [7] .

Motorul de căutare gratuit a fost lansat în 2004 [5] [8] [5] . La momentul înființării, Google Scholar a indexat lucrări din bazele de date ale revistelor Nature , Online Computer Library Center , Association for Computing Machinery și altele [9] . În același timp, lipseau unele funcții de bază, precum filtrarea datelor după dată [10] .

În 2006, Google Scholar a adăugat o nouă caracteristică care generează și importă automat citări bibliografice ale lucrărilor academice indexate în sistemele comerciale de gestionare a informațiilor bibliografice , inclusiv RefWorks , Reference Manager , EndNote și BibTeX [7] . Din 2007 până în 2011, linkul Google Scholar a fost pe pagina de pornire Google [11] . În 2007, de comun acord cu editorii, serviciul a lansat un program de digitalizare a revistelor științifice. Scopul său principal a fost de a obține acces la metadatele publicațiilor pentru a facilita procesul de căutare, identificare și citare [7] . În 2010, Google Scholar a anunțat o nouă funcție - „ceas alarmă” pentru anumite solicitări - utilizatorii puteau primi actualizări despre noile publicații prin poștă [12] [13] . Din 2012, cercetătorii au putut să creeze profiluri personale, să adauge independent și să actualizeze în mod regulat informații despre toate lucrările publicate. În același timp, serviciul calculează automat indicatorii scientometrici individuali [7] . Opțiunea nu numai că a îmbunătățit capacitățile de căutare ale sistemului, dar a făcut posibilă și urmărirea carierelor individuale ale cercetătorilor [1] . În 2013, serviciul a conectat funcția de bibliotecă personală pentru colecții de literatură științifică și rezultatele căutării pentru anumite interogări într-un cont personal [7] .

În mai 2014, Google Scholar a fost blocat în China [14] . Mulți oameni de știință chinezi au declarat că blocarea va afecta negativ dezvoltarea științei în țară [15] [16] .

În 2021, portalul a introdus o caracteristică suplimentară pentru a urmări lizibilitatea acelor lucrări de cercetare care se încadrează în mandatele de acces deschis, o politică a grant-makers care solicită cercetătorilor să-și deschidă munca prin arhivare în depozite [17] [18] .

Cum funcționează

Indexare

Roboții de căutare ai Academiei Google scanează în mod constant web-ul și adaugă automat materiale care sunt potrivite în conținut și design pentru formatul unui articol științific [1] . Astfel, articolele de știri, cărțile, recenziile, site-urile comerciale, blogurile și paginile Wikipedia nu sunt supuse indexării [19] . Roboții de căutare scanează materiale din două grupuri principale de surse. Prima include publicații de reviste, preprinturi , disertații și rapoarte tehnice. Materialele identificate în acest fel includ atât documente cu text integral, cât și citări cu adnotări. Al doilea grup include materiale furnizate de organizații partenere - editori de reviste, societăți științifice, furnizori de baze de date și instituții de cercetare. Cele mai multe dintre aceste lucrări sunt prezentate în Google Scholarship ca citate cu adnotări, deoarece textul complet este încă ascuns în spatele paywall -urilor [20] [21] [22] [23] .

Roboții de căutare au acces la cele mai mari baze de date de edituri științifice comerciale și universitare, inclusiv Association for Computing Machinery , Nature , Institute of Electrical and Electronics Engineers , Online Computer Library Center , Macmillan Publishers , John Wiley & Sons , University of Chicago Press [5] ] . În plus, roboții își scanează și gazdele digitale, inclusiv HighWire Press , Metapress , Ingenta , site-uri web ale instituțiilor științifice și guvernamentale precum American Physical Society , US National Institutes of Health , National Oceanic și Administrare atmosferică și servere de preprint, cum ar fi arXiv.org , Sistemul de informații astrofizice NASA , RePEc și Citebase [24] [25] [22] . În 2007, Elsevier și-a pus și baza de date ScienceDirect disponibilă pentru Google [26] .

În unele cazuri, Google Scholar indexează și site-uri web. Pentru a face acest lucru, portalurile trebuie să îndeplinească anumite criterii: să publice în principal lucrări științifice (articole de cercetare originale, rapoarte tehnice, publicații de reviste, lucrări de conferințe, dizertații și rezumate), să fie în acces public și, de asemenea, să urmeze toate recomandările tehnice necesare [27] .

Sistemul nu furnizează date despre numărul exact de lucrări indexate, așa că cercetătorii sunt nevoiți să-și efectueze propriile evaluări. Probabil, în 2010, numărul de documente adăugate la Google Scholar a fost de aproximativ 82 de milioane, în 2014 - 99,3-109,3 milioane, în 2015 - 160-165 milioane, iar în 2019 - peste 390 de milioane [ 28] [29] . În ciuda lipsei de date fiabile cu privire la dimensiunea bazei de date, Google Scholar este considerat cel mai mare motor de căutare academică din lume, cu o rată de acoperire de până la 90% din toate articolele în limba engleză și 50% din toate documentele full-text [25]. ] [30] [6] [31] [21] [32] .

Crawlerele Google Academy indexează lucrările academice din toate limbile și disciplinele [27] [21] . Majoritatea conținutului indexat este stocat pe serverele editorului, unde documentele full-text sunt disponibile pentru descărcare plătită [8] .

Algoritm de clasare

Pentru a studia structura de legături a unui articol și a determina „importanța” acestuia, Google Scholar folosește algoritmi similari PageRank [ 33] . Crawlerele extrag date bibliografice și informații despre citații, care sunt apoi folosite pentru a clasifica rezultatele căutării. Algoritmul acordă cea mai mare pondere numărului de citări ale unei lucrări științifice - cu cât sunt mai multe, cu atât articolul va fi afișat mai mare în rezultatele căutării. Aceasta este diferită de abordarea celor mai multe baze de date științifice similare folosind ordine cronologică inversă [23] . Calitatea citarii operelor joaca si ea un rol important; deci, dacă o publicație este referită prin materiale cu un rating ridicat, atunci poziția sa în rezultatele căutării crește și ea [34] [35] . Motorul de căutare clasifică rezultatele căutării și gradul de relevanță a acestora pentru interogare. Prezența cuvintelor cheie în titlul lucrării are un impact semnificativ asupra poziției articolului în listă. În acest caz, frecvența de apariție a cuvintelor cheie de interogare în textul integral nu contează [36] [37] [27] . Nici vârsta articolului nu joacă un rol semnificativ pentru algoritm [38] .

Organizațiile individuale, inclusiv Elsevier, OpenScience, Mendeley, SAGE Publishing, sfătuiesc autorii să urmeze principiile optimizării motoarelor de căutare și să-și modifice munca în așa fel încât să fie mai ușor pentru motoarele de căutare academice să o acceseze cu crawlere și să o indexeze [39] . De asemenea, autorii sunt sfătuiți să-și adapteze în mod independent textele la standardele Google Scholar, astfel încât cât mai mulți oameni să le poată accesa [40] [41] [42] .

Citare

Funcția de urmărire a citațiilor a apărut în Google Scholar în decembrie 2004, aproape imediat după lansarea platformei [43] [44] . Cercetătorii se bazează adesea pe un scor de citare, factorul de impact , pentru a ține evidența celor mai influente lucrări pe un anumit subiect [22] [23] . Funcția a permis Google Scholar să concureze cu motoarele de căutare plătite de la editori tradiționali. Înainte de aceasta, numai portalul Web of Science de la Thomson Scientific [23] [22] [21] [45] oferea această opțiune .

Google Scholar calculează și afișează automat trei valori pentru citarea autorului [25] :

Funcții disponibile

Interfața Google Scholar este similară cu pagina de pornire Google. Utilizatorii pot căuta după autori, cuvinte cheie, titluri de reviste. Căutarea avansată vă permite să filtrați rezultatele după anumite reviste, dată și domeniu [46] [47] . După introducerea unei cereri, portalul returnează până la 1000 de rezultate, fiecare dintre ele conținând date bibliografice (titlu, numele autorilor, sursa publicației), precum și link-uri către un rezumat sau o versiune completă a lucrării, dacă aceasta se află în domeniul public . Utilizatorii pot vedea citări ale publicației din alte surse, link-uri către resurse online în care este prezentat materialul sau către biblioteci care au o copie fizică a lucrării. În acest caz, identificatorul digital al obiectului nu este afișat. Google Scholar oferă utilizatorilor acces la mai multe versiuni ale aceluiași document [46] [21] .

Funcția Biblioteca mea vă permite să „salvați” colecții personale de articole care pot fi organizate folosind etichete. Utilizatorii pot genera referințe bibliografice la orice articol științific. Sistemul generează referințe în toate standardele bibliografice internaționale cele mai frecvent utilizate, cum ar fi stilul MLA Modern Language Association , stilul APA , stilul Turabian (Chicago) [ , stilul Harvard , stilul American Chemical Society , stil AIP Institutul American de Fizică, stil IEEE , stil Vancouver și altele [7] . Portalul vă permite, de asemenea, să importați citate pentru programe precum EndNote, BibTeX, RefMan sau RefWorks. Utilizatorii pot configura și edita profiluri de autor, inclusiv specificând afilierea lor instituțională, cinci domenii de interes științific și adăugarea de publicații. Cu toate acestea, numai profilurile cu adrese de e-mail academice verificate sunt afișate în rezultatele căutării. De asemenea, este posibil să vă abonați la actualizările altor autori pentru a primi notificări prin e-mail de articole sau citări noi [25] .

Influență

Oamenii de știință moderni numesc apariția Academiei Google o revoluție în domeniul căutării literaturii științifice. Potrivit diverselor surse, portalul este folosit de 43,7% până la 88% dintre cercetători. Google Scholar reduce șansa de duplicare neintenționată a cercetării, ceea ce este deosebit de important pentru domeniile științei cu un cost ridicat de experimentare, cum ar fi fizica și medicina [4] [47] [48] [49] [50] [28] .

Răspândirea Google Scholar a sporit importanța revistelor științifice „neprestigioase” și a articolelor vechi. Acest lucru se poate explica prin influența algoritmului de clasare, care prioritizează relevanța lucrării la solicitarea utilizatorului, și nu elitismul revistei în care sunt publicate. Lucrările vechi au mai multe avantaje deoarece sistemul se concentrează pe lucrări cu mai multe citări [50] [51] [52] .

Funcționalitatea Academiei Google a contribuit la popularizarea utilizării indicatorilor scientometrici pentru evaluarea muncii cercetătorilor: mulți angajatori au început să se bazeze pe aceștia atunci când evaluează candidații [48] . Motorul de căutare a avut și un impact asupra mișcării de acces deschis . Prin colaborarea cu editori de top, Google Scholar a împins editorii comerciali să digitalizeze rezumatele lucrărilor cu perete de plată — înainte de aceasta, rezumatele nu erau disponibile pentru vizualizare, iar utilizatorii le puteau vizualiza doar obținând acces deplin la lucrare [4] .

Critica

Mulți cercetători avertizează împotriva utilizării Google Scholar ca sursă unică de revizuire a literaturii științifice. Motivele pentru aceasta sunt defectele algoritmului de clasare, arătând uneori rezultate inexacte, erori de catalogare, atribuirea de citate eronate sau includerea de material non-strict academic. Acoperirea lucrărilor indexate este, de asemenea, limitată la accesul la anumite organizații și sub rezerva acordului cu editorii [28] . Căutarea Google Scholarship nu este nici reproductibilă, nici transparentă - interogările repetate returnează adesea rezultate diferite [53] [54] [31] . În plus, jurnalele indexate nu sunt supuse verificării manuale, ceea ce duce la intrarea în baza de date a revistelor prădătoare [55] . De asemenea, un studiu din 2021 a constatat o prejudecată lingvistică în algoritmul Academiei Google - documentele publicate în limbi non-engleze sunt sistematic retrogradate în poziții care le fac aproape invizibile [56] .

Răspândirea Google Scholar a contribuit la efectul Matthew — un număr relativ mic de publicații atrag un număr în creștere disproporționat de citări, în timp ce majoritatea celorlalte lucrări trec în mare măsură neobservate [57] . Acest lucru se datorează faptului că cercetătorii continuă să selecteze articole dintre cele mai bune rezultate, asumându-și automat validitatea (de exemplu, pe baza unui număr mare de citări anterioare), și, de asemenea, le citează în lucrările lor [58] [59] . Cu toate acestea, algoritmul de clasare Google Academy are o serie de vulnerabilități. Cercetătorii au experimentat cu manipularea propriilor clasamente individuale ale citatelor adăugând cuvinte invizibile pe prima pagină a uneia dintre lucrările lor de conferință și modificând conținutul și bibliografia unora dintre lucrările lor deja publicate. Acest lucru a dus la o creștere a citărilor și la îmbunătățirea scorurilor individuale [60] [61] . În plus, promovarea scorurilor individuale de citări de către portal poate duce la o deteriorare a calității lucrărilor științifice, deoarece cercetătorii sunt mai preocupați de scorurile de citări individuale decât de conținut [62] .

Note

  1. 1 2 3 Noorden, 2014 .
  2. Anurag Acharya. Tech Guru Anurag Acharya . New Indian Express (15 noiembrie 2014). Preluat la 10 mai 2022. Arhivat din original la 2 noiembrie 2021.
  3. 1 2 Va deveni mult mai ușor să spargeți pereții de plată din Science Journal . Cablat. Preluat la 11 mai 2022. Arhivat din original la 11 mai 2022.
  4. 1 2 3 Steven Levy. Domnul care a făcut savant . Wired (17 octombrie 2014). Preluat la 6 mai 2022. Arhivat din original la 17 mai 2022.
  5. 1 2 3 4 John Markoff. Google plănuiește un nou serviciu pentru oameni de știință și savanți . The New York Times (18 noiembrie 2004). Preluat la 6 mai 2022. Arhivat din original la 17 mai 2022.
  6. 1 2 Gusenbauer, 2019 , pp. 177-214.
  7. 1 2 3 4 5 6 Bizenkov, 2017 .
  8. 12 Mayr , 2007 .
  9. Daniel Terdiman. Un instrument pentru cercetătorii cărora le place să sape adânc . The New York Times (25 noiembrie 2004). Preluat la 6 mai 2022. Arhivat din original la 17 mai 2022.
  10. Google Nouveau . Natură. Data accesului: 10 mai 2022.
  11. Google Scholar face nota . Cablat (7 mai 2007). Preluat la 11 mai 2022. Arhivat din original la 17 mai 2022.
  12. Amy Cavender. Biblioteca Google Academic . Cronica învăţământului superior (19 decembrie 2013). Preluat la 12 mai 2022. Arhivat din original la 17 mai 2022.
  13. Ryan Cordell. Automatizarea cercetării cu Google Scholar Alerts . Cronica învăţământului superior (1 iulie 2010). Preluat la 12 mai 2022. Arhivat din original la 17 mai 2022.
  14. Paul Stapleton. China trebuie să deblocheze Google Scholar și să mențină internetul deschis pentru cercetătorii săi . South China Morning Post (27 mai 2015). Preluat la 11 mai 2022. Arhivat din original la 17 mai 2022.
  15. Alexis Modrigal. Oamenii de știință chinezi spun că pierderea Google ar dăuna cercetării . Wired (24 februarie 2010). Preluat la 11 mai 2022. Arhivat din original la 17 mai 2022.
  16. Știința suferă în timp ce China astupă găuri în Great Firewall . Știință (1 septembrie 2017). Preluat la 12 mai 2022. Arhivat din original la 17 mai 2022.
  17. Richard Van Noorden. Respectați mandatele de acces public? Google Scholar urmărește . Natura (31 martie 2021). Preluat la 6 mai 2022. Arhivat din original la 17 mai 2022.
  18. Pola Lem. Mișcarea de acces deschis a Google Scholar „trimite un mesaj puternic” . Știri profesionale de cercetare (25 martie 2021). Preluat la 12 mai 2022. Arhivat din original la 21 aprilie 2021.
  19. Dewan, 2012 , pp. 41-42.
  20. Walters, 2007 , pp. 1121-1132.
  21. 1 2 3 4 5 Thelwall, 2021 , pp. 871-906.
  22. 1 2 3 4 Jim Giles. Porniți-vă motoarele  // Natură. — 2005.
  23. 1 2 3 4 Bakkabalbasi, 2006 .
  24. Jasco, 2005 , pp. 208.
  25. 1 2 3 4 5 6 7 Cum judecă Google Scholar cercetarea . Spațiul științelor sociale (19 martie 2019). Preluat la 11 mai 2022. Arhivat din original la 21 ianuarie 2021.
  26. Știința direct în Google . O'relly radar (3 iulie 2007). Preluat la 14 mai 2022. Arhivat din original la 21 aprilie 2008.
  27. 1 2 3 Jonathan Knepper. Starea actuală a Google Scholar: tot ce am învățat după ce am lucrat cu site-uri de jurnal . Comunitatea Business 2 (4 noiembrie 2021). Preluat: 11 mai 2022.
  28. 1 2 3 Ayllon, 2015 , pp. 931-949.
  29. Jia Tu. Cât de mare este Google Scholar? Ummm… . Știință (30 septembrie 2014). Preluat la 12 mai 2022. Arhivat din original la 17 mai 2022.
  30. David Matthews. Te îneci în literatură? Aceste instrumente software inteligente vă pot ajuta . Natură. Preluat la 11 mai 2022. Arhivat din original la 27 aprilie 2022.
  31. 12 Jasco , 2005 .
  32. Khabsa, 2014 .
  33. Aalst, 2010 , pp. 387-399.
  34. Declan Butler. Căutările științifice trec o treaptă de viteză pe măsură ce Google pornește motorul Scholar . Natură. Preluat la 6 mai 2022. Arhivat din original la 17 mai 2022.
  35. Maharana, 2006 , pp. 475-481.
  36. Beel, 2009 , pp. 160-164.
  37. Google pune o nouă direcție pe bursă . The Guardian (22 noiembrie 2004). Preluat la 11 mai 2022. Arhivat din original la 17 mai 2022.
  38. Beel, 2009 , pp. 230-241.
  39. Schilhan, 2021 .
  40. Wilde, 2010 .
  41. Wietold Kinc. SEO academic: 7 pași pentru a optimiza articolele de cercetare pentru motoarele de căutare . Conversație De Gruyter (9 aprilie 2014). Preluat la 16 mai 2022. Arhivat din original la 20 ianuarie 2022.
  42. Fiți găsit - optimizați-vă articolele de cercetare pentru motoarele de căutare . Elsevier. Preluat la 16 mai 2022. Arhivat din original la 23 octombrie 2019.
  43. James Fallows. La IBM, chestia asta cu Google este atât de ieri . The New York Times (26 decembrie 2004). Preluat la 6 mai 2022. Arhivat din original la 17 mai 2022.
  44. Bauer, 2005 .
  45. Alakangas, 2015 , pp. 787-804.
  46. 12 Maharana , 2006 .
  47. 12 Haddaway , 2015 .
  48. 12 Grofman , 2020 .
  49. Richard Van Norden. Colaborare online: savanții și rețeaua socială . Natura (13 august 2014). Preluat la 6 mai 2022. Arhivat din original la 11 mai 2022.
  50. 1 2 În picioare pe umerii gigantului Google: Descoperirea durabilă și acoperirea cuprinzătoare a Google Scholar. . Blog LSE (19 noiembrie 2015). Preluat la 12 mai 2022. Arhivat din original la 17 mai 2022.
  51. Varshney, 2012 .
  52. 101 Inovații în comunicarea academică: cum se confruntă cercetătorii cu nenumăratele de instrumente noi . Blog LSE (11 noiembrie 2015). Preluat la 12 mai 2022. Arhivat din original la 23 aprilie 2022.
  53. Neal Haddaway. Un sistem stricat – de ce căutarea literaturii are nevoie de o revoluție FAIR . Blog LSE (3 februarie 2020). Preluat la 6 mai 2022. Arhivat din original la 26 aprilie 2022.
  54. Halevi, 2017 .
  55. Gina Kolata. Mulți academicieni sunt dornici să publice în reviste fără valoare . New York Times (30 octombrie 2017). Preluat la 15 mai 2022. Arhivat din original la 8 noiembrie 2017.
  56. Rovira, 2021 .
  57. Perc, 2014 .
  58. Dumay, 2015 .
  59. Hilda Bastian. Riscuri și alternative Google Scholar . PLOS (27 septembrie 2019). Preluat la 11 mai 2022. Arhivat din original la 17 ianuarie 2022.
  60. Jacso, 2011 , pp. 154-160.
  61. John Bonannon. Google Scholar câștigă rave – dar poate fi de încredere? . Știință (3 ianuarie 2014). Preluat la 12 mai 2022. Arhivat din original la 17 mai 2022.
  62. Cum sa schimbat Google Scholar Academia? . Forbes (8 august 2017). Preluat la 12 mai 2022. Arhivat din original la 17 mai 2022.

Literatură