Corpus Național Scoțian

Versiunea actuală a paginii nu a fost încă revizuită de colaboratori experimentați și poate diferi semnificativ de versiunea revizuită pe 22 noiembrie 2017; verificările necesită 2 modificări .

Scottish Corpus of Text and Speech ( Scottish Corpus of Text and Speech ) este Corpusul Național al limbii scoțiane (germanice) , creat în 2004 de un grup de experți: membri ai Proiectului Limba Engleză și ai Proiectului Stella al Școlii de Critică. Studii la Universitatea din Glasgow .

Contextul creării „THE SCOTS”

În ultimii ani, s-au produs schimbări semnificative în situația politică din Scoția. Noua mișcare politică a reînviat interesul pentru limbile și cultura locală. În Scoția, moștenirea lingvistică este strălucitoare, izolată de ceilalți. Situația lingvistică modernă de aici este foarte bogată, deoarece aici coexistă scoția, engleza, gaelică și multe alte comunități lingvistice. Cu toate acestea, întrebări precum păstrarea limbii scoțiane, caracteristicile distinctive ale englezei scoțiane sau utilizarea limbilor non-indigene, cum ar fi chineza sau urdu, nu au suficiente date și răspunsuri lipsite de ambiguitate. Iar această lipsă de informare creează probleme semnificative celor care lucrează în domeniul educației sau pur și simplu sunt interesați de această problemă.

Tehnologiile moderne au făcut posibilă stocarea și analizarea unor cantități foarte mari de informații. Și „THE SCOTS” este primul proiect de anvergură dedicat exclusiv limbilor Scoției. Oferă un corp electronic mare de texte scrise și vorbite pentru limbile acestei țări. Corpusul există din noiembrie 2004, iar după actualizări și completări regulate, până în mai 2007 numărul de cuvinte de pe site a ajuns la 4 milioane. Se speră că pentru cei interesați de diversitatea lingvistică a Scoției, THE SCOTS va oferi răspunsuri la toate întrebările lor. Corpusul are oportunitatea de a explora limbile Scoției în moduri noi și de a acoperi golurile care există în prezent în cunoștințele noastre despre ele.

SCOȚIA

În ceea ce privește carcasa în sine, aceasta dă impresia unei carcase moderne, extrem de comode, ușor de utilizat, în continuă evoluție și capabilă să răspundă la multe întrebări. Așa că, de exemplu, oricine are orice fel de comentarii își poate trimite dorințele creatorilor prin e-mail, unde aceștia, la rândul lor, le pot lua în considerare și pot face ajustările corespunzătoare.

Componența Corpului

Corpusul scoțian conține în prezent peste 1.100 de texte scrise și vorbite, însumând peste 4.000.000 de cuvinte. 80% sunt texte scrise, 20% sunt texte orale, care ne sunt furnizate sub formă de transcriere ortografică, sincronizată cu sursa sonoră sau video.

Una dintre funcțiile corpusului este de a afișa texte întregi acolo unde este posibil, ceea ce face corpusul vizibil mai populat. În unele cazuri, din cauza permisiunii dreptului de autor, poate fi afișată doar o parte a textului. În „THE SCOTS” informațiile prezentate sunt preluate din surse din 1945 până în prezent. SCOTS se străduiește să obțină corectitudine pentru o gamă largă de texte, texte în diferite limbi, genuri și registre; prezentați vorbitori sau scriitori în cea mai mare măsură pe gen, vârstă, gen, caracteristici profesionale și geografice.

Tipuri de căutare

Există trei metode de căutare diferite. Acei utilizatori care sunt interesați de informații statistice, cum ar fi frecvența relativă a anumitor cuvinte în diferite genuri, pot folosi datele scoțiene în această direcție. În funcție de cantitatea de informații solicitate, puteți alege un tip de căutare rapidă, standard sau avansată.

Căutare rapidă

Căutarea rapidă este cea mai simplă modalitate de a găsi frecvența de utilizare a cuvântului care vă interesează în diferite fișiere audio și documente text. Ca urmare, obțineți frecvența cuvântului și formatul fișierelor în care este folosit.

Căutare standard

Căutarea standard vă permite să efectuați câteva tipuri simple de căutări și, de asemenea, vă permite să vizualizați toate documentele din corpus.

Căutare avansată

Căutarea avansată oferă o gamă mai largă de opțiuni decât cea standard. Iată principalele informații statistice, concordatorul și hărțile pe care sunt afișate rezultatele. Căutarea avansată este împărțită pe criterii de căutare, care pot fi setate pentru a limita căutarea cuvintelor în textele unui anumit mod (vorbire orală sau scrisă), gen (corespondență, ficțiune, interviuri) sau cu un anumit set de criterii (conversații). după 2000, articole științifice profesionale etc.). În continuare). Astfel, rezultatele diferitelor interogări de căutare pot fi consecvente unele cu altele.

Note

Când căutați folosind căutarea rapidă sau standard, veți fi direcționat către o pagină cu rezultate cu două părți principale: un rezumat al rezultatelor căutării și o listă de documente.

Compilatoare

Pe lângă Universitatea din Glasgow, la proiect au participat și specialiști din următoarele organizații:

Acces

În prezent, numai căutarea în corpus este gratuită.

Literatură

Link -uri