Un caracter wildcard ( wildcard ) este un caracter folosit pentru a înlocui alte caractere sau secvențele acestora, ducând astfel la modele de caractere . Dezvoltarea caracterelor wildcard sunt expresii regulate .
În comunicarea de date, un wildcard este un simbol care poate fi înlocuit cu orice set predefinit de alte simboluri.
Cel mai des sunt folosite două caractere diferite - pentru a înlocui orice șir de caractere și pentru a înlocui orice singur caracter. Primul caracter este aproape întotdeauna un asterisc ( * ). Cu toate acestea, poate însemna și un șir gol (fără caractere).
Interpreții de linie de comandă ale diferitelor sisteme de operare: COMMAND.COM pe DOS , cmd.exe pe Microsoft Windows , diverse scripturi shell pe *nix , folosesc caractere metalice: un semn de întrebare ( ? ) ca înlocuitor pentru un singur caracter și un asterisc în sensul de mai sus. Folosindu-le, puteți opera (lista, șterge, copia, etc.) imediat cu grupuri de fișiere. Exemple de comenzi:
copiați *.txt > all.txtcopiează conținutul tuturor fișierelor text din directorul curent într-un singur fișier (DOS, Windows).
rm *.???șterge toate fișierele din directorul curent a căror extensie este formată din exact trei caractere ( sh ).
În programele de gestionare a bazelor de date, precum SQL (în loc de *, se folosește semnul procentual %, în loc de ? , liniuța de subliniere _) sau Microsoft Access , mai precis în limbajele lor de scripting, caracterele wildcard pot fi folosite în expresiile „LIKE”:
SELECT * FROM books WHERE book_name LIKE '%хими%';
În expresiile regulate, conceptul de wildcards a fost dezvoltat în continuare. Au notații speciale nu numai pentru unul (".") și orice număr ( cuantificatorul "*" ) de caractere, ci și pentru diferite clase de caractere (de exemplu, caractere goale "\s"), expresii alternative ( „|”) și multe altele. altele. [1] Unicode folosește caractere combinate . Ca și în cazul mașinilor de scris mai vechi , caracterele de bază simple (spații, semne de punctuație, simboluri, numere sau litere) pot fi urmate de unul sau mai multe caractere fără spații albe (de obicei diacritice , cum ar fi accente care schimbă literele) pentru a face un anumit caracter imprimabil ; Unicode oferă, de asemenea, un set limitat de caractere precompuse, adică caractere care includ deja unul sau mai multe caractere combinate. Secvența caracterului de bază și a caracterelor de combinare trebuie să se potrivească cu același caracter precompus unic (doar unele dintre aceste secvențe de combinare pot fi precompuse într-un singur caracter Unicode, dar un număr infinit de alte secvențe de combinare sunt posibile în Unicode și necesare pentru diferite limbi.