Lema (lingvistica)

Lema ( engleză  lema ) este forma inițială, de dicționar, a cuvântului [1] . În rusă, pentru substantive și adjective, aceasta este forma nominativ singular, pentru verbe și forme verbale, este forma infinitivă. Concept de bază în domeniul lingvisticii corpusului și procesarea automată a limbajului natural . Procesul de reducere automată a cuvintelor text la leme se numește lematizare .

De exemplu, expresia „ Dimineața devreme, mama Milei a spălat rama cu săpun ” după lematizare va arăta astfel: dimineață, devreme, mamă, Mila, spălați, încadrați, săpun .

Lema în lingvistica corpusului

În lingvistica corpus, o căutare după lemă oferă contexte cu mențiunea tuturor formelor de cuvânt ale unui lexem dat . De exemplu, căutarea pe lema pisică va returna contexte care conțin pisică, pisică, pisică, pisici, pisici etc. Acest tip de căutare este în contrast cu căutarea prin formă de cuvânt : în acest caz, căutarea pe forma cuvântului pisică va returna contexte care conțin exact această formă gramaticală a numărului singular al cazului dativ [2] .

Lema în regăsirea informațiilor și SEO

Note

  1. Bolshakova E. I., Vorontsov K. V., Efremova N. E., Klyshinsky E. S., Lukashevich N. V., Sapin A. S. Procesarea automată a textului în limbaj natural și analiza datelor: manual. indemnizatie . - M. : NRU HSE, 2017. Copie arhivată din 21 ianuarie 2022 la Wayback Machine
  2. Descrierea căutării lemei  (engleză)  ? . motor de schiță . Preluat la 31 martie 2021. Arhivat din original la 3 martie 2021.
  3. Lematizare în SEO  (rusă)  ? .

Literatură