Porter Stemmer este un algoritm de stemming publicat de Martin Porter în 1980 . Versiunea originală a stemmer a fost pentru engleză și a fost scrisă în BCPL . Ulterior, Martin a creat proiectul Snowball și, folosind ideea de bază a algoritmului, a scris stemmers pentru limbile indo-europene comune , inclusiv rusă [1] .
Algoritmul nu folosește baze de tulpini de cuvinte , ci numai, aplicând o serie de reguli în succesiune, decupează terminațiile și sufixele , pe baza caracteristicilor limbajului și, prin urmare, funcționează rapid, dar nu întotdeauna corect.
Algoritmul a fost foarte popular și replicat, a fost adesea schimbat de diferiți dezvoltatori și nu întotdeauna a avut succes. În jurul anului 2000, Porter a decis să „înghețe” proiectul și de acum înainte să distribuie o singură implementare a algoritmului (în mai multe limbaje de programare populare ) de pe site-ul său.