No meu github você pode encontrar o pacote rslp.

Esse pacote implementa o algoritmo Stemming Algorithm for the Portuguese Language descrito neste artigo escrito por Viviane Moreira Orengo e Christian Huyck.

A ideia do algoritmo de stemming é muito bem explciada pelo diagrama abaixo.

Schema

Instalando

O pacote pode ser instalado usando o devtools, pois ainda não está disponível no CRAN.

devtools::install_github("dfalbel/rslp")

Usando

As únicas funções importantes do pacote são: rslp e rslp_doc. A primeira, recebe um vetor de palavras e retorna um vetor de palavras stemizadas. Já a segunda recebe um vetor de sentenças e retorna o mesmo vetor com as palavras stemizadas.

Veja os exemplos abaixo:

library(rslp)
words <- c("balões", "aviões", "avião", "gostou", "gosto", "gostaram")
rslp(words)
## [1] "bal"  "avi"  "avi"  "gost" "gost" "gost"
docs <- c(
  "coma frutas pois elas fazem bem para a saúde.",
  "não coma doces, eles fazem mal para os dentes."
  )
rslp_doc(docs)
## [1] "com frut poi el faz bem par a saud."  
## [2] "nao com doc, ele faz mal par os dent."

Update

Esse pacote agora está no CRAN!! Em breve ele poderá ser instalado usando install.packages("rslp").