web-dev-qa-db-fra.com

Passer une chaîne comme nom de variable dans dplyr :: filter

J'utilise le jeu de données mtcars pour illustrer ma question.

Par exemple, je veux créer des sous-ensembles de données sur des voitures 4 cylindres. Je peux faire:

mtcars %>% filter(cyl == 4)

Dans mon travail, je dois passer une variable de chaîne comme nom de colonne. Par exemple:

var <- 'cyl'
mtcars %>% filter(var == 4)

J'ai aussi fait:

mtcars %>% filter(!!var == 4)

Dans les deux cas, j'ai eu dataframe vide. 

10
zesla

!! ou UQ évalue la variable, donc mtcars %>% filter(!!var == 4) est identique à mtcars %>% filter('cyl' == 4) où la condition est toujours évaluée à false; Vous pouvez le prouver en imprimant !!var dans la fonction de filtrage:

mtcars %>% filter({ print(!!var); (!!var) == 4 })
# [1] "cyl"
#  [1] mpg  cyl  disp hp   drat wt   qsec vs   am   gear carb
# <0 rows> (or 0-length row.names)

Pour évaluer var dans la colonne cyl, vous devez d'abord convertir var en un symbole de cyl, puis évaluer le symbole cyl en une colonne:

Utiliser rlang:

library(rlang)
var <- 'cyl'
mtcars %>% filter((!!sym(var)) == 4)

#    mpg cyl  disp  hp drat    wt  qsec vs am gear carb
#1  22.8   4 108.0  93 3.85 2.320 18.61  1  1    4    1
#2  24.4   4 146.7  62 3.69 3.190 20.00  1  0    4    2
#3  22.8   4 140.8  95 3.92 3.150 22.90  1  0    4    2
# ...

Ou utilisez as.symbol/as.name de baseR:

mtcars %>% filter((!!as.symbol(var)) == 4)

mtcars %>% filter((!!as.name(var)) == 4)
14
Psidom

Je pense que la réponse de @ snoram est élégante et dépend uniquement de dplyr.

var <- c('cyl')
mtcars %>% filter(get(var) == 4)

Vous pouvez aussi l'utiliser avec une liste. Pour un exemple simple, vous pouvez obtenir le nombre de chaque colonne filtrée en tant que nouvel ensemble de données.

#adding car name
mtcars <- rownames_to_column(mtcars, "car_name")

#name your vectors
vector <- c("vs","am","carb")

df2 <- data.frame()
for (variable in vector) {
  df1 <- mtcars %>% filter(get(variable) == 1) %>% summarise(variable = n_distinct(car_name)) %>% data.frame()

  df2<- rbind(df2,df1)
}
4
Yoganium

Vous pouvez utiliser eval (parse (text = pour évaluer les chaînes en tant que variables:

mtcars %>% filter(eval(parse(text='cyl')) == 4)

 enter image description here

0
Cybernetic