web-dev-qa-db-fra.com

ajouter des valeurs de colonne basées sur d'autres colonnes dans le cadre de données en utilisant pour et si

J'ai un dataframe comme ceci:

     id        adit     diag1   diag2       
      2       3         4230    2234        
      3       5         3345    4456        
      4       6         4567    4467

J'aimerais ajouter 2 autres colonnes, dse1 et dse2 en utilisant le pseudo-code ci-dessous:

if diag1 contains 4230 then dse1 = 1 else dse1 = 0

if diag2 contains 4567 then dse2 =1  else dse2 = 0

J'ai utilisé ceci:

for (i in 1 : nrow(dse)){
  for (j in 3: ncol(dse)){
     if dse[i,j] %in% ("4320"){dse$dse1 = 1}
        else{dse$dse1 = 0}
    if dse[i,j] %in% ("4567"){dse$dse2 = 1}
        else{dse$dse2 = 0} 
  }
}

Mais ceux-ci ne fonctionnent pas.

14
user1582755

Pas besoin d'utiliser une boucle, utilisez simplement ifelse, par exemple

dse = within(dse, {
    dse1 = ifelse(diag1 == 4230, 1, 0)
    dse2 = ifelse(diag2 == 4567, 1, 0)
 })
21
Paul Hiemstra

N'utilisez pas le if/else. Aller vectorisé comme dans:

dat$dse1 <- as.numeric(dat$diag1 == 4230)
dat$dse2 <- as.numeric(dat$diag2 == 4567)
12
Tyler Rinker

Comme ça:

dse$dse1<-0
dse$dse2<-0
dse$dse1[dse$diag1==4230]<-1
dse$dse2[dse$diag2==4567]<-1

Procurez-vous un bon tutoriel R (tel que this ) et lisez tout sur les vecteurs d’index.

5
Theodore Lytras

Vous pouvez utiliser transform:

transform(dse, dse1 = as.numeric(diag1 == 4230),
               dse2 = as.numeric(diag2 == 4567))
4
Sven Hohenstein

vous pouvez aussi utiliser: 

sinon():

dat <- data.frame(id = c(2,3,4), adit = c(3,5,6),diag1 = c(4230,3345,4567), diag2 =            c(2234,4567,4467))
dat$dse1 <- ifelse(dat$diag1 == 4230,1,0)
dat$dse2 <- ifelse(dat$diag2 == 4567,1,0)
dat
0
IndPythCoder