R - Concaténer deux cadres de données?

Question

Étant donné deux images de données a et b:

> a a b c 1 -0.2246894 -1.48167912 -1.65099363 2 0.5559320 -0.87898575 -0.15634590 3 1.8469466 -0.01487524 -0.53098215 4 -0.6875051 0.23880967 0.01824621 5 -0.6735163 0.75485292 0.44154092 > b a c 1 0.4287284 -0.3295925 2 0.5201492 0.3341251 3 -2.6355570 1.7916780 4 -1.3645337 1.3642276 5 -0.4954542 -0.6660001

Existe-t-il un moyen simple de concaténer ces éléments afin de renvoyer un nouveau bloc de données du formulaire ci-dessous?

> new a b c 1 -0.2246894 -1.48167912106676 -1.65099363 2 0.5559320 -0.878985746842256 -0.15634590 3 1.8469466 -0.0148752354840942 -0.53098215 4 -0.6875051 0.238809666690982 0.01824621 5 -0.6735163 0.754852923524198 0.44154092 6 0.4287284 NA -0.32959248 7 0.5201492 NA 0.33412510 8 -2.6355570 NA 1.79167801 9 -1.3645337 NA 1.36422764 10 -0.4954542 NA -0.66600006

Je souhaite fusionner les cadres de données, faire correspondre les en-têtes et insérer NA dans pour les positions dans le cadre de données b là où l'en-tête est manquant.

dfrankow · Answer

Vous voulez "rbind".

b$b <- NA new <- rbind(a, b)

rbind nécessite que les trames de données aient les mêmes colonnes.

La première ligne ajoute la colonne b au bloc de données b.

Résultats

> a <- data.frame(a=c(0,1,2), b=c(3,4,5), c=c(6,7,8)) > a a b c 1 0 3 6 2 1 4 7 3 2 5 8 > b <- data.frame(a=c(9,10,11), c=c(12,13,14)) > b a c 1 9 12 2 10 13 3 11 14 > b$b <- NA > b a c b 1 9 12 NA 2 10 13 NA 3 11 14 NA > new <- rbind(a,b) > new a b c 1 0 3 6 2 1 4 7 3 2 5 8 4 9 NA 12 5 10 NA 13 6 11 NA 14

Rnoob · Answer

Essayez le package plyr :

rbind.fill(a,b,c)

Adam Lee Perelman · Answer

vous pouvez utiliser la fonction

bind_rows(a,b)

de la bibliothèque dplyr

Mike Monteiro · Answer

Voici une petite fonction simple qui lie deux ensembles de données après avoir détecté automatiquement les colonnes manquantes et les avoir ajoutées à NAs.

Pour une raison quelconque, cela retourne BEAUCOUP plus rapidement sur des jeux de données plus volumineux que si vous utilisiez la fonction merge.

fastmerge <- function(d1, d2) { d1.names <- names(d1) d2.names <- names(d2) # columns in d1 but not in d2 d2.add <- setdiff(d1.names, d2.names) # columns in d2 but not in d1 d1.add <- setdiff(d2.names, d1.names) # add blank columns to d2 if(length(d2.add) > 0) { for(i in 1:length(d2.add)) { d2[d2.add[i]] <- NA } } # add blank columns to d1 if(length(d1.add) > 0) { for(i in 1:length(d1.add)) { d1[d1.add[i]] <- NA } } return(rbind(d1, d2)) }

Anton · Answer

Vous pouvez utiliser rbind mais dans ce cas, vous devez avoir le même nombre de colonnes dans les deux tables. Essayez donc ce qui suit:

b$b<-as.double(NA) #keeping numeric format is essential for further calculations new<-rbind(a,b)