web-dev-qa-db-fra.com

Extraire le texte après un symbole dans R

sample1 = read.csv("pirate.csv")
sample1[,7] 
[1] >>xyz>>hello>>mate 1
[2] >>xyz>>hello>>mate 2
[3] >>xyz>>mate 3
[4] >>xyz>>mate 4
[5] >>xyz>>hello>>mate 5
[6] >>xyz>>hello>>mate 6

Je dois extraire et créer un tableau qui contient tous les mots après la dernière >>.

Comment faire ça?

Aussi, comment puis-je extraire (a) o qwerty, (b) mate1 et (c) pirate1 dans différentes variables de la chaîne suivante

p= '>>xyz- o qwerty>>hello>>mate1>>sole pirate1'

Merci

12
Looper
x <- c('>>xyz>>hello>>mate 1', '>>xyz>>hello>>mate 2', '>>xyz>>mate 3', ' >>xyz>>mate 4' ,'>>xyz>>hello>>mate 5')
sub('.*>>', '', x)
#[1] "mate 1" "mate 2" "mate 3" "mate 4" "mate 5"
13
Sotos

En supposant que vous ayez déjà lu ces informations dans une trame de données R, vous pouvez utiliser le package stringr comme suit:

library(stringr)
str_extract(df$mystring, '\\S+$')

Par exemple, si vous avez une chaîne comme celle-ci:

s <- '>>hello1>>hola1>>ahoy mate1'

Vous obtenez:

str_extract(s, '\\S+$')
[1] "mate1"
3
Gopala