web-dev-qa-db-fra.com

lire csv dans dataframe dans google colab

J'essaie de lire un fichier csv que j'ai stocké localement sur ma machine. (Juste pour la référence supplémentaire ce sont les données titanesques de Kaggle qui sont ici .)

À partir de this question et réponses, j’ai appris que vous pouvez importer des données à l’aide de ce code qui me convient parfaitement. 

from google.colab import files
uploaded = files.upload()

Là où je suis perdu, c'est comment le convertir en dataframe à partir d'ici. Le exemple de page de cahier Google répertorié dans la réponse ci-dessus n'en parle pas. 

J'essaie de convertir le dictionnaire uploaded en dataframe à l'aide de la commande from_dict mais je ne parviens pas à le faire fonctionner. Il y a des discussions sur la conversion de dict en dataframe ici mais les solutions ne me sont pas applicables (je pense). 

En résumé, ma question est la suivante: 

How do I convert a csv file stored locally on my files to pandas 
datframe on google-colaboratory?
15
PagMax

Les pandas read_csv devraient faire l'affaire. Vous voudrez envelopper vos octets téléchargés dans un io.StringIO puisque read_csv attend un objet de type fichier.

Voici un exemple complet: https://colab.research.google.com/notebook#fileId=1JmwtF5OmSghC-y3-BkvxLan0zYXqCJJf

L'extrait de clé est:

import pandas as pd
import io

df = pd.read_csv(io.StringIO(uploaded['train.csv'].decode('utf-8')))
df
24
Bob Smith

étape 1- Montez votre Google Drive sur Collaboratory

from google.colab import drive 
drive.mount('/content/gdrive')

Étape 2- Vous verrez maintenant vos fichiers Google Drive dans le volet de gauche (Explorateur de fichiers). Cliquez avec le bouton droit sur le fichier que vous devez importer et sélectionnez Chemin de la copie. Puis importez comme d'habitude dans les pandas, en utilisant ce chemin copié.

import pandas as pd 
df=pd.read_csv('gdrive/My Drive/data.csv')

Terminé!

3
Garima Jain

Cela a fonctionné pour moi: 

from google.colab import auth
auth.authenticate_user()

from pydrive.drive import GoogleDrive
from pydrive.auth import GoogleAuth
from oauth2client.client import GoogleCredentials
gauth = GoogleAuth()
gauth.credentials = GoogleCredentials.get_application_default()
drive = GoogleDrive(gauth)

myfile = drive.CreateFile({'id': '!!!YOUR FILE ID!!!'})
myfile.GetContentFile('file.csv')

Remplacez !!!YOUR FILE ID!!! par l'id du fichier dans Google Drive (il s'agit de la longue chaîne alphanumérique qui apparaît lorsque vous cliquez sur "obtenir un lien à partager"). Ensuite, vous pouvez accéder à file.csv avec read_csv des pandas:

import pandas as pd
frm = pd.read_csv('file.csv', header=None)
3
JARS

Colab google: upload de csv depuis votre PC J'ai eu le même problème avec un fichier Excel (* .xlsx), j’ai résolu le problème comme suit et je pense que vous pourriez faire la même chose avec les fichiers csv: __.- Si vous avez un fichier dans votre lecteur PC appelé (fichier.xlsx), alors: 1- Téléchargez-le à partir de votre disque dur en utilisant ce code simple: 

from google.colab import files
uploaded = files.upload()

Appuyez sur (Choisir les fichiers) et téléchargez-le sur votre lecteur Google. 

2- Puis: 

import io
data = io.BytesIO(uploaded['file.XLSX'])    

3- Enfin, lisez votre dossier: 

import pandas as pd   
f = pd.read_Excel(data , sheet_name = '1min', header = 0, skiprows = 2)
#df.sheet_names
df.head()

4- Veuillez modifier les valeurs des paramètres pour lire votre propre fichier. Je pense que cela pourrait être généralisé pour lire d'autres types de fichiers!
Profitez-en!

1
Yasser Mustafa

Vous pouvez également utiliser github pour importer des fichiers également . Vous pouvez prendre cet exemple à titre d'exemple: https://drive.google.com/file/d/1D6ViUx8_ledfBqcxHCrFPcqBvNZitwCs/view?usp=sharing

De plus, Google ne conserve pas le fichier plus longtemps. Vous devrez peut-être exécuter les extraits de github à plusieurs reprises.

0
Diwakar