web-dev-qa-db-fra.com

Impossible de lire un fichier de parquet

Je me brise la tête dessus maintenant. Je suis nouveau dans ces fichiers parquet et je rencontre beaucoup de problèmes avec elle.

Je suis projeté une erreur qui lit OSError: Passed non-file path: \datasets\proj\train\train.parquet Chaque fois que j'essaie de créer un df à partir de celui-ci.

J'ai essayé ceci: pq.read_pandas(r'E:\datasets\proj\train\train.parquet').to_pandas() et od = pd.read_parquet(r'E:\datasets\proj\train\train.parquet', engine='pyarrow')

J'ai également changé la lettre de lecteur du lecteur où réside le jeu de données, et c'est la même chose!

C'est la même chose avec tous les moteurs.

S'il vous plaît aider!

7
Anonymous Person

Cela pourrait être un problème avec la manipulation du chemin de fichier de Flèche. Vous pouvez plutôt passer dans un fichier déjà ouvert:

import pandas as pd

with open(r'E:\datasets\proj\train\train.parquet', 'rb') as f:
    df = pd.read_parquet(f, engine='pyarrow')
3
Uwe L. Korn