web-dev-qa-db-fra.com

Comment obtenir le faisceau Apache pour GCP de flux de données sur Python 3.x

Je suis très nouveau avec GCP et dataflow. Cependant, je voudrais commencer à tester et à déployer quelques flux exploitant le flux de données sur GCP. Selon la documentation et tout ce qui concerne le flux de données est impératif, utilisez le projet Apache BEAM. Par conséquent, et en suivant la documentation officielle ici la version prise en charge de python est 2,7

Honnêtement, cela est assez déçu en raison du fait que Python version 2.x disparaîtra en raison du support non officiel et tout le monde travaille avec la version 3.x. Néanmoins, je veux savoir si quelqu'un sait comment pour préparer le flux de données beam et GCP en cours d'exécution dans la version python.

J'ai vu ceci vidéo et un peu comment ce pasteur complète ce merveilleux jalon et apparemment il fonctionne sur Python 3.5.

Mise à jour :

Les gars que je veux juste soulever une pensée qui m’a traversé l’esprit depuis que je lutte avec le flux de données. Je suis vraiment très déçu de voir à quel point il est difficile de démarrer avec cet outil soit la version Java ou Python. De python il y a des contraintes sur la version 3) qui est à peu près la norme actuelle. D'un autre côté, Java a des problèmes en cours d'exécution sur la version 11 et je dois modifier un peu pour parcourir la version 8 de mon code, puis je commence à me débattre avec de nombreuses incompatibilités sur le code. Bref, si vraiment GCP veut avancer et devenir le n ° 1 il y a tant à améliorer.: déçu:

Solution :

J'ai rétrogradé ma Java vers jdk 8, installé maven et maintenant ma version Eclipse fonctionne pour Apache Beam.

J'ai finalement résolu mais, GCP envisageait vraiment d'améliorer et d'étendre la prise en charge des versions les plus récentes de Java/Python.

Merci beaucoup

7
Andres Urrego Angel

Il y a eu beaucoup de nouveautés sur le support Python . DataFlow prend désormais en charge que beta! data flow mentioning 3.7

0
kotrfa