web-dev-qa-db-fra.com

Poussez Google Colab ipynb vers Github?

Je suis sur un Chromebook (configuration de stock), mais relativement nouveau pour toute l'entreprise de codage. Actuellement, j'essaie de me familiariser avec Google Colaboratory couplé à Google Drive pour faire l'analyse des données n'importe où.

Mon problème est alors le suivant: puisque je peux accéder à Github via !git automatiquement dans Colab, j'ai créé un nouveau référentiel et l'ai cloné. Mais je ne peux pas ajouter le .ipynb car !git status ne montre aucun changement/ne voit pas le bloc-notes dans lequel je suis en tant que fichier. Comment puis-je pousser le .ipynb de mon Google Drive vers Github?

Fondamentalement, j'espère récupérer Colab n'importe où, jouer avec mes données, enregistrer les modifications dans le .ipynb, pousser vers Github et aller ailleurs pour continuer à jouer avec les données.

La copie manuelle fonctionnerait probablement, mais existe-t-il une solution plus élégante?

TIA!

10
jaymullr

Vous avez probablement déjà trouvé une solution à cela, mais je vois qu'il y a maintenant une fonctionnalité "Enregistrer la copie sur Github" dans Colab, citée de cet article de blog:

Vous pouvez également enregistrer facilement une copie de votre bloc-notes Colab dans Github en utilisant Fichier> Enregistrer une copie dans Github…

4
Dan Reia

@jaymullr, avez-vous réussi à trouver votre chemin?

Voici le tutoriel pour configurer facilement votre bloc-notes de github à Google Colab en utilisant Clouderizer: tutoriel moyen . D'accord, peut-être que vous vouliez l'inverse, google Colab à github. Ce qui est passionnant, c'est que l'utilisation de clouderizer vous permet de faire les deux! Synchronisez votre bloc-notes jupyter, github et Colab. Mes étapes peuvent sembler rigoureusement longues, mais c'est en fait très facile, une configuration unique pour tous. Voici comment je le fais (passez à Synchronisez à nouveau avec GitHub si vous voulez juste savoir comment faire):

Clouderizer pour Google Colab Project

Conditions préalables

  1. S'inscrire au compte Google/Gmail
  2. Inscrivez-vous à compte Clouderizer [lien]
  3. Créez un référentiel sur votre github et téléchargez votre projet (tous les modules ipynb, py et même le jeu de données (zippez-le si <1 Go)) dans votre référentiel.

Configurer le projet Clouderizer

  1. Connectez-vous à la console Clouderizer. Lors de votre première connexion, vous serez invité à associer votre Google Drive à Clouderizer. Suivez les instructions à l'écran pour le faire. Dans le cas où il ne demande pas le lien, vous pouvez configurer votre Google Drive en allant dans le tableau de bord Clouderizer-> menu de la barre latérale-> Clouderizer Drive. Le Clouderizer configurera un dossier appelé "clouderizer" dans votre Google Drive pour contenir votre projet ipynb (que ce soit Machine Learning ou autre)
  2. Revenez au tableau de bord Clouderizer. Cliquez ensuite sur nouveau projet. En suivant les instructions, vous pouvez choisir de charger l'intégralité du projet github qui contient votre travail ipynb que vous avez l'intention de télécharger sur Google Colab.
  3. À l'étape 5, vous pouvez inclure un jeu de données supplémentaire sur lequel vous souhaitez travailler en spécifiant l'URL du jeu de données (par exemple, à partir de l'URL du jeu de données kaggle). Vous pouvez également choisir et spécifier si vous souhaitez refactoriser votre projet en ayant un dossier séparé pour l'ensemble de données, le code/modules principal et les fichiers de sortie.
  4. Ensuite, dirigez-vous vers Google Colab/créez un fichier Google Colab n'importe où dans Google Drive, puis exécutez:! Wget NS -content disposition ' https: // to_wwhat_link_you_get_to_console '
  5. Enfin, revenez au tableau de bord Clouderizer et vérifiez si votre environnement de projet est déjà en cours d'exécution et synchronisé avec Google Colab. Cliquez ensuite sur l'icône du carnet jupyter dans ce tableau de bord, juste à côté du nom du titre du projet que vous donnez. Maintenant, vous pouvez commencer à faire votre Machine Learning ou tout autre travail que vous faites comme si vous le faisiez sur une machine locale, puis synchronisez-le immédiatement sur Google Colab.
  6. Enfin, vous pourrez vérifier si votre .ipynb fonctionnera et vous pourrez également importer des modules/jeux de données dans Google Colab. Revenez simplement dans Google Drive-> dossier clouderizer-> votre projet. Ensuite, essayez de courir et de voir si tout fonctionne comme dans le carnet jupyter.

Synchroniser avec github

  1. Rien de spécial ici. Revenez au cahier Clouderizer jupyter, ouvrez le terminal dans le répertoire racine/niveau supérieur et $git Push Origin master. C'est tout!

Si vous trouvez mon chemin intéressant, appuyez sur vote positif. Cependant, cette méthode peut être trop fastidieuse au début. Laissez-moi savoir ce que vous pensez! Clouderizer est gratuit.

0
Daniel Kurniadi