web-dev-qa-db-fra.com

Pourquoi Google Colab se déconnecte-t-il au hasard avant 12 heures

Parfois, mes cahiers Colab se déconnectent avant 12 heures et je suis curieux de savoir pourquoi. Parfois, je reçois un message "Runtime déconnecté".

À d'autres moments, il n'y a pas de message. Après avoir reconnecté mon bloc-notes, il semble qu'il ne fonctionne pas depuis un certain temps (car le bloc-notes ne dit pas occupé). De plus, mes fichiers tensorflow .meta et .data n'ont pas été mis à jour pendant environ 6 heures sur les 8 dernières heures sur google drive.

J'ai trouvé quelques questions sur SO qui étaient similaires à mon problème, mais la situation des autres semble être "bloquée" à l'initialisation mais mon bloc-notes ne se "bloque" pas. Il se connecte avec J'ai même essayé de redémarrer le runtime, mais je n'ai toujours aucun signe que mon ordinateur portable est connecté à mon ancien VM de toute façon.

EDIT: google colab VM "préemptif" de quelque manière que ce soit? Je sais que le moteur de calcul Google dispose de machines "préemptives" qui peuvent se déconnecter à tout moment. Étant donné que les clients payants utilisent les machines préemptives, cela n'a de sens que pour moi, colab - utilisé par des clients non payants - serait également préemptif. Je n'ai trouvé aucune documentation à l'appui de cette réclamation pour colab.

9
teter123f

Google Colab n'est pas destiné aux tâches de longue durée. À partir de la page Web FAQ de Colab (c'est moi qui souligne):

Colaboratory est destiné à une utilisation interactive. Les calculs en arrière-plan de longue durée, en particulier sur les GPU, peuvent être arrêtés. Veuillez ne pas utiliser Colaboratory pour l'exploration de crypto-monnaie. Cela n'est pas pris en charge et peut entraîner une indisponibilité du service. Nous encourageons les utilisateurs qui souhaitent exécuter des calculs continus ou de longue durée via l'interface utilisateur du Colaboratory à utiliser un environnement d'exécution local.

D'après mon expérience, les "calculs de longue durée" comprennent la formation de réseaux de neurones et également des commandes bash qui s'exécutent pendant plus de deux ou trois heures. Comme mentionné ci-dessus, ces types de tâches de longue durée peuvent entraîner une indisponibilité du service qui ne dure généralement pas plus de quelques heures.

8
ninjin

Reconnectez-vous, attendez quelques minutes pour récupérer les derniers résultats, il reprendra à partir du moment où il s'est déconnecté.

0
Pragyan