web-dev-qa-db-fra.com

reinforcement-learning

Apprentissage Q vs différence temporelle vs apprentissage par renforcement basé sur un modèle

Quelle est la différence entre l'apprentissage par renforcement et la RL profonde?

Comment former un réseau neuronal artificiel pour jouer à Diablo 2 en utilisant une entrée visuelle?

Quelle est la différence entre Q-learning et SARSA?

Formation d'un réseau neuronal avec apprentissage par renforcement

Quelle est la différence entre l'itération de valeur et l'itération de stratégie?

Que font model.predict () et model.fit ()?

Qu'est-ce qu'une politique d'apprentissage par renforcement?

Comment comprendre l'algorithme d'optimisation de stratégie proximale dans RL?

Différence entre les environnements de gymnase Openai 'CartPole-V0' et 'CartPole-V1'

Comment résoudre les utilisateurs: utilisation d'une taille de cible (torche.Size ([])) différente de la taille d'entrée (torche.Size ([1]))?

Tensorflow et multitraitement: Sessions en cours

OpenAI Gym: Comprendre la notation `action_space` (espaces.Box)

Utilisation de la perte Tensorflow Huber dans Keras

Comment mettre à jour les poids manuellement avec Keras

Afficher uniquement la salle de sport OpenAI dans le cahier Jupyter

TypeError: len n'est pas bien défini pour les Tensors symboliques. (activation_3 / Identity: 0) Veuillez appeler `x.shape` plutôt que` len (x) `pour obtenir des informations sur la forme

Obtention de l'erreur "AttributeError: l'objet 'NoneType' n'a pas d'attribut 'shape'" lors de l'implémentation d'Atari Breakout

Quelqu'un peut-il donner un exemple concret d'apprentissage supervisé et non supervisé?

Quelle est la différence entre l'apprentissage supervisé et l'apprentissage non supervisé?

Estimation du nombre de neurones et du nombre de couches d'un réseau neuronal artificiel

Époque vs itération lors de la formation de réseaux de neurones

Pourquoi une fonction d'activation non linéaire doit-elle être utilisée dans un réseau de neurones de rétropropagation?

architecture multi-couche perceptron (MLP): critères de choix du nombre de couches masquées et de la taille de la couche masquée?

Réseau neuronal convolutif (CNN) pour l'audio

Pré-formation non supervisée pour le réseau de neurones convolutifs dans theeano

Qu'est-ce que «lr_policy» dans Caffe?

Lutte contre le déséquilibre de classe: contribution croissante à la perte et à la DMS

Scikit-learn: Comment obtenir un vrai positif, un vrai négatif, un faux positif et un faux négatif

Un guide pour convert_imageset.cpp

Qu'est-ce que le méta-paramètre `weight_decay` dans Caffe?

Qu'est-ce que la profondeur d'un réseau de neurones convolutionnels?

Causes communes de nans pendant la formation

Extraire des fonctionnalités à l'aide de CNN pré-formé (Tensorflow)

Comment interpréter "perte" et "précision" pour un modèle d'apprentissage automatique

Pourquoi l'entrée est-elle mise à l'échelle dans tf.nn.dropout dans tensorflow?

Comment fonctionne le désengagement et la déconvolution dans DeConvNet

Formation sur les données déséquilibrées avec TensorFlow

Naive Bayes vs SVM pour classer les données texte

Comment déterminer le nombre de couches et de nœuds d'un réseau neuronal

Techniques d'augmentation des données pour les petits ensembles de données d'images?

Comment appliquer l'écrêtage dégradé dans TensorFlow?

Qu'est-ce que l'initialiseur de variables par défaut dans Tensorflow?

Comment comprendre le terme "tensor" dans TensorFlow?

Comment mettre plus de poids sur certaines fonctionnalités du machine learning?

Comment calculer le nombre de paramètres d'un réseau LSTM?

TensorFlow - régularisation avec perte de L2, comment s’appliquer à tous les poids, pas seulement au dernier?

TensorFlow - introduisant à la fois la régularisation L2 et le décrochage dans le réseau. Cela a-t-il un sens?

Normalisation des lots dans un réseau de neurones convolutifs

Plusieurs sessions et graphiques dans Tensorflow (dans le même processus)

Keras peut-il gérer des images d'entrée de tailles différentes?

Gradients de stratégie dans Keras

keras: quelle est la différence entre model.predict et model.predict_proba

Quelle est l'intuition d'utiliser le tanh en LSTM

Différence entre la couche dense et la couche d'activation dans Keras

keras: comment sauvegarder l'historique des entraînements

Pourquoi les réseaux de neurones invariants en rotation ne sont-ils pas utilisés par les gagnants des compétitions populaires?

Qu'est-ce qu'un lot dans TensorFlow?

Pourquoi le binary_crossentropy est-il plus précis que categorical_crossentropy pour la classification multiclasse dans Keras?

Qu'est-ce qu'une couche `` Python '' dans caffe?

Quelle est la signification des logits Word dans TensorFlow?

Comment keras définit-il "précision" et "perte"?

Comment utiliser la couche "BatchNorm" dans le café?

TensorFlow: tf.train.batch charge-t-il automatiquement le prochain lot lorsque celui-ci est terminé?

Tensorflow Slim: TypeError: int32 prévu, liste contenant les tenseurs de type '_Message' à la place

Former un classificateur d'images multi-classes à Keras

Comment inspecter des variables dans un fichier de point de contrôle dans TensorFlow lorsque TensorFlow ne peut pas trouver l'attribut tools?

Keras binary_crossentropy vs categorical_crossentropy performance?

Comment rendre TensorFlow + Keras rapide avec un ensemble de données TFRecord?

Erreur Keras: attendue pour voir 1 tableau

Compréhension intuitive des convolutions 1D, 2D et 3D dans les réseaux de neurones convolutionnels

Est-ce un bon taux d'apprentissage pour la méthode Adam?

Plusieurs à un et plusieurs à plusieurs exemples de LSTM à Keras

enregistrer le temps de calcul pour chaque époque en Keras pendant model.fit ()

LSTMStateTuple vs cell.zero_state () pour RNN dans Tensorflow

Erreur Keras: dense_input_1 devrait avoir 3 dimensions

Rôle de "Flatten" dans Keras

Comment calculer l'incertitude de prédiction à l'aide de Keras?

Comment implémenter la segmentation sémantique multi-classes?

Optimisation hyperparamétrique pour le modèle Pytorch

Quelle est la différence entre Keras model.evaluate () et model.predict ()?

Keras - Différence entre categorical_accuracy et sparse_categorical_accuracy

Données déséquilibrées et entropie croisée pondérée

Pourquoi est-ce que j'obtiens AttributeError: l'objet 'KerasClassifier' n'a pas d'attribut 'modèle'?

LSTM Autoencoder

Comment obtenir des mini-lots dans du pytorch de manière propre et efficace?

Est-il normal d’utiliser la normalisation par lots dans RNN/lstm RNN?

Meilleure stratégie pour réduire les faux positifs: la nouvelle API de détection d'objets de Google sur l'imagerie satellite

Keras Text Preprocessing - Enregistrement d'un objet Tokenizer dans un fichier pour le scoring

Keras: différence de précision model.evaluate vs model.predict dans une tâche PNL multi-classe

Keras: Comment utiliser Predict_Generator avec ImageDataGenerator?

Comment gérer une entrée de taille variable dans CNN avec Keras?

Couche d'entrée du modèle séquentiel Keras

Comment calculer la taille optimale du lot

Fractionner le répertoire de données en répertoire de formation et de test avec la structure de sous-répertoires préservée

ResNet: précision de 100% pendant l'entraînement, mais précision de prédiction de 33% avec les mêmes données

Pytorch: comment convertir des données en tenseur

Comment comprendre la perte acc val_loss val_acc dans l’ajustement du modèle de Keras

Qu'est-ce que les «métriques» dans Keras?

Quel est le rôle de la couche TimeDistributed dans Keras?