web-dev-qa-db-fra.com

Le GAN est-il non supervisé ou supervisé?

J'ai entendu de certaines sources que les réseaux contradictoires génératifs ne sont pas supervisés ML, mais je ne comprends pas. Les réseaux contradictoires génératifs ne sont-ils pas en fait supervisés?

1) Boîtier 2 classes Real-contre-Fake

En effet, il faut fournir des données de formation au discriminateur et il doit s'agir de "vraies" données, c'est-à-dire des données que je qualifierais de f.e. 1. Même si l'on ne qualifie pas les données de manière explicite, on le fait implicitement en présentant le discriminateur dans les premières étapes avec des données d'apprentissage, que vous dites que le discriminateur est authentique. De cette façon, vous dites en quelque sorte au discriminateur un étiquetage des données de formation. Et au contraire un étiquetage des données de bruit générées aux premières étapes du générateur, que le générateur sait non authentiques.

2) Boîtier multi-classe

Mais cela devient vraiment étrange dans le cas de plusieurs classes. Il faut fournir des descriptions dans les données d'entraînement. La contradiction évidente est que l'on fournit une réponse à un algorithme ML non supervisé.

19
scrimau

Les GAN sont des algorithmes d'apprentissage non supervisés qui utilisent une perte supervisée dans le cadre de la formation. Le dernier semble être l'endroit où vous vous bloquez.

Lorsque nous parlons d'apprentissage supervisé, nous parlons généralement d'apprendre à prédire une étiquette associée aux données. objectif permet au modèle de généraliser à de nouvelles données.

Dans le cas GAN, vous n'avez aucun de ces composants. Les données arrivent sans étiquettes et nous n'essayons pas de généraliser tout type de prédiction aux nouvelles données. Le objectif est pour le GAN de modéliser à quoi ressemblent les données (c.-à-d. Estimation de la densité) et d'être capable de générer de nouveaux exemples de ce qu'il a appris.

Le GAN met en place un problème d'apprentissage supervisé afin d'effectuer un apprentissage non supervisé, génère des données factices/aléatoires et essaie de déterminer si un échantillon est généré de fausses données ou de vraies données. C'est un composant supervisé, oui. Mais ce n'est pas le objectif du GAN, et les étiquettes sont triviales.

L'idée d'utiliser un composant supervisé pour une tâche non supervisée n'est pas particulièrement nouvelle. Random Forests a fait cela pendant longtemps pour la détection des valeurs aberrantes (également formé sur des données aléatoires par rapport aux données réelles), et le SVM à une classe pour la détection des valeurs aberrantes est techniquement formé de manière supervisée avec les données d'origine étant la classe réelle et un point unique à l'origine de l'espace (c'est-à-dire le vecteur zéro) traité comme la classe aberrante.

25
Raff.Edward

ni. grosso modo, la hiérarchie ressemble à ceci:

               machine learning methodology
                             +
                             |
                             |
                             v
    +-----------------------------------------------+
    |                        |                      |
    |                        |                      |
    v                        v                      v
supervised              unsupervised           reinforcement
0
象嘉道