web-dev-qa-db-fra.com

Quelle est la différence entre une fonctionnalité et une étiquette?

Je suis un tutoriel sur les bases de l’apprentissage automatique et il est mentionné que quelque chose peut être une fonctionnalité ou un label .

D'après ce que je sais, une fonctionnalité est une propriété des données en cours d'utilisation. Je ne peux pas comprendre quelle est l'étiquette, je connais le sens du mot, mais je veux savoir ce que cela signifie dans le contexte de l'apprentissage automatique.

78
Wojtek Wencel

En bref, fonctionnalité est entrée; l'étiquette est sortie. Cela s'applique aux problèmes de classification et de régression.

Une fonctionnalité est une colonne des données de votre jeu d'entrées. Par exemple, si vous essayez de prédire le type d'animal que quelqu'un choisira, vos caractéristiques d'entrée peuvent inclure l'âge, la région d'origine, le revenu familial, etc. L'étiquette est le choix final, comme chien, poisson, iguane, rocher etc.

Une fois que vous avez formé votre modèle, vous lui donnerez une série de nouvelles entrées contenant ces fonctionnalités. il renverra "l'étiquette" prévue (type d'animal) pour cette personne.

156
Prune

Caractéristique:

Apprentissage automatique signifie une propriété de vos données d’entraînement. Ou vous pouvez dire un nom de colonne dans votre jeu de données d'apprentissage.

Supposons que ceci soit votre jeu de données d'entraînement

Height   Sex   Age
 61.5     M     20
 55.5     F     30
 64.5     M     41
 55.5     F     51
 .     .     .
 .     .     .
 .     .     .
 .     .     .

Ensuite, voici Height, Sex et Age sont les caractéristiques.

label:

Le résultat que vous obtenez de votre modèle après l’avoir formé est appelé étiquette.

Supposons que vous alimentiez un ensemble d'algorithmes au-dessus d'un ensemble de données et générez un modèle permettant de prédire le sexe en tant qu'homme ou femme. Dans le modèle ci-dessus, vous transmettez des caractéristiques telles que age, height etc.

Donc, après le calcul, le genre sera masculin ou féminin. C'est appelé un Label

24
Saurabh Agrawal

Prenons un exemple où nous souhaitons détecter l'alphabet à l'aide de photos manuscrites. Nous introduisons ces exemples d'images dans le programme et le programme les classe en fonction des caractéristiques qu'ils ont obtenues.

Voici un exemple d’entité dans ce contexte: la lettre 'C' peut être considérée comme une concave tournée vers la droite.

Une question se pose maintenant sur la manière de stocker ces fonctionnalités. Nous devons les nommer. Voici le rôle du label qui existe. Un étiquette est attribué à ces fonctionnalités pour les distinguer des autres fonctionnalités.

Ainsi, nous obtenons étiquettes en sortie avec caractéristiques en entrée.

Les étiquettes sont pas associées à un apprentissage non supervisé.

4
FutureJJ

Voici une approche plus visuelle pour expliquer le concept. Imaginez que vous souhaitiez classer l'animal présenté sur une photo.

Les classes d'animaux possibles sont par exemple des chats ou des oiseaux. Dans ce cas, l'étiquette correspond aux associations de classe possibles, par exemple. chat ou un oiseau, que votre algorithme d'apprentissage automatique prédira.

Les caractéristiques sont des motifs, des couleurs, des formes qui font partie de vos images, par exemple. sourcils, plumes, ou plus d'interprétation de bas niveau, valeurs de pixels.

Bird Label: Oiseau
Caractéristiques: plumes

Cat

Étiquette: Cat
Caractéristiques: Furr

3
mrk

Une fonctionnalité brièvement expliquée serait l'entrée que vous avez introduite dans le système et l'étiquette serait la sortie attendue. Par exemple, vous avez nourri de nombreuses caractéristiques d’un chien, telles que sa taille, sa couleur de fourrure, etc., de sorte qu’après le calcul, le chien que vous souhaitez connaître sera renvoyé.

2
Aman pradhan

Condition préalable: statistiques de base et exposition à ML (régression linéaire).

On peut y répondre en une phrase -

Ils se ressemblent mais leur définition change en fonction des nécessités.

Explication

Laissez-moi expliquer ma déclaration. Supposons que vous ayez un jeu de données. Pour ce faire, considérons exercise.csv. Chaque colonne du jeu de données est appelée entité. Le sexe, l'âge, la taille, la fréquence cardiaque, la température corporelle et les calories peuvent figurer parmi les différentes colonnes. Chaque colonne représente des caractéristiques ou des propriétés distinctes.

exercice.csv

User_ID  Gender Age  Height  Weight Duration    Heart_Rate  Body_Temp   Calories
14733363 male   68  190.0   94.0    29.0           105.0    40.8        231.0
14861698 female 20  166.0   60.0    14.0            94.0    40.3        66.0
11179863 male   69  179.0   79.0    5.0             88.0    38.7        26.0

Pour consolider la compréhension et résoudre le problème, prenons deux problèmes différents (cas de prédiction).

CAS 1: Dans ce cas, nous pourrions envisager d'utiliser - Sexe, taille et poids pour prédire les calories brûlées pendant l'exercice. Cette prédiction (Y) Les calories Voici une LabelLes calories est la colonne que vous souhaitez prédire à l'aide de diverses fonctionnalités telles que - x1: sexe, x2: hauteur et x3: poids.

CAS2: Dans le deuxième cas, nous pourrions vouloir prédire le Heart_rate en utilisant le genre et le poids comme caractéristique. Ici Heart_Rate est un Label prédit en utilisant caractéristiques - x1: sexe et x2: poids.

Une fois que vous avez compris l'explication ci-dessus, vous ne serez plus vraiment confus avec Label et fonctionnalités.

0
Socul Zlmu