Notes: 3 étoiles contre 5 étoiles. Pourquoi 5?

Question

L'interface la plus couramment utilisée pour afficher les votes est le "système de classement par étoiles", dans lequel un nombre particulier de points (souvent exprimés en étoiles) est attribué à un élément par chaque critique. On retrouve ce modèle sur de nombreux sites, d'Amazon à Yelp. Les étoiles semblent être un mécanisme assez simple, à la fois pour vos utilisateurs (les systèmes de notation 5 étoiles semblent être partout, donc les utilisateurs ne les connaissent pas) et pour nous, prévoyez.

Mais 3 étoiles, pour prendre une décision, je pense donner un meilleur aperçu aux consommateurs vs 5 étoiles. Mais quelle est la physcologie derrière le numéro 5 dans les évaluations? Pourquoi pas 3?

Kit Grose · Answer

Il y a eu un cas fantastique avancé il y a quelque temps (si je le trouve, je modifierai cette réponse) que le nombre idéal est en fait 4 étoiles.

L'idée est que les gens gravitent naturellement vers les 3 dans un système à 5 étoiles (ou les 2 dans un système à 3 étoiles) parce que c'est facile. Allez-y et regardez votre bibliothèque iTunes; si vous êtes comme moi, vous avez des milliards de 3.

En fournissant uniquement des options positives ou négatives et en supprimant "neutre", vous obtenez apparemment des commentaires plus significatifs de la part des utilisateurs.

Je ne peux me porter garant d'aucun de ces esprits, n'ayant jamais eu besoin de l'appliquer, et je ne suis pas sûr que le fait de noter des choses sur 4 rendrait les utilisateurs désorientés ou mal à l'aise, mais c'est une pensée intéressante.

Edit: Je ne trouve toujours pas l'article auquel je faisais référence, mais Zeldman présente un cas similaire ici . Les commentaires présentent une discussion animée soutenant et s'opposant à la nécessité d'abolir l'option "neutre"/"peut-être", y compris certains qui contestent la revendication de "la plupart des gens gravitent vers 3".

Une autre source vraiment formidable pour cette discussion est le blog Life With Alacrity , qui a n article discutant explicitement de l'échelle 5 étoiles et un autre sur évaluation comparative de systèmes de notation plus généralement

Édition supplémentaire: Dans un souci de clarification, je résumerai ainsi mes opinions/compréhension: des recherches ont été effectuées sur la distribution des notations optionnelles sur un système conventionnel. échelle à cinq étoiles, et cette recherche semble suggérer que les gens gravitent vers des notes plus élevées (3s, 4s et 5s), en particulier 4. Un système facultatif à 5 étoiles permet en fait 6 notes; 0–5. Cela signifie que dans une distribution uniforme, vous vous attendriez à ce que chaque note ait 17% de l'ensemble, et dans une distribution normale, vous vous attendriez à ce que les notes les plus populaires soient 2 et 3.

Il est probablement déraisonnable de suggérer que les utilisateurs suivront une distribution normale des classements, surtout s'ils sont propriétaires du contenu ou se sont auto-sélectionnés pour l'aimer (comme dans une bibliothèque iTunes). Il convient également de souligner que les utilisateurs choisissent rarement délibérément "sans évaluation"; étant la note par défaut (et rendant ainsi les autres notes facultatives), il est susceptible d'être surreprésenté dans l'ensemble.

Il n'y a donc pas de solution générale ici, sauf si vous forcez les gens à sélectionner une note (c.-à-d. Exclure "zéro étoiles" en option), et si les utilisateurs sont également susceptibles de rencontrer des éléments qu'ils n'aiment pas du tout comme ceux qu'ils aiment fortement (par exemple 1- les éléments étoiles sont aussi susceptibles que les éléments 5 étoiles).

Étant donné que cela décrit très peu de systèmes (une exception notable étant les critiques de films de journaux réels, qui, je crois, sont à l'origine du système), vous pouvez bénéficier d'expérimenter avec des systèmes non standard, et en particulier des systèmes qui excluent entièrement une option "neutre". .

Ben Brocka · Answer

Ici, nous avons deux problèmes; vous perdez beaucoup de granularité pour notes détaillées (avec des critiques/etc), et les utilisateurs de notes non détaillées (juste une note, pas de critique) n'utilisez pas vraiment de votes neutres.

Des notes détaillées comme les critiques d'Amazon besoin une granularité supplémentaire. Par détaillé, je veux dire que les utilisateurs font plus que noter; ils expliquent pourquoi, ils donnent un avis complet pour accompagner leur note. Voir Choix collectif: systèmes de notation qui montre précisément pourquoi les systèmes à 3 points (eBay est leur exemple) ne sont pas très utiles pour les examens approfondis; ils sont notables ne sont pas granulaires, ne sont pas statistiquement utiles, et ils ne sont pas distincts .

En revanche, les systèmes de notation 5 étoiles sont plus granulaires (il y a les niveaux "un peu mieux que la moyenne, un peu pire que la moyenne"), ils sont plus distincts grâce à cette granularité supplémentaire, et ils suivent plus souvent une distribution normale lorsqu'il est utilisé avec des évaluations détaillées, comme expliqué plus en détail par tilisation de systèmes d'évaluation 5 étoiles .

Pour le deuxième point, voyez juste Five Stars Dominate Ratings , un article de blog Youtube partageant leurs statistiques sur l'utilisation des notes. Youtube est une situation de "notes superficielles" ou de notes non détaillées. Non détaillé signifie qu'il n'y a aucune rétroaction autre que la note; aucune explication pourquoi, juste une note. Généralement, dans cette situation, les gens aiment ou non. tilisation de systèmes de notation à 5 étoiles indique spécifiquement comment les systèmes de notation non détaillés ont tendance à suivre une distribution bimodale regroupée autour de deux nombres (généralement le plus élevé et le plus bas).

Présenter le système ternaire demande simplement de la confusion; si votre système de notation devrait vraiment avoir un système de notation superficiel de "je l'aime, c'est meh, je ne l'aime pas", je recommanderais fortement d'abandonner les étoiles et faire un système de pouce levé/descendant qui est facile à comprendre. Suivre une distribution bimodale avec seulement 3 notes signifie qu'une de ces notes (presque toujours "neutre") va être ignorée.

Schroedingers Cat · Answer

Le livre que j'ai sur la rédaction de questionnaires (Bradburn N; Sudman S et Wansink B (2004) Asking Questions - a definitive guide to questionnaire Design. San Fransisco: Jossey-Bass) - que j'ai utilisé comme mon guide définitif - plaide fortement pour 5 ou 4 échelles de points, selon ce que vous recherchez. Bien qu'il s'applique spécifiquement aux questionnaires, les arguments sont les mêmes pour un système de notation, qui n'est qu'un questionnaire avec une question.

Une échelle de 5 points a l'avantage que les gens peuvent exprimer leur approbation ou leur désapprobation, sans être extrêmes. Ils peuvent également exprimer la réponse extrême s'ils le souhaitent. Mais les gens ont tendance à être réticents à l'extrême. S'il y avait 3 étoiles, vous perdriez des gens qui aiment ça, car ils pourraient mettre "comme" ou "pas de sentiments". En l'état, vous pouvez combiner le "comme" un "amour" dans toutes les personnes qui ont une réponse positive, et cela devrait être plus précis.

Bien entendu, ces informations doivent toujours être considérées comme extrêmement bruyantes. Prendre des décisions commerciales sur la base de cela nécessite qu'une analyse détaillée ait été entreprise.

Les échelles à 4 points ont les mêmes avantages, mais supprimez l'option du milieu, forçant les gens à faire un choix positif ou négatif. Ce n'est pas une bonne option sur la notation Web, car beaucoup de gens sont assez neutres sur les produits. Perdre cela signifie que vos résultats ne refléteront que les personnes qui ont des sentiments forts. Vous perdrez un facteur d'équilibrage important qui, comme les données sont bruyantes, est utile à avoir.

dnbrv · Answer

Ce n'est pas seulement 3 étoiles vs 5 étoiles. C'est le principe de classement général: plus une échelle est granulée, plus la compréhension est profonde, mais il est également plus difficile de décider.

La raison de la popularité d'un système de notation à 5 points est sa simplicité. Cinq points est le nombre le moins élevé qui permet de saisir l'intégralité du sentiment: très mauvais, mauvais, neutre, bon, très bon. Toute échelle plus grande augmente simplement la granularité des classements bon et mauvais (pas les extrêmes).

Le problème avec l'échelle à 3 points est qu'elle oblige la personne à voter pour ou contre quelque chose lorsqu'elle ne se sent pas aussi radicalement et qu'elle n'est pas neutre à ce sujet. Cela peut potentiellement frustrer les gens, entraînant soit des votes incorrects, soit aucun vote du tout.

Si vous souhaitez simplifier le classement, faites glisser un cran vers un système oui/non, comme/n'aime pas, vote positif/négatif, etc. De cette façon, la neutralité sera signifiée par un zéro absolu lorsque les votes pour seront rejetés par des votes contre, mais vous serez toujours confronté au problème d'une mise à l'échelle insuffisante.

JeffH · Answer

Bien que je ne puisse citer aucune étude directe, je crois que la répartition de 5 étoiles sur 3 étoiles est de permettre un détail de grain fin lorsqu'il s'agit de revoir les produits. Dans un système d'évaluation 3 étoiles, les utilisateurs peuvent soit: aimer/aimer, penser que sa moyenne/ok, ou détester/détester tout ce qu'ils évaluent. Avec un système d'évaluation 5 étoiles, les utilisateurs ont la possibilité de dire quelque chose comme:

"(Note de 4) - C'est un bon produit mais je n'aime pas cette chose donc je ne l'aime pas complètement"

Ces deux niveaux de flexibilité supplémentaires permettent aux utilisateurs d'être plus honnêtes avec leurs réponses. Avec le système à 3 niveaux, cela ne peut tout simplement pas être fait à moins que l'utilisateur ne souhaite entrer une évaluation complète du produit. D'un point de vue UX, il est important de fournir la barrière la plus basse possible aux utilisateurs. Avec un système simple en un clic, la plupart des utilisateurs sont plus disposés à donner leur avis s'ils pensent que le système permet ensuite de transmettre honnêtement leur expérience avec le produit.

Amandeep Jiddewar · Answer

Je voudrais ajouter quelques aspects techniques pour répondre à votre question car d'autres réponses ont répondu Aspects psychologiques (et je sais que ce n'est pas ce que vous attendez, juste pour votre connaissance)

De nombreux sites Web comme permettent de dire que Netflix a quelque chose appelé moteur de recommandation, qui recommanderait aux utilisateurs des films que les utilisateurs aimeraient regarder, maintenant il montre également des cliquetis de ces films! , mais vous seriez étonné de savoir que la matrice des utilisateurs qui ont regardé et évalué le film est très clairsemée.

Maintenant, le travail le plus difficile est de deviner les notes (Netflix a également hébergé un Challenge ). Si vous avez une échelle de notation jusqu'à 3, il devient très difficile de les deviner si vous autorisez uniquement les évaluations en valeurs entières (ou dites à un intervalle de 0,5 comme la plupart d'entre elles le font). Par conséquent, ils ont choisi 5 pour la raison technique ci-dessus, et pour les raisons psychologiques dans les réponses ci-dessus.

webvitaly · Answer

IMHO star-system ne fonctionne pas bien.

Exemple: supposons que nous avons 2 votes "4 étoiles" pour l'article. Cela signifie donc que deux utilisateurs, qui ont voté, sont satisfaits et nous avons une note moyenne - 4 étoiles. Et après un certain temps est venu un nouvel utilisateur qui n'aime pas l'article et il évalue l'article avec un vote "1 étoile". Alors maintenant, notre note moyenne est (4 + 4 + 1)/3 = étoiles. Nous avons une moyenne moyenne pour l'article. Comme nous pouvons le voir, un utilisateur peut être plus puissant que deux autres.

Je pense que le système "j'aime pas" (plus-moins) fonctionne mieux. Vous pouvez le vérifier sur YouTube. Dans notre exemple, nous aurions: 1 moins et 2 plus = + 1. Cela signifie donc que cet article a plu à plus de la moitié des utilisateurs. Il est facile à utiliser et très instructif.

Darragh · Answer

Les utilisateurs ont un parti pris pour la neutralité lorsqu'ils ne peuvent pas décider. Je pense que si leur opinion ne correspond pas parfaitement à 1 ou 3 étoiles, ils passeront par défaut à 2 étoiles

Avec 3 étoiles, vous capturez le meilleur absolu, le pire absolu, et le bon, le mauvais et la moyenne sont combinés. La plupart des applications bénéficient de 5 étoiles qui compensent ce biais.

Danny Varod · Answer

Éditer:

Le système comme/n'aime pas est efficace pour savoir si quelque chose est bon. Le système d'étoile (ou mieux encore, verbal score) est bon pour savoir à quel point quelque chose est bon.

Si IMDB avait un système de type "J'aime/Je n'aime pas", vous pourriez probablement savoir si un film est bon ou non. Cependant, vous ne savez pas si un film est génial, bon, moyen, mauvais ou la pire chose que vous puissiez voir.

Peut-être que le meilleur système serait "j'aime/n'aime pas" suivi d'une question "combien?". =

Pour un aperçu de l'attribution des scores, lisez la section suivante ...

Si vous utilisez une échelle de 1 choix alors vous ne donnez vraiment aucun choix (même si vous pouvez compter le pourcentage d'électeurs, je ne suis pas sûr de l'efficacité de cette mesure). P.S. Les émissions télévisées de talent fonctionnent de cette façon.

Si vous utilisez une petite échelle de 2 choix (like/dislike), vous ne donnez pas d'option neutre (par exemple, "pas bien, pas mal"), donc l'option la plus proche des utilisateurs est de ne pas voter. Si les utilisateurs votent pour eux comme aversion, cela fait mal paraître les choses qui ne sont pas mauvaises. Par exemple: vote en série sur SE.

Si vous utilisez une échelle de choix (par exemple bad, neutral, good) alors les gens pourraient ne pas savoir comment classer les choses qu'ils aimaient un peu - bonnes ou neutres (et la même chose pour les choses qu'ils n'aimaient pas un peu).

Si vous utilisez une échelle de 4 choix, il n'y a pas d'option neutre pour les choses que vous n'avez ni aimées ni détestées.

Si vous utilisez une échelle de 5 choix, vous avez bad, baddish, neutral, goodish, good, afin que vous puissiez différer un peu les choses que vous avez aimées par rapport à celles que vous avez aimées (même chose avec détesté).

Il est difficile pour les gens de donner objectivement des scores sur à plus grande échelle par ex. 7 choix ou 11 choix (0 ... 10), même s'ils sont informatifs.

Prenez l'échelle à 7 choix de exceptionally bad, bad, baddish, neutral, goodish, good, exceptionally good par exemple, l'échelle est très informative, cependant, les utilisateurs peuvent voter exceptionnellement bien ou exceptionnellement mal sur un coup de tête au lieu de réfléchir à la signification ("Est-ce l'un des meilleurs (ou des pires) que j'ai jamais vu ou non?" ). N'utilisez pas de nombres pour les 5 choix ci-dessus, les choix verbaux fournissent une échelle commune.