De combien d'utilisateurs ai-je besoin pour exécuter un SUS et obtenir un résultat valide?

Question

J'ai mené une enquête sur l'échelle d'utilisation du système sur mon équipe (7 personnes), mais je ne suis pas sûr que cela suffise pour obtenir des résultats pertinents et je n'ai trouvé aucun article recommandant quoi que ce soit sur le nombre de personnes à interroger.

Est-ce que 6-7 suffit?

Evil Closet Monkey · Answer

Mesurer l'utilisabilité contient un article qui aborde brièvement la taille de l'échantillon. TL; DR: 2 est le minimum évident, 5 est un point de départ approprié.

De 10 choses à savoir sur l'échelle d'utilisation du système (SUS) :

Vous pouvez utiliser SUS sur des échantillons de petite taille: Une question courante que j'obtiens lorsque j'utilise SUS (ou lors de la mesure de l'utilisabilité en général) concerne la taille d'échantillon acceptable la plus basse. Techniquement, vous avez besoin d'au moins deux utilisateurs pour avoir une certaine mesure de variabilité (l'écart type) et pour générer des intervalles de confiance. Nous n'avons jamais fait de test en utilisant le SUS avec seulement deux utilisateurs. Nous signalerons toutefois le score SUS avec seulement cinq utilisateurs.

Cinq est souvent un nombre magique pour les études d'utilisabilité en phase précoce. Les intervalles de confiance seront plutôt larges, mais le score moyen de SUS sera étonnamment stable. Nous avons fait plusieurs simulations informatiques et montré qu’à un échantillon de 5, la moyenne de l’échantillon se situe à moins de six points d’un très grand échantillon SUS score 50% du temps (voir le graphique ci-dessous).

La figure ci-dessus montre la différence entre le score moyen SUS et la moyenne d'un échantillon de seulement 5 répétitions 1000 fois. Dans 50% des échantillons, le score SUS sur une taille d'échantillon de 5 se situait à moins de 6 points du vrai score SUS. Pas mal pour un si petit échantillon.

En d'autres termes, si le score réel de SUS était de 74, le score moyen de SUS de cinq utilisateurs se situera entre 66 et 80 la moitié du temps. Soixante-quinze pour cent du temps, le score différait de 10 points et 95% du temps, d'environ 17 points. En d'autres termes, vous atteignez le niveau approximatif du score réel de SUS dans plus de la moitié des cas avec des échantillons de très petite taille. Pour des mesures plus précises de la taille des échantillons, utilisez SUS Guide and Calculator .