J'exécute un test d'utilisation pour 12 participants répartis en 2 ensembles de 3 sous-groupes (type d'utilisateur et emplacement d'utilisateur - ce ne sont PAS des groupes mutuellement exclusifs).
J'ai besoin de produire 7 résultats différents SUS: global, u-type-a, u-type-b, u-type-c, geo-loc-a, geo-loc-b, geo-loc-c.
De toute évidence, SUS s'appuie sur des statistiques autodéclarées fournies après l'expérience - cela signifie que les résultats ne sont pas nécessairement exacts à 100% et pourraient probablement bénéficier d'être présentés avec une sorte de marge d'erreur (pour erreur de lecture "erreur de mémorisation", "incompréhension", "biais de système alternatif", etc.).
Étant donné que le SUS est un calcul relativement complexe, il y a beaucoup de points à ajouter dans une marge d'erreur: sur les scores des questions, sur le score total, sur le pourcentage par utilisateur ou sur la moyenne pour le groupe d'utilisateurs.
Ma question est la suivante: quelle marge, le cas échéant, dois-je prévoir et où dois-je l'ajouter dans le calcul?
Ma question est la suivante: quelle marge, le cas échéant, dois-je prévoir et où dois-je l'ajouter dans le calcul?
Une barre d'erreur n'a aucun sens pour les scores SUS individuels.
Il serait judicieux de présenter des scores moyens groupés, puis d'afficher un écart-type pour chaque groupe.
Si vous êtes inquiet à propos de l'audience pour les résultats lisant trop dans de petites variations de SUS scores entre individus ou groupes, alors envisagez peut-être mappage des scores SUS sur un adjectif échelle de notation .