Je travaille actuellement sur ma thèse et travaille sur la réalisation d'une recherche d'utilisateur sur l'expérience Chatbot avec des utilisateurs réels. Actuellement, je vais tester trois prototypes de chatbot différents pour tester:
(1) Pour chaque prototype, je trouverai environ 5 à 7 utilisateurs pour le tester
(2) Pour tester chaque prototype, je les interviewez d'abord (de connaître leur utilisation de Chatbot, de l'arrière-plan, etc.), puis des tests de convivialité (en leur donnant des tâches), et enfin, je voulais utiliser des métriques pour mesurer la qualité de la qualité de la prototype.
(3) Je me demande si quelqu'un recommande des métriques pour mesurer la convivialité d'une application Chatbot? J'ai actuellement prévu d'utiliser le SUS, que j'ai trouvé quelques thèses en l'utilisant pour évaluer Chatbot, mais je ne suis pas sûr que cela fonctionne avec un petit nombre d'échantillons (5 utilisateurs).
Est-ce que quelqu'un recommande des approches différentes?
Lorsque vous effectuez des tests de convivialité, Taux d'achèvement des tâches Combiné à une mesure de la convivialité standard, c'est généralement suffisamment de données pour moi. Pour la mesure de la facilité d'utilisation standard, le SUS fonctionne définitivement, mais je me tourne souvent vers mux-Lite à la place. Il ne s'agit que de 2 questions et peut être convertie en un = SUS Noter de manière fiable.
En ce qui concerne le nombre d'utilisateurs dont vous avez besoin pour le SUS, il y a une bonne réponse dans ce fil: Combien d'utilisateurs dois-je avoir besoin d'exécuter A SUS et obtenir un résultat valide? Englisons