web-dev-qa-db-fra.com

Ensembles de données pour la détection des émotions dans le texte

J'implémente un système qui pourrait détecter l'émotion humaine dans le texte. Existe-t-il des ensembles de données annotés manuellement pour l'apprentissage et les tests supervisés?

Voici quelques ensembles de données intéressants: https://dataturks.com/projects/trending

22
ekka

Le domaine de la détection des émotions textuelles est encore très nouveau et la littérature est fragmentée dans de nombreuses revues différentes de différents domaines. C'est vraiment difficile d'avoir un bon aperçu de ce qui existe.

A noter qu'il existe plusieurs théories émotionnelles psychologiques. Il existe donc différentes manières de modéliser/représenter les émotions dans l'informatique. La plupart du temps, "l'émotion" fait référence à des phénomènes tels que la colère, la peur ou la joie. D'autres théories affirment que toutes les émotions peuvent être représentées dans un espace multidimensionnel (il y en a donc un nombre infini).

Voici quelques ensembles de données (accessibles au public) que je connais (mis à jour):

  1. EmoBank. 10k phrases annotées avec les valeurs de Valence, d'excitation et de dominance (divulgation: je suis l'un des auteurs). https://github.com/JULIELab/EmoBank

  2. L'ensemble de données "Emotion Intensity in Tweets" de la tâche partagée WASSA 2017. http://saifmohammad.com/WebPages/EmotionIntensity-SharedTask.html

  3. Les messages Facebook de Valence et d'excitation par Preotiuc-Pietro et autres: http://wwbp.org/downloads/public_data/dataset-fb-valence-arousal-anon.csv

  4. Les données Affect par Cecilia Ovesdotter Alm: http://people.rc.rit.edu/~coagla/affectdata/index.html

  5. L'ensemble de données Emotion in Text par CrowdFlower https://www.crowdflower.com/wp-content/uploads/2016/07/text_emotion.csv

  6. ISEAR: http://emotion-research.net/toolbox/toolboxdatabase.2006-10-13.2581092615

  7. Corpus de test de SemEval 2007 (Tâche sur le texte affectif) http://web.eecs.umich.edu/~mihalcea/downloads.html

  8. Une ré-annotation des données SemEval Stance avec des émotions: http://www.ims.uni-stuttgart.de/data/ssec

Si vous souhaitez approfondir le sujet, voici quelques sondages que je recommande (divulgation: j'ai créé le premier).

  1. Buechel, S., Hahn, U. (2016). Analyse des émotions comme problème de régression - Modèles dimensionnels et leurs implications sur la représentation des émotions et l'évaluation métrique. Dans ECAI 2016.22nd European Conference on Artificial Intelligence (pp. 1114-1122). La Haye, Pays-Bas (disponible: http://ebooks.iospress.nl/volumearticle/44864 ).

  2. Canales, L., Martínez-Barco, P. (s.d.). Détection d'émotion à partir du texte: une enquête. Processing in the 5th Information Systems Research Working Days (JISIC 2014), 37 (disponible: http://www.aclweb.org/anthology/W14-6905 ).

37
buechel