web-dev-qa-db-fra.com

Corpus / mots vides non trouvés lors de l'importation de la bibliothèque nltk

J'essaie d'importer le paquet nltk dans python 2.7

  import nltk
  stopwords = nltk.corpus.stopwords.words('english')
  print(stopwords[:10])

En cours d'exécution, cela me donne l'erreur suivante:

LookupError: 
**********************************************************************
Resource 'corpora/stopwords' not found.  Please use the NLTK
Downloader to obtain the resource:  >>> nltk.download()

C'est pourquoi j'ai ouvert mon python termin et fait ce qui suit:

import nltk  
nltk.download()

Ce qui me donne:

showing info https://raw.githubusercontent.com/nltk/nltk_data/gh-pages/index.xml

Cependant, cela ne semble pas s'arrêter. Et le relancer me donne toujours la même erreur. Des pensées où cela ne va pas?

33
Frits Verstraten

Vous essayez actuellement de télécharger chaque élément dans les données nltk, ce qui peut prendre beaucoup de temps. Vous pouvez essayer de télécharger uniquement les mots vides dont vous avez besoin:

import nltk
nltk.download('stopwords')
49
Kurt Bourbaki

Les uns comme mentionné ici par Kurt Bourbaki mais dans la ligne de commande:

python -m nltk.downloader stopwords
17
Rafael Valero

Vous pouvez le faire séparément dans la console.
Cela vous donnera un résultat.

import nltk
nltk.download('stopwords')

J'ai utilisé la console jupyter lorsque j'ai fait face à ce problème.

6
Umesh

Si votre PC utilise un proxy pour la connectivité, essayez ceci:

import nltk

nltk.set_proxy('http://proxy.example.com:3128', ('USERNAME', 'PASSWORD'))
nltk.download('stopwords')
1
R Kumar

Vous pouvez entrer ceci en ligne de commande pour Python 3:

python3 -m nltk.downloader stopwords
1
Ehsan