web-dev-qa-db-fra.com

résumer le texte ou simplifier le texte

Existe-t-il une bibliothèque, de préférence en python mais au moins en source ouverte, capable de résumer et/ou de simplifier le texte en langage naturel?

29
captainandcoke

Je ne sais pas si certaines bibliothèques le font actuellement, que ce soit sous forme de résumé de texte ou au moins compréhensible, qu'un résumé de texte ne soit pas facilement accompli par une simple bibliothèque plug & play.

Voici quelques liens que j'ai réussi à trouver concernant les projets/ressources liés au résumé de texte pour vous aider à démarrer:

J'espère que cela pourra aider :)

17
Rion Williams

Peut-être que vous pouvez essayer sumy . C'est une assez petite bibliothèque que j'ai écrite en Python. Les approches de Luhn et Edmundson, la méthode LSA, les algorithmes SumBasic, KL-Sum, LexRank et TextRank ont ​​été mis en œuvre. Apache2 est sous licence et prend en charge les langues tchèque, slovaque, anglaise, française, japonaise, chinoise, portugaise, espagnole et allemande.

N'hésitez pas à ouvrir un problème ou à envoyer une demande d'extraction s'il manque quelque chose.

25
Mišo

J'avais aussi besoin de la même chose mais je n'ai rien trouvé dans Python qui m'a aidé à obtenir un résultat Comprehensive.

J'ai donc trouvé ce service Web vraiment utile, et ils ont un API gratuit qui donne un résultat JSON, et je voulais le partager avec vous.

Découvrez-le ici: http://smmry.com

4
ant0nisk

Jetez un oeil à cet article article qui fait une étude détaillée de ces méthodes et packages:

  1. Lex_rank ( sumy )
  2. LSA (sumy)
  3. Luhn (sumy)
  4. PyTeaser
  5. Gensim TextRank
  6. PyTextRank
  7. Google TextSum

La fin de l'article fait un ' summary '. 

L'auteur de sumy @ miso.belica a donné une description dans une réponse ci-dessus.

Diverses autres techniques ML ont fait leur apparition, telles que Facebook/NAMAS et Google/TextSum, mais nécessitent toujours une formation poussée en Gigaword Dataset et environ 7 000 heures sur un processeur graphique. L'ensemble de données lui-même est assez coûteux.

En conclusion, je dirais que le sumy est actuellement la meilleure option sur le marché si vous n'avez pas accès à des machines haut de gamme. Merci beaucoup à miso.belica pour ce merveilleux forfait.

2
Ganesh K

Pas python mais MEAD fera le résumé du texte (c'est en Perl). Habituellement, ce qui sort est compréhensible, voire toujours très fluide. Consultez également summary.com pour de nombreuses informations utiles sur la tâche de synthèse de texte.

2
ealdent

Essayez Open Text Summarizer qui est publié sous la licence open source GPL. Cela fonctionne assez bien, mais aucun travail de développement n’a eu lieu depuis 2007. 

Le code original est écrit en C (à la fois une bibliothèque et un utilitaire de ligne de commande), mais il est enveloppé dans plusieurs langues:

2
JohnTESlade

Il y a quelque temps, j'ai écrit une bibliothèque de synthèse pour python en utilisant NLTK, en utilisant un algorithme de la bibliothèque Classifier4J. C'est assez simple, mais cela peut convenir aux personnes qui ont besoin de résumer: https://github.com/thavelick/summarize

0
Tristan Havelick