web-dev-qa-db-fra.com

Comment obtenir et enregistrer du contenu Wordpress (html, css, images, vidéos) à partir d'un programme Java?

Je m'excuse si ce n'est pas le bon endroit pour poser cette question. S'il vous plaît si ce n'est pas m'aider à trouver où je dois le demander.

Alors voici mon défi. J'ai besoin d'obtenir et de sauvegarder du contenu WordPress (HTML, CSS, images et vidéos) à partir d'un programme Java.

          HTML, images, CSS
WordPress -----------------> File system

Ensuite, j'aimerais analyser ce contenu pour intégrer les pages dans mon application Web Spring existante. Par exemple, cela signifie que

http://localhost/wp-content/image1.png

devra changer en

http://localhost/spring/image1.png

de travailler dans mon application de printemps.

J'ai pensé à beaucoup de possibilités jusqu'à présent. J'aimerais avoir votre avis et peut-être suggérer d'autres solutions auxquelles je n'ai pas pensé.

  1. Utilisez ce petit programme Java wget pour obtenir tout le contenu du site WordPress, puis enregistrez-le. Avantages : Il est certain que son objectif est de créer des miroirs de site. Inconvénients : Les liens ne fonctionneront pas dans mon application Spring et je devrai analyser les codes html et css de toute façon.

  2. Utilisez jsoup . Avantages : En tant qu'analyseur, je peux directement modifier l'URL pour l'intégrer dans mon application Spring. Inconvénients : Vous ne pouvez pas être sûr qu'il est possible de sauvegarder le contenu sur le disque dur.

  3. Utilisez un plugin WordPress pour exporter des pages. Avantages : Seules les pages relatives à la modification en cours sont sauvegardées sur le disque dur (il est possible de spécifier un dossier). Inconvénients : Ce n'est pas en Java (je ne peux pas maintenir le plugin). Quoi qu'il en soit, je dois regarder le dossier de destination et chaque fois qu'un fichier est modifié, je dois le réparer pour changer les liens et le faire fonctionner dans mon application de printemps.

Je n'ai pas trouvé d'autres solutions et toutes ces solutions sont très mauvaises. Pensez-vous à d'autres moyens de le faire?

Merci de votre aide.

1
Clemzd

Je peux répondre à ma propre question. Jsoup peut faire ce dont j'ai besoin:

  1. Extraire le contenu (testé)
  2. Changer le lien pour Spring (testé)
  3. Enregistrer HTML (testé), images (testé), vidéos (non encore testé)
1
Clemzd