web-dev-qa-db-fra.com

Comment syndiquer des sites Web sans RSS?

Je souhaite créer un lien vers quatre sites Web à partir d'un site Web. Mais ce qui compte, c’est qu’au-delà d’un simple lien vers les sites, je cherchais un moyen d’afficher les mises à jour de ces sites sur mon site. Je sais que cela est possible grâce à la syndication RSS, mais est-ce possible sans RSS?

Autrement dit, pour autant que je sache, les quatre sites Web ne disposent pas de flux RSS. Mais j'espérais toujours regrouper les mises à jour de ces sites Web en un seul endroit.

METTRE À JOUR:

Les clients doivent accéder à quatre sites Web et rechercher manuellement les mises à jour. Plutôt que de laisser mes clients consulter chaque site manuellement en cliquant sur les liens de mon site, j'espérais qu'il serait possible de créer un widget ou quelque chose qui permettrait d'afficher des extraits de contenu de ces quatre sites.

Mon site Web devrait afficher le contenu le plus récent des autres sites. Un peu comme Google Reader peut le faire avec les flux RSS. Mais ces 4 sites ne supportent pas le RSS.

4
Webs

Je peux penser de 3 manières - 1) fonction ImportHtml de Google Spreadsheets peut vous aider à gratter le contenu de n'importe quel site Web. Vous pouvez alors incorporer ces données de tableur sous forme de widget

2) Utilisez YQL . Nécessite un peu de programmation mais le travail est simplifié

3) Check cet article explique comment créer un flux RSS de n’importe quel site Web sans logiciel ni écrire une seule ligne de code XML . En utilisant cette méthode, vous n'avez même pas besoin d'être le propriétaire du site pour créer le flux.

4
mvark

Comme mentionné ci-dessus, sans RSS ni aucune API sur laquelle vous pouvez puiser, vous serez obligé de saisir et d'analyser ces sites Web. Vous voudrez probablement utiliser un travail cron pour exécuter votre robot d'exploration sur une base prédéterminée. Il ne devrait pas être plus fréquent que ces sites soient mis à jour.

Vous devez également vérifier que les propriétaires des autres sites ne s'opposent pas à la suppression de leurs sites Web. Si rien d’autre, il est bon de demander la permission de le faire à l’avance.

Voir cette réponse pour les débuts d'une solution basée sur PHP.

2
John Conde

s’ils ne prennent pas en charge RSS, le mieux est probablement d’écrire un script capable d’analyser le code HTML de ces pages et d’obtenir le contenu pertinent.

1
GSto

Vous pouvez également envoyer un courrier électronique à ces sites Web et leur demander de publier des flux RSS.

1
Virtuosi Media