web-dev-qa-db-fra.com

Parse HTML avec HTML DomDocument de PHP

J'essayais de le faire avec "getelementsbytagname", mais cela ne fonctionnait pas, je suis nouveau à utiliser Domdocument pour analyser HTML, comme je l'avais l'habitude d'utiliser Regex jusqu'à hier, certains fokes de nature me disaient ici que Domedocument serait mieux pour le Job, alors je vais essayer :)

Je google pour un moment pour un moment à la recherche d'une explication mais n'a rien trouvé qui a aidé (pas avec la classe de toute façon)

Je souhaite donc capturer "Capturer ce texte 1" et "capturer ce texte 2" et ainsi de suite.

Ne regarde pas fort, mais je ne peux pas comprendre :(

<div class="main">
    <div class="text">
    Capture this text 1
    </div>
</div>

<div class="main">
    <div class="text">
    Capture this text 2
    </div>
</div>
22
Mint

Vous pouvez utiliser http://simplehtmldom.sourceforgege.net/

Il est très simple d'utiliser Dom analyseur écrit dans PHP, par lequel vous pouvez facilement récupérer le contenu de la balise div.

Quelque chose comme ça:

// Find all <div> which have attribute id=text
$ret = $html->find('div[id=text]'); 

Voir la documentation de cela pour plus d'aide.

1
lokeshsk