web-dev-qa-db-fra.com

Analyser HTML avec c # .net

J'essaie d'analyser le fichier HTML suivant, j'aimerais obtenir la valeur de la clé. Cela se fait sur Silverlight pour Windows Phone.

<HTML>
<link ref="shortcut icon" href="favicon.ico">
<BODY>
<script Language="JavaScript">
location.href="login.html?key=UEFu1EIsgGTgAV7guTRhsgrTQU28TImSZkYhPMLj7BChpBkvlCO11aJU2Alj4jc5"
</script>
<CENTER><a href="login.html?key=UEFu1EIsgGTgAV7guTRhsgrTQU28TImSZkYhPMLj7BChpBkvlCO11aJU2Alj4jc5">Welcome</a></CENTER></BODY></HTML>

une idée sur où aller d'ici?

merci

47
Nathan

Jetez un œil au HTMLAgilityPack. C'est un analyseur HTML assez décent

http://html-agility-pack.net/?z=codeplex

======

Voici un code pour vous aider à démarrer (nécessite une vérification des erreurs)

HtmlDocument document = new HtmlDocument(); 
string htmlString = "<html>blabla</html>";
document.LoadHtml(htmlString);
HtmlNodeCollection collection = document.DocumentNode.SelectNodes("//a");
foreach (HtmlNode link in collection)
{
     string target = link.Attributes["href"].Value;
}
68
Kurru

Vous pouvez utiliser l'expression régulière ( classe Regex ) pour cela. L'expression peut être quelque chose comme ça: login.html\?key=[^"]*

0
Rafal Spacjer