Archiv

Archiv für August 2010

Ein einfaches Screen-Scraping-Tool mit C# erstellen (Tutorial Teil 2)

Nach dem ersten Teil folgt heute nun der zweite Teil des kleinen Tutorials, in dem erklärt wird, wie man das einfache in C# erstellte Screen-Scraping Tool noch ein wenig optimiert:

7. Wenn der HTML-Quelltext nicht mit IDs ausgezeichnet ist kann man über andere Wege auf das entsprechende Element zugreifen. Eine praktische Möglichkeit ist es, über den Tag-Namen das Element zu finden. Werfen Sie einen Blick auf den Quelltext, wie der Zähler ausgezeichnet ist:

irgendein Zähler <span>0</span> der zählt

Da der Tag <span> nur ein einziges Mal auf der Website verwendet wird ist es einfach. Über den Index [0] kann man auf das erste <span>-Element zugreifen:

HtmlElementCollection elemente = webMeinBrowser.Document.GetElementsByTagName(“span”);
//foreach (HtmlElement elem in elemente) …
MessageBox.Show(elemente[0].InnerHtml.ToString());

Wären es mehrere kann man die entsprechenden Elemente dann mit einem foreach durchlaufen und z. B. über elemente[i].GetAttribute oder . InnerHtml identifizieren.

Weiterlesen…

Follow

Get every new post delivered to your Inbox.