Ein einfaches Screen-Scraping-Tool mit C# erstellen (Tutorial Teil 2)
Nach dem ersten Teil folgt heute nun der zweite Teil des kleinen Tutorials, in dem erklärt wird, wie man das einfache in C# erstellte Screen-Scraping Tool noch ein wenig optimiert:
7. Wenn der HTML-Quelltext nicht mit IDs ausgezeichnet ist kann man über andere Wege auf das entsprechende Element zugreifen. Eine praktische Möglichkeit ist es, über den Tag-Namen das Element zu finden. Werfen Sie einen Blick auf den Quelltext, wie der Zähler ausgezeichnet ist:
irgendein Zähler <span>0</span> der zählt
Da der Tag <span> nur ein einziges Mal auf der Website verwendet wird ist es einfach. Über den Index [0] kann man auf das erste <span>-Element zugreifen:
HtmlElementCollection elemente = webMeinBrowser.Document.GetElementsByTagName(“span”);
//foreach (HtmlElement elem in elemente) …
MessageBox.Show(elemente[0].InnerHtml.ToString());
Wären es mehrere kann man die entsprechenden Elemente dann mit einem foreach durchlaufen und z. B. über elemente[i].GetAttribute oder . InnerHtml identifizieren.



SOWebDev: Kommentare