data-extraction-from-website

API schnell selbst erstellt

Mit der Software bzw. dem Online-Tool import.io lassen sich fast beliebige Daten von Webseiten extrahieren. Möchte man zum Beispiel aus einem Onlineshop alle Produktüberschriften, Beschreibungen und Preise erhalten, so ist das in der Regel einfach möglich. Wichtig ist nur, dass die Inhalte in irgendeiner Art abgrenzbar, bzw. definierbar sein müssen. Sie müssen also einem bestimmten Muster folgen. Codebastelei wird nicht benötigt.

Daten von Websites per AIP extrahieren
Daten von Website extrahieren – manuell oder mit eigener API

Schnittstelle (API) selbst machen

Das Tool ermöglicht auch die regelmäßige Abfrage der jeweiligen Domain / Daten per Api. Diese ist laut import.io in wenigen Minuten erstellt und Einsatzfähig. So lassen sich Daten einer Url regelmäßig abfragen, welche keine Schnittstelle für die Datenabfrage zur Verfügung stellt.

Export

Die Daten lassen sich dann im CSV-Datei Downloaden.

Alternative – Screaming Frog

Alternativ könnt Ihr ähnliches auch mit der Bezahlversion von Screaming-Frog erledigen. Allerdings (soweit ich weiß) nicht als wiederkehrende API, sondern immer nur manuell.

Daten extrahieren mit Screaming Frog
Auch mit Screaming-Frog lassen sich Daten von Websites extrahieren

Die von import.io extrahierten Daten lassen sich dann vor dem Download anschauen. Weitere Spalten können hinzugefügt werden.

Datenbeispiel in import.io
Datenansicht in import.io am Beispiel von Toolpilot

Video Tutorial – so funktioniert import.io

Preis

Die Preise sind aufgrund der kostenlosen Version zum ausprobieren eigentlich recht fair. Die gratis Variante erlaubt allerdings nur 500 Abfragen pro Monat und keinen API Zugang. Die nächst höhere Version kostet dann direkt 250 Dollar, was natürlich viel ist. Sie bietet dann 50.000 Abfragen pro Monat und den Zugriff auf die API. Weiter geht´s dann mit 399 Dollar und 799 Dollar.. aber schaut besser selbst, da sich die Preise sowieso hin und wieder mal ändern.

Hier gehts zu import.io