Im Internet nach Daten zu suchen, fühlt sich an, als wäre ich ein Archäologe. Mit einer metaphorischen Spitzhacke in der einen Hand und einem Staubpinsel in der anderen grabe ich jede einzelne Position sorgfältig aus und lege sie zur Überprüfung in Google Sheets ab. Das ermöglicht es mir zwar, meine 1999 die Mumien-Reenactment-Träume zu leben, aber es gibt nur einen Nachteil – es dauert ewig.
Anstatt Websites manuell nach grundlegenden Daten wie Namen, Adressen oder Titel-Tags zu durchsuchen, kannst du die IMPORTXML-Funktion von Google Sheets nutzen, um all diese mühsame Recherche in einem nahtlosen (fast schon magischen) Datentransfer zu automatisieren.
So kannst du IMPORTXML in Google Tabellen nutzen und manuelles Sammeln von Daten vergessen.
Inhalt:
Was macht die IMPORTXML Function in Google Tabellen?
Die IMPORTXML-Funktion ist ein Tool in Google Tabellen, mit dem du strukturierte Webdaten direkt in deine Spreadsheet importieren kannst. Die Funktion lautet„
“ =IMPORTXML(url, "xpath"). Du musst eigentlich nur wissen, wo die gesuchten Daten sind, und dann kannst du die Ziel-URL und eine XPath-Abfrage, die die Daten angibt, die du von der Webseite extrahieren möchtest, in diese Kernfunktion eingeben.
Wenn sich das alles nach Klingonisch anhörte, dann bist du immer noch dabei, versprochen. Für IMPORTXML solltest du dich ein bisschen mit XML und HTML auskennen, aber ich erkläre dir das hier – wenn ich das kann, kannst du das auch.
Hier sind einige Begriffe, die Sie verstehen müssen, um IMPORTXML zu verwenden:
HTML: Die grundlegende Markierungssprache, die Browsern sagt, wie sie Informationen anzeigen sollen. Ein HTML-Element besteht aus einem Start-Tag, dem Content und einem End-Tag.
Beispiel:
<p>Irgendwas</p>
XML: Eine Markierungssprache und ein Dateiformat für die Datenverwaltung. Es ist ähnlich wie HTML, aber du kannst deine eigenen Tags festlegen.
Beispiel:
<name>John</name>
Tag: Sowohl in HTML als auch in XML ist ein Tag das Markup, das verwendet wird, um den Anfang und das Ende eines Elements zu kennzeichnen. Tags werden in spitze Klammern eingeschlossen.
Beispiele:
<tag> </tag>
XPath: Ein Ausdruck, der zum Navigieren in XML und zum Angeben von Pfaden verwendet wird. So sagst du Sheets, wo auf einer Webseite die Daten hergeholt werden sollen.
Beispiel (fett gedruckt):
=ImportXML("https://en.wikipedia.org/wiki/List_of_T_postal_codes_of_Canada",
"//td"
)
So benutzt du die IMPORTXML-Funktion in Google Tabellen
Zuerst gebe ich dir einen super allgemeinen Überblick darüber, wie das geht. Dann schauen wir uns ein Beispiel an, das das Ganze besser verständlich macht und dir einige der wirklich coolen (wenn du dich für Webdaten interessierst ) Möglichkeiten von IMPORTXML zeigt.
Suchen Sie die Webseite. Geh zu der Website, auf der die Daten sind, die du importieren willst.
Inspect-Element. Klick mit der rechten Maustaste auf einen leeren Bereich der Webseite und wähl „Untersuchen“, um die HTML-Struktur der Webseite zu checken.
Tags finden: Such die Tags, die die Daten enthalten, die du brauchst – wie
<td>
für Tabellenzellen.Geben Sie die IMPORTXML-Formel ein. Gib in einer Google Sheet-Zelle die Funktion
=IMPORTXML(url, "xpath")
ein. Aktualisiere die IMPORTXML-Funktion mit der URL anstelle von url. Ersetzen Sie zwischen den Anführungszeichen xpath durch zwei Schrägstriche, gefolgt von den Tags, die Sie gerade identifiziert haben.Passe deine Daten an. Hol nur bestimmte Sachen aus der Tabelle raus, filter deine Daten und räum den restlichen Datensatz auf.
Damit sollten die Daten zwischen den Tags, die du in der eingegebenen URL gefunden hast, in dein Arbeitsblatt übernommen worden sein.
Beachte, dass du möglicherweise aufgefordert wirst, den Zugriff auf eine externe Website zuzulassen. Klick in diesem Fall einfach auf „Akzeptieren“.
Beispiel für das Importieren von Daten in Google Tabellen mit IMPORTXML
Wikipedia-Tabellen sind eine großartige Möglichkeit, IMPORTXML zu üben, also schauen wir uns ein Beispiel an, wie man eine Liste von Postleitzahlen und Stadtbezirken aus Wikipedia extrahiert. Ich zeig dir auch, wie du noch genauere Daten bekommst, damit du die Ergebnisse so anpassen kannst, dass du genau das bekommst, was du brauchst.
1. Such die Daten, die du importieren willst
In dieser Übung werde ich alle Postleitzahlen in Edmonton, Alberta, abrufen. Öffne die Seite in einem neuen Browser-Fenster, wenn du mitlesen möchtest.
2. Schau dir den HTML-Code auf der Webseite an.
Klick mit der rechten Maustaste auf eine Postleitzahl auf der Seite und wähl „Untersuchen“, um den HTML-Quellcode in deinem Browser anzuzeigen.

3. Identifizieren der Tags
Schau mal nach dem Tag, der die Daten hat, die du suchst. Hier ist es „<td>
“ – das ist der Tag, der alle Daten in einer Zelle hat.
Wenn Sie sich einen Code ansehen, der lautet <b>
, sind Sie am falschen Ort – dies ist ein Formatierungscode für den Text selbst. Du brauchst das Tag „<“ „td“<td>
„ > “ oder „table data“, weil es alle Daten innerhalb einer Tabelle abruft. Du kannst das Feature „Suchen“ im Menü „Überprüfen“ nutzen, um den Bereich zu finden, den du kopieren möchtest.

4. Geben Sie die Funktion IMPORTXML ein
Importiere alle Postleitzahlen in ein neues Google Sheet. Dazu wählst du eine Zelle aus und gibst die Formel ein:
=IMPORTXML("https://en.wikipedia.org/wiki/List_of_T_postal_codes_of_Canada", "//td")
Zur Erinnerung: Das ist die Funktion =IMPORTXML(url, "xpath")
, aber wir haben url durch die URL der Webseite ersetzt und xpath durch zwei Schrägstriche und das Tag.
Wenn du dazu aufgefordert wirst, klicke auf „Zugriff zulassen“ (vorausgesetzt, du vertraust der Website, von der du importierst!). Dadurch werden alle Postleitzahlen auf unserer ursprünglichen Wikipedia-Seite ausgefüllt – alle Daten, die im <td>
Tag „<“ und „ > “ stehen.

5. Passe deine Daten an
Wenn du noch nie HTML gesehen hast, könnte dieser Abschnitt etwas beängstigend sein – aber mach einfach die folgenden Schritte mit und alles wird gut.
Nur die primäre Stadt extrahieren
Was ist, wenn Sie nur die Hauptstadt abrufen möchten, die mit der Postleitzahl verknüpft ist? Unsere erste Abfrage hat eine Menge zusätzlicher Daten geliefert.
Um den Bereich einzugrenzen, können wir die XPath-Abfrage in "//td/span/a[1]"
ändern. Dadurch wird nur die Stadt, die mit jeder Postleitzahl verknüpft ist, in unser Blatt gezogen – da wir angeben, dass wir in diesen Tabellendatenzellen nach einem "span"-Tag suchen möchten, das ein <a>
(Anker-)Tag enthält, in dem die Städtenamen im HTML-Code zu finden sind.

Nur die Postleitzahl extrahieren
Wir können auch einfach die Postleitzahlen selbst extrahieren. Dazu ändern wir die XPath-Abfrage zu „//td/b[1]“
.
Hier wissen wir, dass /b[1]
nur die Postleitzahlen anvisiert, weil wir beim Checken des HTML-Quellcodes gesehen haben, dass die Postleitzahlen innerhalb des ersten <b>
Tags in jeder <td>
Tabellenzelle stehen.

Filter für Edmonton
Um die Postleitzahlen in Edmonton, Alberta, zu finden, verwenden wir eine noch spezifischere Abfrage.
Wir ändern die XPath-Abfrage in "//td[span/a='Edmonton']/b[1]"
. Dadurch werden nur die Postleitzahlen zurückgegeben, die td/span/a[1]
"Edmonton" im Feld enthalten, da wir dort sehen können, dass die Städtenamen im Seitencode untergebracht sind.

Extrahieren von Nachbarschaftsnamen
Als Nächstes bauen wir darauf auf, indem wir die Namen der Nachbarschaften extrahieren und sie in die Spalte neben den Postleitzahlen einfügen. Um Nachbarschaftsnamen nach "Edmonton" abzurufen, verwenden wir diese XPath-Abfrage: "//td[span/a='Edmonton']/span[1]"
.

Wie du siehst, sind das plötzlich ganz schön viele Daten. Diese Funktion holt den ganzen Content von span[1] und trennt ihn mit Klammern und Schrägstrichen. Dabei werden „Edmonton“ in die erste Spalte und jeder Nachbarschaftsname in die folgenden Spalten eingefügt.
Bereinigen des Datasets
Von hier aus können wir die Daten aufräumen, indem wir sie in Spalten für Postleitzahl, Stadt und Stadtteil sortieren. Dadurch erhalten wir einen schönen, gestochen scharfen Datensatz, den wir für so ziemlich alles verwenden können – solange für alles Nachbarschaftsnamen in Edmonton erforderlich sind.
Da die Daten von Spalte B bis Spalte J gehen, kannst du die Funktionen SPLIT und CONCATENATE verwenden: =SPLIT(concatenate(B2:J2),"(/)")
.
Scrollen Sie einfach und verwenden Sie diese Funktion ein paar Spalten weiter oder ein paar Zeilen nach unten. Das kannst du für alle Daten machen, die du aufräumen willst, um überflüssige Leerzeichen oder Satzzeichen zu entfernen.

Und da haben Sie sie – unsere Liste der Postleitzahlen und Stadtbezirke in Edmonton.
Ähnliche Google Tabellen-Funktionen
Die Google Tabellen-Funktionen sind mega cool, und es gibt noch mehr davon. Hier sind noch ein paar Funktionen, die ähnlich wie IMPORTXML funktionieren, weil man sie zum Importieren von Daten aus einer Quelle in ein Blatt verwenden kann.
Strecken Sie Ihre neuen XPath-Flügel mit einer der folgenden verwandten Funktionen aus:
IMPORTHTML: Importiert Daten aus einer HTML-Tabelle oder -Liste auf einer Webseite. (Ähnlich wie gerade, aber für ganze HTML-Tabellen.)
IMPORTSORTIMENT Importiert einen Bereich von Zellen aus einer Google Sheets-Tabelle in eine andere. (Erleichtert das Zusammenführen von Daten aus verschiedenen Arbeitsblättern.)
IMPORTDATA: Importiert Daten aus einer CSV- oder TSV-Datei, die auf einer Web-URL gespeichert ist.
IMPORTFEED: Importiert Content aus einem RSS-Feed. RSS-Feed– super für Nachrichtenseiten, wenn du einen Live-Feed in deiner Spreadsheet erstellen willst.
GOOGLEFINANCE: Holt aktuelle oder alte Finanzmarktdaten direkt von Google Finance.
IMPORTXML-Tipps
Wenn Sie es bis hierher geschafft haben, sind Sie wahrscheinlich bereits ein akkreditierter Sheets-Zauberer und brauchen keinen weiteren meiner Ratschläge. Aber nur für den Fall, hier sind einige bewährte Methoden für die Arbeit mit Funktionen wie IMPORTXML.
Nutze die Feature: Klicke in deinem Browser auf „Element untersuchen“ in deinem Browser , um die HTML-Struktur der Seite anzuzeigen, bevor du Daten abrufst. Klick mit der rechten Maustaste auf das Element der Webseite, das du importieren willst, und wähl im Browser-Menü „Untersuchen“ aus. Auf diese Weise können Sie alle enthaltenen Tags sehen, was möglicherweise dazu beitragen kann, Ihre Abfrage spezifischer zu gestalten.
Überprü deine URL nochmal: Stell immer sicher, dass die URL in deiner IMPORTXML-Formel die ganze URL ist – nicht nur der Slug oder ein Teil davon. Und ja, dazu gehört auch das
http://
Präfix oderhttps://
. (Wir werden nicht darüber sprechen, wie oft ich das schon vermasselt habe.)Sei konkret: Es ist meistens besser, mit deiner Abfrage ganz bestimmte Daten zu Targeting, als riesige Datenbereiche abzurufen. Mit präzisen Abfragen holst du genau die Daten, die du brauchst – nicht mehr und nicht weniger.
Testblatt verwenden: Ich erstelle gerne ein separates Google Sheet, um meine IMPORTXML-Funktionen zu testen, bevor ich sie implementiere, weil ich mir sicher bin, dass ich beim ersten Mal etwas vermasseln werde. So kann ich sicher sein, dass meine Abfrage richtig funktioniert, bevor ich sie mit all den wichtigen Daten in meine echte Tabelle packe.
Google Tabellen mit Zapier automatisieren
Die IMPORTXML-Funktion ist ein Geschenk für alle Datenfans. Damit gehört die manuelle Datenerfassung, zumindest im Web, endgültig der Vergangenheit an, sodass du mehr Zeit hast, deine schönen Tabellen zu bewundern.
Und wenn das immer noch nicht reicht, kannst du die Google Sheets-Integrationen von Zapier ausprobieren. die Google Sheets-Integrationen von Zapier. Mit Zapier kannst du Sheets mit Tausenden anderen Anwendungen verbinden und so den Import aus Formularen, Events und anderen Daten automatisieren. Mehr darüber erfahren wie du Google Tabellen automatisieren kannst, oder schau dir ein paar dieser vorgefertigten Vorlagen an.
Speichere neue Google E-Mails, die bestimmte Kriterien erfüllen, in einer Google Spreadsheet.
Erstell Google Sheets-Zeilen für neue Google Ads-Leads
Füge neue Facebook-Lead-Ads-Leads zu Zeilen hinzu Google Sheets
Schick E-Mails über Gmail, wenn Zeilen in Google Tabellen aktualisiert werden
Zapier ist die am besten vernetzte KI-Orchestrierungsplattform – sie lässt sich mit Tausenden von Anwendungen von Partnern wie Google, Salesforce und Microsoft verbinden. Nutzen Sie Schnittstellen, Datentabellen und Logik, um sichere, automatisierte und KI-gestützte Systeme für Ihre geschäftskritischen Workflows im gesamten Technologie-Stack Ihres Unternehmens aufzubauen. Erfahren Sie mehr.
IMPORTXML Häufig gestellte Fragen
Was kann man anstelle von IMPORTXML in Google Tabellen verwenden?
Wenn Sie nach einer Alternative zu IMPORTXML suchen, können Sie die ähnliche Funktion IMPORTHTML verwenden. Es ist weniger präzise als IMPORTXML und wird hauptsächlich für Tabellen oder Listen verwendet. Du kannst auch ein Tool von einem anderen Anbieter nutzen, wenn du mehr Web-Scraping machen willst. Web-Scraping— oder dein eigenes Skript schreiben.
Wie kann ich IMPORTXML in Google Tabellen aktualisieren?
Um IMPORTXML in Sheets zu aktualisieren, klick einfach auf eine beliebige Zelle, die die Funktion enthält, und drück die Eingabetaste oder Return. Dadurch wird die Formel manuell neu berechnet und die Daten werden aktualisiert. Die Daten werden auch jedes Mal aktualisiert, wenn du die Formel änderst. Du kannst auch ein Add-on oder ein benutzerdefiniertes Skript verwenden, das das Blatt automatisch aktualisiert.
Wie oft wird IMPORTXML aktualisiert?
So oft Sie wollen. Die IMPORTXML-Funktion wird nicht automatisch aktualisiert, aber du kannst sie ganz einfach aktualisieren, wann immer du den Trigger betätigen möchtest. Aktualisierungs-Trigger sind zum Beispiel das Drücken der Eingabetaste oder der Return-Taste in einer Zelle, die die Funktion enthält, das Bearbeiten anderer Zellen in der Nähe oder das Ändern der Formel. Die Funktion kann auch aktualisiert werden, wenn sie ein dynamisches Element wie NOW()
enthält, da diese Elemente automatisch aktualisiert werden.
Verwandte Lektüre:
Ideen für die Automatisierung mit Google Tabellen, um dein Unternehmen zu organisieren
Google Formulare in Google Tabellen: Wie du den Bestand automatisch aktualisierst
Was bedeutet „Formel-Parsefehler“ in Google Tabellen? (Und wie man das Problem behebt)
Dieser Artikel wurde ursprünglich von Allana Mayer in 2017veröffentlicht. Das letzte Update war im November 2024.