Seit über 12 Monaten arbeite ich nun an Data Science SEO und programmatischen Lösungen mit Python, da die SaaS-Tools wie Ahrefs und SEMrush Hunderte von Dollar pro Monat kosten.
Ich war positiv überrascht, was mit Python und Web Crawling alles möglich ist. Mit Data Science für SEO spart man eine Menge Geld und Zeit SEO Analysen durchzuführen und dein SEO auf das nächste Level zu heben.
Für das Tutorial werden grundlegende Kenntnisse in Python benötigt.
Alles, was ich bis jetzt gelernt habe, ist hier im Tutorial abgebildet.
Lasst uns starten!
Der Original Artikel ist von mir in Medium am 9. Mai 2023 in Englisch veröffentlich worden: https://python.plainenglish.io/a-full-guide-on-programmatic-seo-in-python-for-2023-e2b82d227383
Eine kurze Einführung in SEO
SEO (Search Engine Optimization) ist der Prozess der Optimierung einer Website für die Google-Suche mit dem Ziel, einen höheren Webverkehr zu erzielen und die Sichtbarkeit der Website zu verbessern.
Das Hauptaugenmerk von SEO liegt auf zwei Schlüsselbereichen:
1. On-Page-Faktoren: Dies sind Faktoren, die vom Eigentümer der Website kontrolliert werden und Dinge wie Seitentitel, Meta-Tags und Schlüsselwortdichte umfassen.
2. Off-Page-Faktoren: Dies sind Faktoren, die nicht vom Website-Besitzer kontrolliert werden, aber eine Rolle dabei spielen, wie Google die Website sieht, wie z. B. eingehende Links und Social-Media-Signale.
Ein wichtiger Punkt ist, dass SEO ein fortlaufender Prozess ist, kein einmalige Intervention. Um hohe Rankings zu erhalten, ist es wichtig, Deine Webseite regelmäßig zu überwachen und sicherzustellen, dass Du Schritte zur Verbesserung Deiner On-Page- und Off-Page-SEO Signale unternimmst.
>Hier mehr über die Grundlagen von SEO lesen.
Python (eine bekannte Programmiersprache) bietet eine Reihe von Modulen und Bibliotheken, die bei SEO-Aufgaben wie Web Scraping, der Analyse von Log-Dateien und der Erstellung von Sitemaps helfen können.
In diesem Leitfaden stelle ich einige der beliebtesten Tools vor und zeige Dir, wie Du für dein SEO nutzen kannst.
Eine kurze Einführung in Data Science SEO mit Python
Data Science SEO ist der Prozess, Code zu verwenden, um eine Vielzahl von Aufgaben im Zusammenhang mit der Analyse in der Suchmaschinenoptimierung zu automatisieren.
Diese Aufgaben können beinhalten:
- Webseiten nach Daten zu durchsuchen
- Diese Daten zu analysieren
- Benutzerdefinierte Berichte zu erstellen
Durch die Automatisierung dieser Aufgaben können SEOs ihre Websites schnell und effizient für bessere Suchmaschinenrankings optimieren.
Darüber hinaus kann Data Science SEO dir helfen, Bereiche zur Verbesserung des Rankings deiner Website zu identifizieren und fundierte Entscheidungen bezüglich deiner zukünftigen Optimierungen zu treffen.
Warum Python?
Python ist eine leistungsstarke Programmiersprache, die es Entwicklern ermöglicht, schnell und effizient anspruchsvolle Anwendungen zu erstellen.
Python ist auch eine ausgezeichnete Wahl für automatisierte SEO-Aufgaben aufgrund seiner leicht lesbaren Syntax und seiner umfangreichen Standardbibliothek.
Ich werde die Grundlagen von Data Science SEO in Python behandeln, einschließlich der Methoden, um Websites nach Daten zu durchsuchen, diese Daten zu verarbeiten und zu analysieren, und schließlich, wie man maßgeschneiderte Berichte generiert.
Am Ende dieses Leitfadens wirst Du ein solides Verständnis dafür haben, wie Du Python für deine SEO-Aufgaben einsetzen kannst.
Einrichtung
In den folgenden Schritten werde ich erklären, was für die Einrichtung wichtig ist. Bitte gib in den Kommentaren Bescheid, falls du Schwierigkeiten hast.
Richte deine Entwicklungsumgebung ein
PyCharm ist eine geeignete Lösung für Python. Aber es gibt auch viele andere gute Möglichkeiten. Schau dir einfach diese Anleitung an, in der ich erkläre, wie du deine IDE in PyCharm richtig einrichtest.
Ich verwende Python, Version 3.10, auf einem Windows-Rechner (11).
Richte deine Google Custom Search API ein
Dies ist eine programmatische Suchmaschinen-API von Google. Um die Google Custom Search API zu verbinden und Google-Suchergebnisse mit Python abzurufen, musst du drei Dinge tun:
- Richte ein Google-Konto ein, falls du noch keines hast.
- Erstelle ein Konto in der Google-Entwicklerkonsole: Google Entwickler Konto
- API-Schlüssel für die Custom Search API erstellen: Erstelle hier einen Schlüssel.
- Benutzerdefinierte Suchmaschinen-ID: Kopiere den Code nach "cx".
Python Einrichtung
Lass uns anfangen. Installiere die advertools-Bibliothek. Hier ist der Link zur Dokumentation: https://advertools.readthedocs.io/en/master/
pip install advertools
# ODER:
pip3 install advertools
Erstelle auch eine Umgebungsdatei für deine Schlüssel, das macht den Prozess sicherer und einfacher.
.env
google_api_key = <Custom Search API Key>
google_cse_id = <Custom Search Engine ID>
Guide zu Data Science SEO
Guide zu Data Science SEO
Lass uns mit der Arbeit im Bereich Data Science SEO beginnen.
(1) SERP-Analyse
SERP steht für Search Engine Results Page (Suchmaschinenergebnisseite). Indem du die am besten platzierten Webseiten für ein bestimmtes Keyword oder Thema überprüfst, kannst du deine Chancen einschätzen, die Konkurrenz zu übertreffen. Die SERP-Analyse ist auch in der Lage aufzuzeigen, wie ein Konkurrent eine bestimmte Position auf der Ergebnisseite erreicht hat.
Die Untersuchung von Keywords und die Identifizierung der Suchintention ist eine Möglichkeit. Dann kannst du Konkurrenten analysieren und Ranking-Möglichkeiten finden. Schließlich kannst du deinen Inhalt optimieren. Der Markt ist auch voll von verschiedenen Tools, die es einfacher machen, den manuellen Prozess zu automatisieren. Spare 100 Dollar mit diesem Skript!
Erstelle ein Skript namens v. Lege es im selben Ordner ab wie deine .env-Datei.
Ich suche nach den Top 100 Positionen bei Google für Zahnärzte.
Du erhältst etwa 99 Spalten mit Daten in 100 Zeilen. Du brauchst nur ein paar davon. Speichern diese in einer Excel-Datei ab.
Du wirst Folgendes sehen:
- Aktuelle Position auf Google, Spalte D
- Der Titel der Seite (Meta-Titel), Spalte E
- Ein Ausschnitt der ersten Wörter, in Spalte F
- Der kurz angezeigte Link
- Ein formatierter Link
Super, jetzt weißt du, wer auf Google an erster Stelle steht. Aber nicht warum. Dies wird in der folgenden Analyse deutlich.
(2) Google SERP Rank Tracking
Du kannst auch einen SERP-Tracker und Ranking-Tracker mit Python erstellen. Du kannst dieses Skript im Hintergrund ausführen und es in einer Flask-App visualisieren.
Wie man eine Plotly-Vizualisierung in Flask einbettet, erkläre ich hier. Du kannst es auch online ausführen und deinen Kunden den Zugriff ermöglichen. Du kannst es über eine Online-Plattform bereitstellen (klicke hier).
Unten siehst du die Ausgabe eines SERP-Trackers als Animation. In diesem kurzen Zeitraum hat sich das Ranking für das Keyword "Zahnarzt" nicht geändert, aber über längere Zeiträume hinweg würde es Unterschiede zeigen.
Sie sehen gerade einen Platzhalterinhalt von Vimeo. Um auf den eigentlichen Inhalt zuzugreifen, klicken Sie auf die Schaltfläche unten. Bitte beachten Sie, dass dabei Daten an Drittanbieter weitergegeben werden.
Mehr InformationenUm diese Animation zu erstellen, kannst du eine Funktion definieren, die die SERP (Search Engine Results Page) verfolgt. Diese Funktion zieht die Ergebnisse und speichert sie entweder in einer Pickle-Datei oder einer Datenbank.
1. Hier ist eine grundlegende Struktur, wie du vorgehen könntest:
Du legst eine Funktion an, die regelmäßig Daten von der Custom Search API zieht und in einer Pickle file ablegt.
2. Du terminierst die Datenextraktion alle 10 sec.
3. Du stellst die Daten dar
Für diese Aufgabe solltest du Plotly zunäcsht installieren.
pip install plotly
(3) Keyword-Abdeckung
Jetzt möchten wir herausfinden, wie gut diese Platzierung mit ähnlichen Keywords ist.
Gehe zu https://answerthepublic.com/ und suche nach "Zahnarzt". Du erhältst eine Vielzahl ähnlicher Keywords. 726 Ergebnisse, siehe Bild unten.
Um eine Liste von Keywords zu kopieren und sie in einer Schleife zu verwenden, um die Keyword-Abdeckung der Top 10 Positionen für diese Keywords zu suchen und die Ergebnisse in einer Excel-Datei zu speichern, kannst du wie folgt vorgehen:
Zunächst die Keywords in einer Liste abspeichern:
Dann das Script zusammenstellen:
Das Ergebnis in der Excel Datei:
Wir sehen, dass das erste Keyword eine Abdeckung von 19% aller Keywords hat und durchschnittlich auf Rang 2,6 liegt. Wenn wir diese Analyse auf größerem Maßstab durchführen, zum Beispiel für diese 726 Keywords, erhalten wir ein viel klareres Bild.
Super! Das ist vorerst alles. Die folgenden Themen wären ebenfalls möglich:
- Cluster-Analyse
- Identifizierung von Inhaltslücken
- Technisches SEO
Wenn du an solchen Themen interessiert bist, kommentiere bitte unten.