Lexikon / Crawl Budget /

Crawl Budget

Letzte Aktualisierung: 27.05.2026

Was ist ein Crawl Budget?

Damit eine Website von Google, KI-Systemen oder verschiedenen Tools ausgelesen werden kann, muss sie zunächst von einem automatisierten Programm besucht werden. Diesen Vorgang nennt man Crawling. Zuständig dafür ist ein solches Programm, der sogenannte Crawler, machmal auch Spider oder Bot genannt. Das Crawl Budget beschreibt dabei, wie viele Seiten einer Website dieser Crawler innerhalb eines bestimmten Zeitraums tatsächlich besucht und ausliest.

Google Crawl Budget

Google selbst hat beschrieben, dass das Crawl Budget der Suchmaschine aus zwei Faktoren entsteht, die zusammen bestimmen, wie intensiv der Googlebot eine Website besucht.

Crawl Rate Limit: Der Googlebot nimmt Rücksicht auf den Server einer Website. Lädt eine Seite langsam oder ist der Server stark ausgelastet, drosselt Google automatisch die Crawling-Geschwindigkeit, um die Website nicht zu überlasten.
Crawl Demand: Hier geht es darum, wie stark Google eine Seite überhaupt besuchen möchte. Seiten mit vielen Verlinkungen oder regelmäßigen Aktualisierungen besucht Google häufiger als solche, die seit Jahren unverändert sind.

Für kleine Websites mit wenigen Seiten spielt das Crawl Budget in der Regel keine Rolle. Diese Google crawlt sie vollständig und regelmäßig. Relevant wird das Thema erst ab einer bestimmten Größenordnung, zum Beispiel bei Online-Shops mit Tausenden von Produktseiten, Nachrichtenportalen oder Websites mit vielen automatisch generierten URLs. Hier entscheidet das Crawl Budget darüber, ob neue oder aktualisierte Inhalte überhaupt zeitnah in den Google-Index aufgenommen werden.

Crawl Budget bei verschiedenen Suchmaschinen

Google ist nicht der einzige Crawler. Auch andere Suchmaschinen wie Bing, Yandex oder DuckDuckGo schicken eigene Bots los, um Websites zu besuchen und auszulesen. Jeder dieser Crawler arbeitet vollständig unabhängig und verwaltet sein eigenes Crawl Budget. Eine Website hat daher kein universelles Crawl Budget, sondern eines pro Bot. Gemeinsamkeiten gibt es trotzdem. Alle großen Suchmaschinen-Crawler respektieren die robots.txt, reagieren auf Servergeschwindigkeit und priorisieren Seiten nach Relevanz und Verlinkung. Die genauen Algorithmen dahinter sind jedoch von Suchmaschine zu Suchmaschine unterschiedlich und werden nicht vollständig offengelegt.

Einflussfaktoren auf das Crawl Budget

Das Crawl Budget ist keine feste Größe. Es wird von einer Reihe von Faktoren beeinflusst, die Websitebetreiber teilweise aktiv steuern können. Dazu gehören:

Servergeschwindigkeit: Lädt eine Website langsam oder ist der Server häufig überlastet, drosselt Google automatisch die Crawling-Geschwindigkeit. Eine schnelle, stabile Server-Infrastruktur ist daher die Grundvoraussetzung dafür, dass der Googlebot möglichst viele Seiten besuchen kann.
Seitenanzahl: Je mehr URLs eine Website hat, desto mehr Crawl Budget wird benötigt.
Interne Verlinkungen: Seiten, die gut intern verlinkt sind, werden vom Googlebot leichter gefunden und häufiger besucht. Seiten, die kaum oder gar nicht verlinkt sind, werden entsprechend seltener gecrawlt.
Duplicate Content: Doppelte Inhalte verschwenden Crawl Budget. Findet der Googlebot viele Seiten mit identischem oder sehr ähnlichem Inhalt, investiert er Ressourcen in Seiten, die keinen zusätzlichen Mehrwert bieten.
Fehlerhafte URLs: 404-Fehler und lange Weiterleitungsketten belasten das Crawl Budget unnötig. Jede fehlerhafte Anfrage kostet Ressourcen, die besser in relevante Inhalte investiert wären.
Noindex: Seiten, die mit einem Noindex-Tag versehen sind, sollten idealerweise auch nicht gecrawlt werden. Werden sie trotzdem regelmäßig besucht, verschwendet das Crawl Budget.
Robots.txt Über die robots.txt lässt sich gezielt steuern, welche Bereiche einer Website gecrawlt werden dürfen und welche nicht. So kann Crawl Budget bewusst auf die wichtigsten Seiten gelenkt werden.

Das Crawl Budget und SEO

Suchmaschinenoptimierung und das Crawl Budget stehen in engem Zusammenhang. Denn nur Seiten, die regelmäßig gecrawlt werden, bleiben dauerhaft im Google-Index. Und nur indexierte Seiten können in den Suchergebnissen erscheinen und Traffic generieren. Wird das Crawl Budget ineffizient genutzt, zum Beispiel weil Google Ressourcen für fehlerhafte URLs, Duplicate Content oder irrelevante Seiten verschwendet, bleiben wichtige Inhalte möglicherweise unentdeckt oder werden seltener aktualisiert als nötig.

Crawling bei SEO-Tools

Neben Suchmaschinen gibt es eine weitere Gruppe von Crawlern, die viele Websitebetreiber unterschätzen, nämlich die der großen SEO-Tools. Das Crawl Budget sowie Crawl-Verhalten kann sich dabei grundlegend unterscheiden.

Screaming Frog: Crawlt auf direkte Anweisung des Nutzers. Wer einen Crawl startet, bestimmt selbst, wie tief und wie schnell die Website durchsucht wird. Die Geschwindigkeit ist direkt einstellbar und sollte bewusst gewählt werden, da ein intensiver Crawl den Server spürbar belasten kann.
Ahrefs: Der AhrefsBot crawlt kontinuierlich und rund um die Uhr, unabhängig vom Google Crawl Budget. Über die robots.txt lässt er sich bei Bedarf drosseln oder blockieren.
Sistrix: Auch Sistrix crawlt regelmäßig und verbraucht dabei sein eigenes Crawl Budget, unabhängig von den Suchmaschinen.

Tim Selzer

Geschäftsführer

Was meinst du – genug Input oder willst du noch mehr? Melde dich einfach.

0151 5406 0689

Jetzt anfragen

Tim Selzer

Lass uns durchstarten!

Lass uns die Einzelheiten deines Projekts doch einfach persönlich besprechen. Du kannst uns dazu entweder anrufen oder eine unverbindliche Kontaktanfrage stellen.

Jetzt starten 0151 5406 0689

Gewinner der

Top 10 Gewinner

Offizieller Partner von

Offiziell gelistet auf

Zertifizierter

Ausgezeichnet als

Partner-Agentur von

Gewinner des