Damit eine Website von Google, KI-Systemen oder verschiedenen Tools ausgelesen werden kann, muss sie zunächst von einem automatisierten Programm besucht werden. Diesen Vorgang nennt man Crawling. Zuständig dafür ist ein solches Programm, der sogenannte Crawler, machmal auch Spider oder Bot genannt. Das Crawl Budget beschreibt dabei, wie viele Seiten einer Website dieser Crawler innerhalb eines bestimmten Zeitraums tatsächlich besucht und ausliest.
Google selbst hat beschrieben, dass das Crawl Budget der Suchmaschine aus zwei Faktoren entsteht, die zusammen bestimmen, wie intensiv der Googlebot eine Website besucht.
Für kleine Websites mit wenigen Seiten spielt das Crawl Budget in der Regel keine Rolle. Diese Google crawlt sie vollständig und regelmäßig. Relevant wird das Thema erst ab einer bestimmten Größenordnung, zum Beispiel bei Online-Shops mit Tausenden von Produktseiten, Nachrichtenportalen oder Websites mit vielen automatisch generierten URLs. Hier entscheidet das Crawl Budget darüber, ob neue oder aktualisierte Inhalte überhaupt zeitnah in den Google-Index aufgenommen werden.
Google ist nicht der einzige Crawler. Auch andere Suchmaschinen wie Bing, Yandex oder DuckDuckGo schicken eigene Bots los, um Websites zu besuchen und auszulesen. Jeder dieser Crawler arbeitet vollständig unabhängig und verwaltet sein eigenes Crawl Budget. Eine Website hat daher kein universelles Crawl Budget, sondern eines pro Bot. Gemeinsamkeiten gibt es trotzdem. Alle großen Suchmaschinen-Crawler respektieren die robots.txt, reagieren auf Servergeschwindigkeit und priorisieren Seiten nach Relevanz und Verlinkung. Die genauen Algorithmen dahinter sind jedoch von Suchmaschine zu Suchmaschine unterschiedlich und werden nicht vollständig offengelegt.
Das Crawl Budget ist keine feste Größe. Es wird von einer Reihe von Faktoren beeinflusst, die Websitebetreiber teilweise aktiv steuern können. Dazu gehören:
Suchmaschinenoptimierung und das Crawl Budget stehen in engem Zusammenhang. Denn nur Seiten, die regelmäßig gecrawlt werden, bleiben dauerhaft im Google-Index. Und nur indexierte Seiten können in den Suchergebnissen erscheinen und Traffic generieren. Wird das Crawl Budget ineffizient genutzt, zum Beispiel weil Google Ressourcen für fehlerhafte URLs, Duplicate Content oder irrelevante Seiten verschwendet, bleiben wichtige Inhalte möglicherweise unentdeckt oder werden seltener aktualisiert als nötig.
Neben Suchmaschinen gibt es eine weitere Gruppe von Crawlern, die viele Websitebetreiber unterschätzen, nämlich die der großen SEO-Tools. Das Crawl Budget sowie Crawl-Verhalten kann sich dabei grundlegend unterscheiden.

Tim Selzer
Was meinst du – genug Input oder willst du noch mehr? Melde dich einfach.

Tim Selzer
Lass uns durchstarten!
Lass uns die Einzelheiten deines Projekts doch einfach persönlich besprechen. Du kannst uns dazu entweder anrufen oder eine unverbindliche Kontaktanfrage stellen.
