Meer dan 700 succesvolle klanten
  • Mobile check 1Geen gouden bergen
  • Mobile check 2Concrete doelstellingen
  • Mobile check 3Vlot contact
  • Mobile check 4Afspraak = afspraak
facebook instagram linkedIn
Samen vooruit, samen winnen
Wat is de werkwijze van een webcrawler?
Home | Begrippenlijst | Algemeen | Wat is de werkwijze van een webcrawler?

Wat is de werkwijze van een webcrawler?

De webcrawler begint met een lijst van URL’s en bezoekt deze een voor een. Op het moment dat de spider een pagina heeft gevonden wordt deze opgeslagen in de cache of database. Alle links op een URL die een spider bezoekt worden toegevoegd aan de lijst. Zo kan een webcrawler alle publiekelijk, toegankelijke pagina’s bezoeken door middel van sitemap of XML sitemap. De spiders komen met een vaste regelmaat langs om de index van Google actueel te houden en te bepalen of een website wel of niet hoog in Google komt.

Beheerders van een website kunnen het gedrag van spiders beïnvloeden. Door in de hoofdmap van uw site een tekstbestand met de naam ‘Robots.txt‘ te maken kunnen beperkingen worden gezet voor de webcrawlers. Zo kan bijvoorbeeld aangegeven worden welke delen van een website door webcrawlers niet mogen worden bezocht.

s