Hoe Google Zoeken werkt

Deze processen leggen de basis. Op deze manier verzamelen en organiseren we informatie op internet zodat we de meest nuttige resultaten aan u kunnen retourneren. Onze index is meer dan 100.000.000 gigabyte groot en hierin is meer dan één miljoen uur aan berekeningen geïnvesteerd. Meer informatie over de basisprincipes vindt u in deze korte video.

 

Informatie vinden door middel van crawlen

We gebruiken softwareprogramma's die 'webcrawlers' worden genoemd, om openbaar beschikbare pagina's te ontdekken. De bekendste crawler heet 'Googlebot'. Crawlers bekijken webpagina's en volgen links op die pagina's, net zoals u zou doen als u zou bladeren door inhoud op internet. Ze gaan van link naar link en brengen gegevens over die webpagina's terug naar de servers van Google.

Het crawlproces begint met een lijst van webadressen uit eerdere crawls en sitemaps die zijn geleverd door website-eigenaren. Wanneer onze crawlers deze websites bezoeken, zoeken ze naar links voor andere pagina's die ze kunnen bezoeken. De software besteedt extra aandacht aan nieuwe sites, wijzigingen in bestaande sites en dode links.

Computerprogramma's bepalen welke sites worden gecrawld, hoe vaak en hoeveel pagina's van elke site worden opgehaald. Google accepteert geen betalingen om een site vaker te crawlen voor onze internetzoekresultaten. We vinden het belangrijker de best mogelijke resultaten te leveren, omdat dit op de lange termijn het beste is voor gebruikers en dus ook voor ons bedrijf.

Keuze voor website-eigenaren

Veel websites hoeven geen beperkingen voor crawlen, indexeren of weergeven in te stellen, waardoor hun pagina's in aanmerking komen voor weergave in zoekresultaten zonder dat er extra handelingen moeten worden uitgevoerd. Site-eigenaren hebben via de Webmasterhulpprogramma's van Google en een bestand dat 'robots.txt' heet, echter veel keuzes met betrekking tot de manier waarop Google hun sites crawlt en indexeert. In het bestand robots.txt kunnen site-eigenaren aangeven dat hun sites niet moeten worden gecrawld door Googlebot of kunnen ze meer specifieke instructies voor de verwerking van pagina's op hun sites leveren.

Site-eigenaren hebben gedetailleerde opties en kunnen per pagina kiezen hoe inhoud wordt geïndexeerd. Ze kunnen bijvoorbeeld ervoor kiezen hun pagina's weer te geven zonder fragment (het overzicht van de pagina dat onder de titel wordt weergegeven in zoekresultaten) of een gecachte versie (een alternatieve versie die is opgeslagen op de servers van Google voor het geval de live pagina niet beschikbaar is). Webmasters kunnen ook besluiten om met Aangepast zoeken een zoekfunctie te integreren in hun eigen pagina's.

Informatie organiseren door middel van indexeren

Internet kan worden vergeleken met een steeds groter wordende bibliotheek met miljarden boeken, maar zonder centraal opslagsysteem. Google verzamelt de pagina's tijdens het crawlproces en maakt vervolgens een index, zodat we precies weten hoe we dingen moeten opzoeken. Net zoals een index achter in een boek bevat de Google-index informatie over woorden en hun locaties. Op het meest algemene niveau komt het erop neer dat wanneer u zoekt, onze algoritmen uw zoektermen opzoeken in de index om de bijbehorende pagina's te vinden.

Hierna wordt het zoekproces veel complexer. Als u zoekt naar 'honden', wilt u niet een pagina waarop het woord 'honden' honderden keren voorkomt. U wilt waarschijnlijk foto's, video's of een lijst met hondenrassen te zien krijgen. De indexeringssystemen van Google houden rekening met veel verschillende aspecten van pagina's, zoals het tijdstip van publicatie, of de pagina's foto's en video's bevatten, en nog veel meer. Met de Kennisgrafiek blijven we verder gaan dan alleen zoekwoordovereenkomsten om een beter inzicht te krijgen in de mensen, plaatsen en dingen waarin u bent geïnteresseerd.

 

Webmastertools

Ga naar Webmaster Central voor informatie over de tools en bronnen die beschikbaar zijn voor site-eigenaren.

Handout 'Hoe zoeken werkt'

Bekijk een afbeelding die de verschillende fasen van het zoekproces illustreert. Van voordat u begint met zoeken, tot de positie en de weergave van resultaten.