Voor de beste ervaring schakelt u JavaScript in en gebruikt u een moderne browser!
uva.nl

Informaticus Maarten de Rijke vertelt kinderen van 8-12 jaar hoe Google werkt. ‘Per seconde worden wereldwijd 70.000 zoekvragen ingetikt op Google. Gedurende de lezing zijn dat er ongeveer 250 miljoen.’

De zoekmachine Google: alle kinderen die zondag bij de Wakker Worden Kinderlezing in wetenschapsmuseum Nemo in Amsterdam zijn, gebruiken het wel eens. Om plaatjes of filmpjes te vinden of om een kaart te doorzoeken. Maar hoe werkt Google eigenlijk? Wetenschapper Maarten de Rijke van de Universiteit van Amsterdam biedt de kinderen een kijkje achter de schermen van Google. 

De Rijke tikt een zoekvraag in op de computer. How to make a pizza? In minder dan een tel verschijnt er een flinke lijst op de resultatenpagina van Google: plaatjes, recepten en zelfs een filmpje op YouTube. Hoe kan Google dit zo snel tevoorschijn toveren?

Google is bibliotheek

Aan de resultatenlijst gaan drie stappen vooraf. De Rijke: ‘Stap één is zorgen dat er inhoud komt. Een zoekmachine moet documenten, webteksten en websites hebben: als een gevulde bibliotheek.’ Een speciaal softwareprogramma haalt de inhoud binnen. Een pagina op internet ziet er aan de ‘achterkant’ heel anders uit dan mensen zien op hun scherm: het is een grote code-brij. ‘Dat zijn de URL’s, unieke adressen van computers waar ook ter wereld’, zegt de informaticus.

Google gaat al die adressen af om de informatie op te halen. En als op de pagina in bijvoorbeeld Amerika een link staat naar een URL in Australië, bezoekt Google die ook. ‘Zo haalt Google alle URL’s eruit en vult zijn bibliotheek. Dat noemen we spideren of crawlen en het softwareprogramma heet een crawler’, vertelt De Rijke.

Internet maken

Met de hulp van een aantal kinderen laat De Rijke zien hoe internet eruit ziet. ‘Wie heeft er een zus’, vraag hij. De kinderen die een zus hebben, geven een bol wol door, terwijl ze de draad vasthouden. Dan mogen alle kinderen die een huisdier hebben de draad beetpakken. En na nog een vraag ontstaat er een soort web. Sommige kinderen hebben twee of drie draden vast, anderen één. ‘De draden zijn de links tussen URL’s. Alle kinderen zijn op een of meerdere manieren met elkaar verbonden’, zegt De Rijke. ‘Links zijn belangrijk om gevonden te worden door een crawler.’

Toen Google begon, kostte het een maand om de bibliotheek te vullen. ‘Dat gebeurde in het begin handmatig. Als je zelf een pagina schreef, duurde het een maand voordat Google die kon vinden. Nu duurt dat nog maar enkele minuten, door de webcrawler. Ondanks dat internet zoveel is gegroeid gaat het vinden nu sneller, doordat alles tegenwoordig aan elkaar is gelinkt.’

Ordenen

Het tweede dat Google doet is de inhoud ordenen. ‘Je moet uiteindelijk passende documenten vinden bij de zoekvraag’, zegt De Rijke. ‘Het is vergelijkbaar met een boek: daar vind je wat je nodig hebt in de inhoudsopgave.’ Google maakt een index door alle woorden een nummertje te geven. In de index kan de zoekmachine makkelijk zien welk woord in welk document voorkomt. De derde stap van Google is selecteren welke site de meeste informatie heeft. Zo worden de beste resultaten in de goede volgorde weergegeven.

Maar hoe weet de zoekmachine welk document passender is dan een ander document? ‘Dat heeft onder meer te maken met hoe vaak zoekwoorden op de pagina voorkomen, of het klopt wat er op de pagina staat en hoe populair de pagina is’, legt de informaticus uit. ‘Ook heeft het te maken met de linkstructuur.’

Slimme zoekmachine

Google doet veel meer dan mensen denken. Zo bewaart de machine alle zoekvragen. ‘Zo leert Google je kennen, waardoor het zoeken beter kan worden gemaakt. Wil je bijvoorbeeld iets kopen van een artiest, een plaatje kijken of de muziek beluisteren? Aan de hand van eerdere zoekvragen, kan Google daarop inspelen. Dat zie je bijvoorbeeld aan de suggesties die Google geeft als je een zoekvraag intikt.’

 

Door: Jantine van Tinteren  

 

Maarten de Rijke

Professor doctor Maarten de Rijke (52) van de Universiteit van Amsterdam houdt zich al 21 jaar bezig met informatica. ‘Een vraag die ik al heel lang boeiend vind is hoe iets abstracts als informatie invloed heeft op mensen en hun handelen’, zegt De Rijke.