Overslaan en naar de inhoud gaan

De snelle opmars van Google

Is de grootste zoekmachine ook de beste? Wel als je Google heet. De cijfers spreken boekdelen: de 1,6 miljard geïndexeerde webpagina’s op ruim zesduizend Linux-servers worden dagelijks 120 miljoen keer geraadpleegd, behalve via internet sinds kort zelfs via mobiele telefoons van AT&T. Alleen al dit jaar is het dataverkeer van en naar de site met 73 procent gestegen.
Carriere
Shutterstock
Shutterstock

Google – de naam is ontleend aan googol, een term die werd verzonnen door het jonge neefje van wiskundige Edward Kasner voor het getal 1 met honderd nullen – begon drie jaar geleden als een onderzoeksproject van de Stanford-studenten Larry Page en Sergey Brin. In september 1998 besloten ze de studie er helemaal aan te geven en zich geheel toe te leggen op Google. Ram Shriram en Andy Bechtolsheim (medeoprichter van Sun Microsystems) staken als eerste geld in de onderneming, in juni 1999 gevolgd door grote investeerders als Kleiner Perkins. De technologie moest op dat moment nog steeds worden gelicenseerd van de Stanford Universiteit, maar al meteen viel de kwaliteit van het zoeksysteem op. In no time hadden duizenden internetgebruikers de zoekmachine ontdekt. Google is flink in beweging. Eerder dit jaar is de voormalige Novell- en Sun Microsystems-topman Eric Schmidt als president directeur aangetrokken. “Als je echt wilt groeien, heb je een ander soort management nodig”, zegt Urs Hölzle, een Zwitser die als Google Fellow op de loonlijst staat. “We hebben anderhalf jaar lang naar een geschikte directeur gezocht. Het voordeel van Eric is dat hij zakelijke ervaring paart aan technische kennis en dat is voor een technologiebedrijf nu eenmaal ideaal.” Schmidt, die werd aangedragen door investeerder John Doerr, voelde er wel wat voor om een internet-bedrijf te leiden. Per slot van rekening was hij zelf jarenlang evangelist van de programmeertaal Java, die zich zonder internet nooit had kunnen ontwikkelen. Tot de komst van Schmidt was het de van Netscape afkomstige Omid Kordestani die Google met strakke hand leidde. Hij sleepte de eerste adverteerders binnen en sloot contracten met grote klanten als Cisco. “Voor gebruikers lijkt het alsof er niet veel is veranderd, maar de Google van vandaag lijkt in niets op de Google van drie jaar geleden”, zegt Urs Hölzle. Zo is de zoektechnologie volledig herschreven om aan de stijgende behoefte te voldoen. “We konden ook moeilijk anders, want de index is met een factor zes gegroeid”, aldus Hölzle. Bovendien betekent stilstand achterstand. Hölzle verwijst naar AltaVista, dat na een succesvolle start steeds verder achterop is geraakt en al snel door anderen werd ingehaald. Inmiddels kunnen bij Google telefoonnummers worden opgevraagd, worden zogenoemde PDF- en Officebestanden geïndexeerd en kan er worden gezocht in ruim 650 miljoen berichten uit nieuwsgroepen. Ook worden er steeds meer talen bij de zoekresultaten betrokken. Dat zijn er al 66, waaronder het Arabisch en Hebreeuws. Ook bewaart Google complete kopieën van webpagina’s. Als een pagina niet bereikbaar is, kan de inhoud ervan alsnog worden bekeken. Sites die zijn verdwenen kunnen op deze manier zelfs gereconstrueerd worden. Google hoopt het aantal geïndexeerde pagina’s de komende maanden nog eens fors uit te breiden. Hölzle sluit niet uit dat Google ooit nog eens de drie miljard pagina’s haalt. “We indexeren nu al sneller dan dat internet groeit”, zegt hij. “Maar je moet het wel selectief doen: er zijn online-agenda’s waar iedere datum een aparte pagina is. Een goede indexrobot negeert dat.” Belangrijker vindt Hölzle de kwaliteit van de PageRank-technologie van Google. Bij het indexeren van de pagina’s wordt vooral gekeken naar verwijzingen van en naar andere webpagina’s. Als op verschillende pagina’s naar een bepaalde website wordt verwezen, mag rustig worden aangenomen dat het om een belangrijke site gaat. Zijn de verwijspagina’s zelf ook populair, dan krijgt de site van Google extra punten toegedeeld. Verder wordt ook de opmaak van de pagina’s geanalyseerd: zo kan worden nagegaan waar de trefwoorden precies staan (bovenaan of onderaan de pagina). Op deze manier kan een bepaalde kwaliteit worden gegarandeerd zonder dat redacteuren hoeven worden ingeschakeld om de relevantie van websites te beoordelen. De aanpak van Google is overigens ook bekritiseerd: zo is er het verwijt dat pageranking er alleen maar voor zorgt dat populaire pagina’s alleen maar populairder worden, en nieuwe informatie niet meteen zichtbaar wordt, maar Google bestrijdt dat. Wel geeft men toe dat wordt geprobeerd om de zoekresultaten van Google te beïnvloeden door wat in de wandelgangen ‘spamdexing’ wordt genoemd. Een bekende truc is ‘cloaking’, waarbij als een indexeerrobot zich bij een site meldt deze speciale informatie voor zoekmachines krijgt toegespeeld. Een ander slimmigheidje zijn de linksfarms: pagina’s die alleen maar tot doel hebben om naar een website te verwijzen. Google zegt software te hebben ontwikkeld waardoor linksfarms kunnen worden herkend. “Om echt mee te wegen in de resultaten moeten deze pagina’s zelf ook populair zijn en dat zijn ze doorgaans niet”, zegt Hölzle. De invloed van Google op andere zoeksystemen is intussen zeer goed merkbaar. Google-klonen Vivisimo (een metazoekmachine die graaft in andere zoeksystemen), Teoma (onlangs overgenomen door Ask Jeeves) en WiseNut, timmeren al enige tijd flink aan de weg. Het laatste bedrijf, opgericht in 1999 en onderdeel van uitgeverij Cnet, zegt al 1,4 miljard webpagina’s te hebben geïndexeerd. Men gebruikt een identieke technologie als Google, maar kijkt daarnaast naar de context waarin bepaalde trefwoorden worden genoemd. In Nederland hebben Ilse en Track de Google-methode overgenomen. Ilse, eigendom van uitgever VNU, wilde af van de vervuilde index, die vaak irrelevante sites liet zien als antwoord op een zoekvraag. Sites worden daarnaast ook eens beoordeeld door een redacteur van Startpagina. Voorlopig heeft Google nog altijd een ruime voorsprong op de concurrentie en daar hoopt men dan ook van te kunnen profiteren. Safa Rashtchy, een analist van Bancorp Piper Jaffray, verklaarde onlangs in Business Week dat Google de potentie heeft om uit te groeien tot een ‘miljardenbusiness’. Op dit moment komt 50 procent van de omzet uit advertenties. Geen banners, maar tekstadvertenties die aan bepaalde zoekopdrachten worden gekoppeld en in een apart venster worden geplaatst. Betalen voor zoekresultaten is niet bespreekbaar in Mountain View. Zoekmachines als Overture (het voormalige GoTo.com) en Sprinks verdienen daar een dikke boterham mee, maar het is niet iets dat door gebruikers wordt gewaardeerd. “Wij bereiken met gerichte tekstadvertenties even goede resultaten”, zegt Urs Hölzle. “We onderzoeken zelfs hoe effectief advertenties zijn, bijvoorbeeld of de respons ’s avonds of overdag hoger is.” De tweede bron van inkomsten bestaat uit licenties van de zoektechnologie. Google doet zaken met zo’n 130 (dotcom-)bedrijven, waaronder Yahoo!, die Google als zoekmachine gebruiken. Deze bedrijven betalen Google vaak per zoekopdracht. Ook wordt de technologie voor bedrijfsnetwerken ingezet. Daar zal het niet bij blijven. Onder leiding van Eric Schmidt moet Google een expertisehuis voor zoeken en navigeren worden. Er is zelfs al gewerkt aan een stemgestuurde zoektechnologie die fabrikant BMW aanvankelijk in zijn luxe auto’s had willen bouwen. Al op zeer korte termijn hoopt Google betaalde versies van de zoekmachines te ontwikkelen voor zakelijke klanten en universiteiten. Die kunnen dan in allerlei vakbladen zoeken. Bedrijven als Northern Light en Moreover.com bieden dergelijke mogelijkheden al veel langer. Verder bekijkt Google of de zoekresultaten nog aantrekkelijker kunnen worden gemaakt. Zo wordt onder meer gepraat met het bedrijfje Alpiri, dat aan semantische zoektechnieken werkt. Men houdt een database bij met informatie over steden en personen zodat als iemand de naam Tori Amos intikt, de zoekmachine weet dat een muzikante wordt bedoeld. Alpiri vult die informatie vervolgens aan met bijvoorbeeld biografieën en verwijzingen naar online-muziekwinkels. “Echte intelligentie inbouwen blijft lastig, maar we gaan wel steeds meer die kant op”, zegt Urs Hölzle. Haast is geboden, want de rivalen zitten Google op de hielen. Internationalisatie staat dan ook hoog op de agenda. Er zijn verkoopkantoren geopend in Engeland en Japan en nog voor het einde van het jaar komt daar een Duitse vestiging bij. Ook wordt vermoedelijk een Europees datacentrum geopend. “De helft van de zoekopdrachten komt uit het buitenland, dat kunnen we moeilijk negeren”, zegt Hölzle. In Nederland is Google inmiddels ontdekt. Het marktaandeel van zoekmachine is volgens het Internet Databureau van Nedstat en Checkit in een paar maanden tijd gegroeid van 7 naar 17 procent.

Lees dit PRO artikel gratis

Maak een gratis account aan en geniet van alle voordelen:

  • Toegang tot 3 PRO artikelen per maand
  • Inclusief CTO interviews, podcasts, digitale specials en whitepapers
  • Blijf up-to-date over de laatste ontwikkelingen in en rond tech

Bevestig jouw e-mailadres

We hebben de bevestigingsmail naar %email% gestuurd.

Geen bevestigingsmail ontvangen? Controleer je spam folder. Niet in de spam, klik dan hier om een account aan te maken.

Er is iets mis gegaan

Helaas konden we op dit moment geen account voor je aanmaken. Probeer het later nog eens.

Maak een gratis account aan en geniet van alle voordelen:

Heb je al een account? Log in

Maak een gratis account aan en geniet van alle voordelen:

Heb je al een account? Log in