Derde generatie internet is semantisch
Machines kunnen de inhoud van webpagina’s lezen, maar de betekenis ervan kunnen ze niet vatten. Daar moet het semantisch web verandering in brengen. De inzet is de organisatie van data op een dusdanige manier dat machines met de betekenis ervan aan de slag kunnen. Een voorbeeld: Op het moment dat Pete wordt gebeld, luistert hij naar muziek. Zijn telefoon zendt nu een boodschap naar alle lokale systemen met een volumeregelfunctie en schakelt het geluid ervan uit. Pete kan nu zijn zusje Lucy spreken zonder gestoord te worden door geluiden zonder dat hij zelf heeft hoeven uitschakelen. Lucy meldt Pete dat hun moeder een medische behandeling moet ondergaan. Via haar eigen handheld- computer kan Lucy de afspraken voor haar moeder regelen via het web. Haar ‘agent’ haalt zelfstandig de nodige gegevens op en controleert die zodanig dat broer en zus hun eigen agenda kunnen afstemmen op de verplichting om mama dagelijks naar de therapeut te brengen. Uiteindelijk worden beiden het eens over een hospitaal dat makkelijk bereikbaar is. Het internet kan vandaag tal van gegevens ophoesten over ‘medische behandelingen’. Maar het detecteren van het werkschema en de vrije plekken in het agenda van dokter Geneest blijft onmogelijk. Het semantisch web heeft geen moeite met dat trucje. Volgens Berners-Lee zijn de voordelen legio. Het semantisch web is immers geen totaal nieuwe constructie, doch slechts een extensie van het bestaande internet. Het semantisch web kan dus gemakkelijk ingebed worden in de bestaande internetstructuren. Ook vermijdt het semantisch web de delicate denkoefening over artificiële intelligentie, dat vergelijkbare beloftes inhoudt. Betekenis Het vinden van informatie op het internet is een halszaak. Dat is mede het gevolg van het bewust decentraal gehouden karakter ervan. Tegelijk biedt juist dat balsturig karakter de beste garantie op de veelzijdigheid van het internet. Met betrekking tot het semantische web zullen we een vergelijkbare prijs betalen, voorspelt Berners-Lee. Het structureren en semantisch ontleden van data wordt weliswaar een stuk gemakkelijker. Maar er zullen paradoxale kwesties overblijven en sommige vragen zullen nooit beantwoord kunnen worden. Het W3C (World Wide Web Consortium), waar Berners-Lee de leiding heeft, heeft zich daar alvast bij neergelegd. Wel is Berners-Lee duidelijk over de doelstelling die wel nagestreefd wordt: ‘De uitdaging van het semantische web bestaat eruit om in een taal te voorzien die zowel data als de regels over die data tot uitdrukking brengt en die toestaat dat regels, afkomstig van elk bestaand systeem voor kennisrepresentatie, geëxporteerd kunnen worden naar het web.’ Er bestaan verschillende instrumenten waarmee een groot deel van die doelstelling nu al gerealiseerd kan worden. De snelle verbreiding van XML (eXtensible Markup Language), de opvolger van HTML als opmaaktaal voor het internet, en van RDF (Resource Description Framework) staan garant voor de eerste stappen in de goede richting. Beide standaarden worden door het W3C aanbevolen. Annotaties XML stelt webontwerpers in staat verborgen code op te nemen in webpagina’s waardoor de structuur ervan geannoteerd kan worden. Scripts kunnen die annotaties lezen, maar moeten dan alsnog ontdekken welke tag of annotatie waarvoor in gebruik is genomen. Om kort te gaan: door gebruik te maken van XML kan de structuur van een webpagina wel gelezen worden, de betekenis ervan kan zelf niet worden ontgonnen. RDF gaat een stap verder en definieert wel de betekenis van de XML-tags die op de achtergrond van een webpagina gonzen. RDF gebruikt daartoe de zinsstructuur van een gewone grammatica. Het stelt vast wat onderwerp, werkwoord of lijdend voorwerp is. RDF kan derhalve aangeven welke zaken op welke manier in relatie tot elkaar staan. RDF kan detecteren dat mama de moeder is van Lucy en Pete. Maar gebruik van XML en RDF is vooralsnog niet voldoende om alle mogelijkheden van het semantisch web te ontginnen. Hamsters Er moet alsnog een nieuwe ontologische laag bovenop de bestaande structuur gelegd worden. Een ontologie kan gezien worden als een vocabularium, van alle woorden waarvan de onderlinge relaties vast te leggen zijn, samen met een aantal regels voor gevolgtrekkingen en logica. De Amerikaanse hoogleraar James Hendler, medestander van Berners-Lee, is ervan overtuigd dat vrijwel alle organisaties hun webpagina’s binnen een paar jaar aan een ontologisch regime zullen onderwerpen. Het zal dan mogelijk zijn dat applicaties zelf informatie uitwisselen en dat computers zelfstandig op zoek gaan naar webcontent die voor de gebruiker van belang is, zoals in het voorbeeld van de mama van Lucy en Pete. Darpa (Defense Advanced Research Projects Agency) stimuleert de ontwikkeling van semantische ontologieën. Als die eenmaal werkelijkheid zijn, wordt het zoeken van complexe gegevens op het internet een peulenschil, voorspellen Berners-Lee en Hendler. Hendler: ‘Een zoekopdracht voor dieren van een ‘omvang = klein’ en van een ‘type = vriendelijk’ zou dan daadwerkelijk kunnen leiden naar een online shop die gespecialiseerd is in hamsters.’