Overslaan en naar de inhoud gaan

Semantic web maakt WWW transparanter

Het world wide web bestaat pas tien jaar. In een razend tempo heeft het zich ontwikkeld van een speeltje van een paar universiteiten en wat hightechbedrijven tot een niet meer weg te denken communicatiemedium waarvan veel mensen vrijwel dagelijks gebruikmaken.
Business
Shutterstock
Shutterstock

Maar ook de beperkingen zijn zichtbaar geworden. Er zijn veel informatieve websites, maar het wordt langzaamaan ondoenlijk die allemaal regelmatig af te gaan om vervolgens te merken dat er geen belangwekkend nieuws is. Ook het zoeken naar zaken kan, ondanks de verbluffende prestaties van de zoekmachines, soms een frustrerende aangelegenheid zijn. Je gebruikt blijkbaar de verkeerde zoektermen of ze zijn niet onderscheidend genoeg waardoor je door de bomen het bos niet meer ziet. Hoe kan men effectiever gebruikmaken van het web? Het antwoord daarop zou kunnen luiden: door een betere verdeling van taken tussen mens en machine. Bij de huidige werkwijze verzorgen computers vooral de communicatie (op een laag semantisch niveau) en de presentatie op het scherm. Het inhoudelijke deel van de communicatie wordt vrijwel volledig aan de mens overgelaten. De oplossing laat zich raden: als computers meer weet hebben van de inhoud van de boodschap zijn zij beter in staat daar meer ondersteuning bij te leveren. Het semantic­web­initiatief van het World Wide Web Consortium (W3C) zou die oplossing kunnen worden. Het beoogt de informatie van het huidige web zodanig te annoteren dat computers meer met de inhoud van het web aankunnen en ons daardoor bij bepaalde activiteiten veel beter behulpzaam kunnen zijn (zie kader). Waaruit zou die betere ondersteuning kunnen bestaan? Een paar voorbeelden. • ­Gerichter zoeken naar informatie omdat niet alleen gebruik wordt gemaakt van zoektermen, maar ook van de context. • ­Het maken van een afspraak. • ­Het zoeken van producten of diensten die moeten voldoen aan vooraf geformuleerde eisen. • ­Het prikken van een datum en een locatie voor een vergadering. • ­Op de hoogte houden van bijeenkomsten, bekendmakingen, publicaties. In veel organisaties kan een aanzienlijke hoeveelheid tijd worden bespaard als medewerkers dit type activiteiten voor een belangrijk deel aan de computer kunnen delegeren. Doorbraak Maar naast een grotere efficiëntie liggen er ook kansen op het vergroten van transparantie tussen marktvraag en ­aanbod. Vragers hebben meer mogelijkheden om een optimaal product te vinden en aanbieders kunnen hun markt vergroten. Voor bepaalde productcategorieën gebeurt dat nu ook al via portalsites (woningmarkt, tweedehands auto’s, veilingen). Het gaat hier echter om een meer fundamentele oplossing voor het ontsluiten van de data op het web: het web als wereldwijde database. Het is in dit stadium nog moeilijk te voorspellen hoe deze wereldwijde database/knowledgebase zich zal ontwikkelen. Voor de informatie/communicatie in de bouw bijvoorbeeld bestaan wel interessante mogelijkheden (zie kader). Uiteraard heeft men al veel eerder geconstateerd dat het niveau van informatieoverdracht meer voor machineverwerking geschikt gemaakt zou moeten worden. Denk bijvoorbeeld aan de ISO­standaard IS­10303 (Step) voor de overdracht van productdata. In de vliegtuigbouw en de automobielindustrie heeft deze standaard een belangrijke plek verworven, in andere sectoren zoals de bouw is het echter geen succes geworden. Dit heeft onder meer te maken met het feit dat de vliegtuigbouw en de auto­industrie werken met één dominante partij, gecombineerd met een groot aantal onderaannemers waar gedurende langere tijd mee wordt samengewerkt. In andere sectoren werkt een dergelijk top­down­aanpak blijkbaar niet, maar een bottom­up­aanpak kan gemakkelijk tot onrendabele investeringen leiden. Semantic­web­technologie heeft een aantal eigenschappen die voor deze sectoren wel tot een doorbraak zouden kunnen leiden: • ­Laagdrempelig; het semantic web is een toevoeging op het bestaande web, er zijn geen grote investeringen nodig om van start te gaan. • ­Evolutionair; simpel beginnen en voortbouwen op het werk van anderen, de techniek vereist niet een revolutionaire systeemverandering (hoewel die later terugkijkend wel plaatsgevonden kan hebben). • ­Gedistribueerd; net als het bestaande web is er geen centrale controlerende instantie: dit biedt veel vrijheid voor eigen initiatief. • ­Brede ondersteuning; het is natuurlijk afwachten of het semantic web evenveel support uit de ICT­industrie zal krijgen als XML. De voortekenen zijn echter niet ongunstig. Naast het royale aanbod uit de open­sourcewereld en Europese (IST) en Amerikaanse (Darpa) technologieprojecten, ontwikkelt bijvoorbeeld HP een inmiddels breed geaccepteerde Java­bibliotheek en Xerox een ‘ontologie authoring tool’ (editor). Hier en daar worden al initiatieven ondernomen, maar zoals onlangs op een symposium in Brussel bleek, is er nog geen sprake van een hype. Op hetzelfde symposium was een presentatie van een project om semantic web in te zetten om de informatievoorziening van het Europese Parlement te helpen ontsluiten. Mocht dit project een succes worden dan zou dat uiteraard een indrukwekkende ‘showcase’ zijn. Basisprincipe semantic web Om een computer meer te laten ‘begrijpen’ van de inhoud van een webpagina, is het noodzakelijk eerst een scheiding aan te brengen tussen de informatie zelf en de manier waarop deze informatie wordt gepresenteerd (schermopmaak). Zoals bekend wordt in de webpaginataal HTML dit onderscheid niet gemaakt, wat aanleiding gaf tot de ontwikkeling van XML (Extensible Mark­up Language). Vervolgens is het essentieel te weten wat een informatie­element precies voorstelt. In XML is dit alleen geregeld voor de structuur van de gegevensverzameling. In de DTD (Document Type Definition) wordt bijvoorbeeld vastgelegd dat een element ‘tijdschrift’ één of meer elementen ‘artikel’ kan bevatten, maar ook deze metadata kunnen alleen door mensen worden begrepen: voor een computer is de betekenis enkel dat element ‘x’ één of meer elementen ‘y’ kan bevatten. Een nieuwe laag boven XML kan dit nu ook voor de betekenis van de data vastleggen. Dit initiatief van het World Wide Web Consortium (W3C), de belangrijkste ontwikkelaar van webstandaarden, wordt semantic web genoemd. Het basisprincipe is eenvoudig: de betekenis wordt uitgedrukt in een verzameling elementaire zinnen (onderwerp, gezegde/predikaat, object/ waarde), bijvoorbeeld ‘Deze webpagina is gemaakt door Jan Smit’. Vervolgens moeten de drie onderdelen van de elementaire zin worden benoemd en uniek geïdentificeerd, dus ‘deze webpagina’ kan worden aangeduid met zijn URL (http://www.xyz.nl/...), ‘Jan Smit’ kan worden aangeduid met de karakterreeks ‘Jan Smit’, maar beter nog met een unieke ID, bijvoorbeeld zijn e­mailadres of zijn sofinummer (een URN in W3C­terminologie). Het predikaat ‘is gemaakt door’ en de referentie dat ‘Jan Smit’ van het type mens is, kan worden vastgelegd in een online­vocabulaire die gewoonlijk met de term ontologie wordt aangeduid. Hiermee is de vergelijking van het web met een database compleet, dat wil zeggen zowel de data als de metadata (data over data) zijn toegankelijk. De beschikbaarheid van metadata is een noodzakelijke voorwaarde voor een efficiënte en betrouwbare machine­interpretatie van informatiebronnen. Het semantic­web­initiatief voorziet voor de toekomst ook in de mogelijkheid om logische kennisregels toe te voegen, dus van database naar knowledgebase, op basis waarvan een kennisapplicatie allerlei conclusies (nieuwe informatie) kan trekken. ICT in de bouw Een typisch kenmerk van de bouw is de projectmatige manier van werken in telkens per project wisselende samenstellingen van bedrijven. Dit gevoegd bij het feit dat het aandeel midden­ en kleinbedrijf in deze industrietak hoog is en dat de overheid geen dominante rol speelt, heeft vertragend gewerkt bij de invoering van ICT in de bouw. Investeringen in ICT die over de bedrijfsgrenzen heen gaan moeten in principe binnen de projectduur worden terugverdiend. Bij de huidige smalle winstmarges in de bouw kunnen dergelijke investeringen niet anders dan heel bescheiden zijn. Semantic­web­technologie kan de noodzaak wegnemen dat investeringen binnen een project moeten worden terugverdiend. De informatievoorziening in de bouw vertoont namelijk hetzelfde euvel als het web zelf: de communicatie is gericht op verwerking door mensen, computers fungeren slechts als doorgeefluik. Het terugdringen van de menselijke rol van informatieverwerker/omvormer in het bouwproces naar een meer sturende/controlerende rol is misschien wel de grootste uitdaging waar de bouw de komende jaren voor staat. Alleen dan wordt het pas mogelijk om: • ­de faalkosten te reduceren door het terugdringen van fouten bij informatie­overdracht en een projectoverstijgende registratie van opgetreden fouten; • ­veel meer ontwerpvarianten te bekijken en te analyseren op de te verwachten prestaties, of zij voldoen aan regelgeving, kosten, et cetera; • ­een (veel) betere aansluiting te vinden tussen ontwerp en uitvoering, door het inbrengen van uitvoeringskennis in de ontwerpfase en het delegeren van ontwerpbeslissingen naar de uitvoeringsfase; • ­een bouwwerk eerst virtueel te construeren voordat de eerste paal de grond in gaat. Geleidelijk Hoe zou semantic web in de praktijk ingevoerd kunnen worden? Wat nodig is zijn condensatiekernen die een proces op gang kunnen brengen dat voor nieuwe partijen interessant is om op in te haken. Kandidaten voor dergelijke condensatiekernen in de bouw zouden kunnen zijn: • ­Aankondigingen van aanbestedingen Vanuit bijvoorbeeld de overheid als belangrijke opdrachtgever van bouwwerken (Rijkswaterstaat, Rijksgebouwendienst) zou het met betrekkelijk weinig inspanning mogelijk moeten zijn de kerngegevens van een aanbesteding (opdrachtgever, datum, werkzaamheden et cetera) naast de nu al gebruikelijke publicatie op het web ook in de vorm van machine­interpreteerbare data bekend te maken. • ­Online­catalogi Toeleveranciers zouden hun catalogi via het web kunnen ontsluiten. Dit gaat wel een stap verder omdat bouwproducten vaak tientallen kenmerken kunnen hebben, maar men kan beginnen door daaruit eerst een bescheiden selectie te nemen. • ­Bodemonderzoekgegevens Voordat men zelf bodemonderzoek (milieu of draagkracht) laat verrichten kan het interessant zijn te bekijken of er in de buurt al eerder onderzoek is gedaan. Ook hier ligt de kern vooral bij de beschikbaarheid, dus locatie, eigenaar, datum et cetera. • ­Ligging van kabels en leidingen Gebeurt nu nog als regel in papieren vorm, dat wil zeggen een stapel kaarten, van elk nutsbedrijf één (gas, elektriciteit, water, riool, plus een aantal telecombedrijven). Deze aanpak is duidelijk wat bescheidener van opzet dan de alomvattende projectkaders zoals IOP­Bouw (Innovatief Onderzoeksprogramma), LWI (Land Water Milieu Informatietechnologie) en de Europese kaderprogramma’s uit het verleden en heden. Toch zou als het balletje eenmaal gaat rollen het uiteindelijke resultaat van een vergelijkbare omvang kunnen zijn, maar dan volgens een traject van geleidelijke groei en niet met één of andere dramatische ‘cultuuromslag’. Dr.ir. Peter Willems is werkzaam bij TNO Bouw (p.willems@bouw.tno.nl). Voor meer informatie: http://www.w3.org.

Lees dit PRO artikel gratis

Maak een gratis account aan en geniet van alle voordelen:

  • Toegang tot 3 PRO artikelen per maand
  • Inclusief CTO interviews, podcasts, digitale specials en whitepapers
  • Blijf up-to-date over de laatste ontwikkelingen in en rond tech

Bevestig jouw e-mailadres

We hebben de bevestigingsmail naar %email% gestuurd.

Geen bevestigingsmail ontvangen? Controleer je spam folder. Niet in de spam, klik dan hier om een account aan te maken.

Er is iets mis gegaan

Helaas konden we op dit moment geen account voor je aanmaken. Probeer het later nog eens.

Maak een gratis account aan en geniet van alle voordelen:

Heb je al een account? Log in

Maak een gratis account aan en geniet van alle voordelen:

Heb je al een account? Log in