Google maakt alle bronnen open data doorzoekbaar
Een van de uitdagingen om te komen tot een waardevol instrument was het traceren van de datasets zodat ze doorzoekbaar gemaakt konden worden. Google heeft daarop een open standaard ontwikkeld (schema.org) voor een pagina met meta-informatie die de beheerders kunnen koppelen aan hun dataset. Dat maakt het voor Google makkelijker de dataset onder te brengen in de Dataset Search.
Google introduceerde Dataset Search in 2018. Het gereedschap is in eerste instantie bedoeld voor onderzoekers die gebruik willen maken van open data. Maar alle geïnteresseerden kunnen er ook gebruik van maken. Google wil uiteindelijk een ecosysteem creëren voor het publiceren, ontdekken en gebruik van open data.
Wie van skiën houdt kan bijvoorbeeld gegevens vinden over de snelheden van de snelste skiërs, maar ook de omzet van ski-oorden. De meeste gegevens betreffen geowetenschappen, biologie en agricultuur.
Overheden zijn grote leveranciers
Tot nog toe zijn de meest gebruikte zoektermen 'education', 'weather', 'cancer', çrime' en 'soccer', zegt Natasha Noy in een officiële blog. Veel overheden gebruiken inmiddels schema.org wanneer zij hun datasets publiceren. De Amerikaanse overheid is de grootste leverancier met meer dan 2 miljoen datasets.
Met het weghalen van het 'bèta'-label heeft Google ook een aantal nieuwe mogelijkheden toegevoegd. Zo is het nu mogelijk te zoeken op type dataset, dus bijvoorbeeld tabellen, afbeeldingen of tekst. Volgens Noy zijn de tabellen veruit de grootste groep datasets.
Reacties
Om een reactie achter te laten is een account vereist.
Inloggen Word abonnee