Overslaan en naar de inhoud gaan

Meta wil Wikipedia wippen met Natural Language Processing

Meta, het moederbedrijf van Facebook, heeft een knowledge-intensive systeem voor natural language processing (KI-NLP) vrijgegeven wat flinke impact kan hebben. De mogelijkheid bestaat dat dit Sphere-systeem op termijn Wikipedia overbodig maakt.
data streams
© Shutterstock
Shutterstock

Online-encyclopedie Wikipedia is de afgelopen jaren uitgegroeid tot het wereldwijd grootste kennisplatform. Maar dat wil niet per se zeggen dat dit altijd zo blijft. Wikipedia kampt sowieso met een gebrek aan sponsorgeld om de toekomst veilig te stellen voor zowel de infrastructuur als ook de organisatie achter de door vrijwillige bijdragen gevoede database. Maar mogelijk komen er ook op nieuwe technologie gebaseerde alternatieven. Een kandidaat daarvoor is het NLP-systeem van Facebook-moeder Meta. Dat bedrijf van miljardair Mark Zuckerberg heeft deze week de broncode van het onderliggende machinelearningmodel vrijgegeven.

Complexe vragen beantwoorden

Het systeem is zo opgezet dat het complexe vragen in natuurlijke taal kan beantwoorden en bronnen aanlevert die het antwoord ondersteunen. The Register geeft als voorbeeld de vraag: "Who is Joëlle Sambi Nzeba?" Het is een vraag die met Wikipedia niet te beantwoorden is. Sphere geeft als antwoord dat ze geboren is in België, en deels opgroeide in Kinshasa, de hoofdstad van Congo. Nu woont ze weer in Brussel. Ze is schrijver en activiste op het gebied van het feminisme. In de resultaten die Meta's systeem aandraagt, staat een link naar haar website met meer informatie.

Wikipedia heeft wel gediend als informatiebasis voor Sphere, maar vervolgens hebben de onderzoekers veel meer internetbronnen betrokken bij de kennisvergaring voor het KI-NLP-systeem. Daarmee kan Sphere niet alleen informatie halen uit het zeer gestructureerde en accurate Wikipedia maar ook uit de grote hoeveelheden ongestructureerde data die beschikbaar zijn op internet.

Nog zeker niet feilloos

Een belangrijk onderdeel van het Meta-onderzoek naar informatie op internet was om te zien wat er zou gebeuren als Wikipedia zou worden vervangen als bron. Het was duidelijk dat zich problemen voordeden, maar de prestaties van Sphere geven aan dat KI-NLP's wel degelijk een toevoeging kunnen betekenen ten opzichte van wat Wikipedia biedt.

Een probleem dat de onderzoekers erkennen in hun paper is dat de internetbronnen die Sphere gebruikt niet geverifieerd zijn op kwaliteit en accuratesse. Het gevaar van desinformatie, fouten en leugens ligt dus op de loer. De wetenschappers die aan Sphere werken, willen daarom in hun vervolgstappen een mechanisme ontwikkelen dat gericht is op het ontdekken van valse claims en tegenstellingen. Daarnaast moet er een methode komen die ervoor zorgt dat betrouwbare bronnen een hogere prioriteit krijgen. Verder moet Sphere ook een mechanisme hebben dat kan besluiten geen antwoord te geven op een bepaalde vraag, gewoon omdat er te weinig betrouwbare informatie beschikbaar is.

Reacties

Om een reactie achter te laten is een account vereist.

Inloggen Word abonnee

Bevestig jouw e-mailadres

We hebben de bevestigingsmail naar %email% gestuurd.

Geen bevestigingsmail ontvangen? Controleer je spam folder. Niet in de spam, klik dan hier om een account aan te maken.

Er is iets mis gegaan

Helaas konden we op dit moment geen account voor je aanmaken. Probeer het later nog eens.

Maak een gratis account aan en geniet van alle voordelen:

Heb je al een account? Log in

Maak een gratis account aan en geniet van alle voordelen:

Heb je al een account? Log in