Overslaan en naar de inhoud gaan

Coronadataset online gedeeld voor AI-analyse

AI-hulp gevraagd voor bestrijding van het nieuwe coronavirus. Hoe dan? Door AI-kracht los te laten op een geopenbaarde en uitdijende dataset. CORD-19, zo heet de Open Research Dataset over COVID-19 met inmiddels al 29,000 wetenschappelijke artikelen. Vorige week waren dat er nog 24,000. Deze openbare dataset moet informatie over de coronavirusfamilie sneller verspreiden onder researchers, in de hoop sneller een vaccin te vinden.
© 0CC - Pixabay
0CC - Pixabay

Sinds COVID-19 is uitgeroepen tot een officiële pandemie, hebben diverse organisaties zich gestort op het vergaren van wetenschappelijke informatie over het virus. Daaronder ook het Allen Institute for AI, opgericht door Microsoft-grondlegger Paul Allen. Dat AI-instituut heeft de handen ineengeslagen met andere grote onderzoekscentra om te zorgen dat alle wetenschappelijke corona-informatie op één plek te vinden is. De hieruit voorgekomen database is online te vinden op Semantic Scholar. Om toegang te krijgen tot de database hebben geïnteresseerden wel een geldige Dataset License nodig.

Hoe meer, hoe beter

Vorige week stonden er nog 24,000 wetenschappelijke artikelen in de database, waar dat er deze week al 29,000 zijn. Kaggle, een platform voor de datascience community, organiseert nu de COVID-19 Open Research Dataset Challenge. Daarmee wil Kaggle belangrijke vragen beantwoord krijgen over het virus, zoals de geschiedenis, diagnostiek van het virus, beheersmaatregelen op het mens-dier-grensvlak, en meer. 

De database is opgezet in opdracht van het White House Office of Science and Technology Policy (OSTP), meldt de gerenommeerde vaktitel MIT Technology Review. Het vullen van deze wetenschappelijke database voor AI-analyse is mede verzorgd door de Amerikaanse National Library of Medicine (NLM). Die instantie heeft toegang gegeven tot al bestaande onderzoeken naar de coronavirusfamilie.

AI-voorbewerking

Vervolgens heeft Microsoft zijn algoritmes voor het cureren van literatuur ingezet om relevante artikelen te vinden. Daarna heeft het Allen Institute for AI zijn technologie voor kunstmatige intelligentie (AI) gebruikt om de artikelen om te zetten van webpagina's en PDF-bestanden in een gestructureerde opzet die dat kan worden verwerkt door algoritmes. 

Reacties

Om een reactie achter te laten is een account vereist.

Inloggen Word abonnee

Bevestig jouw e-mailadres

We hebben de bevestigingsmail naar %email% gestuurd.

Geen bevestigingsmail ontvangen? Controleer je spam folder. Niet in de spam, klik dan hier om een account aan te maken.

Er is iets mis gegaan

Helaas konden we op dit moment geen account voor je aanmaken. Probeer het later nog eens.

Maak een gratis account aan en geniet van alle voordelen:

Heb je al een account? Log in

Maak een gratis account aan en geniet van alle voordelen:

Heb je al een account? Log in