Coronadataset online gedeeld voor AI-analyse
Sinds COVID-19 is uitgeroepen tot een officiële pandemie, hebben diverse organisaties zich gestort op het vergaren van wetenschappelijke informatie over het virus. Daaronder ook het Allen Institute for AI, opgericht door Microsoft-grondlegger Paul Allen. Dat AI-instituut heeft de handen ineengeslagen met andere grote onderzoekscentra om te zorgen dat alle wetenschappelijke corona-informatie op één plek te vinden is. De hieruit voorgekomen database is online te vinden op Semantic Scholar. Om toegang te krijgen tot de database hebben geïnteresseerden wel een geldige Dataset License nodig.
Hoe meer, hoe beter
Vorige week stonden er nog 24,000 wetenschappelijke artikelen in de database, waar dat er deze week al 29,000 zijn. Kaggle, een platform voor de datascience community, organiseert nu de COVID-19 Open Research Dataset Challenge. Daarmee wil Kaggle belangrijke vragen beantwoord krijgen over het virus, zoals de geschiedenis, diagnostiek van het virus, beheersmaatregelen op het mens-dier-grensvlak, en meer.
De database is opgezet in opdracht van het White House Office of Science and Technology Policy (OSTP), meldt de gerenommeerde vaktitel MIT Technology Review. Het vullen van deze wetenschappelijke database voor AI-analyse is mede verzorgd door de Amerikaanse National Library of Medicine (NLM). Die instantie heeft toegang gegeven tot al bestaande onderzoeken naar de coronavirusfamilie.
AI-voorbewerking
Vervolgens heeft Microsoft zijn algoritmes voor het cureren van literatuur ingezet om relevante artikelen te vinden. Daarna heeft het Allen Institute for AI zijn technologie voor kunstmatige intelligentie (AI) gebruikt om de artikelen om te zetten van webpagina's en PDF-bestanden in een gestructureerde opzet die dat kan worden verwerkt door algoritmes.
Reacties
Om een reactie achter te laten is een account vereist.
Inloggen Word abonnee