Google deelt beeldherkennings-AI als open source
Portrait Mode is bedoeld om de geringe scherptediepte na te bootsen die door fotografen gebruikt wordt bij portretfoto's; de onscherpe achtergrond leidt dan niet af van het onderwerp. Daarvoor is nodig dat de kunstmatige intelligentie achter de functie kan detecteren wat het onderwerp is, en waar het ophoudt. Andere smartphonefabrikanten hebben bijvoorbeeld een tweede camera aan het toestel meegegeven om hetzelfde effect, dat in fotografiekringen bekend staat als bokeh, te bereiken. Google kondigde maandag aan de achterliggende technologie te zullen delen in de TensorFlow-bibliotheek.
Semantic image segmentation
Google noemt de technologie die het op Github deelt als DeepLab-v3+ 'semantic image segmentation', wat erop neerkomt dat aan iedere pixel in beeld wordt toegewezen waar die bij hoort: de lucht, een huis, een hond, achtergrondrommel. Met die informatie kan kunstmatig bokeh aan een foto worden toegevoegd, en kunnen voor- en achtergrond worden gescheiden in een video. Gebruikers van Youtube 'stories' kunnen zo effecten bereiken die voorheen een blauw scherm vereisten.
Uiteraard zullen app-makers zich storten op de mogelijkheden van de nu vrijgegeven (server)software, maar Google hoopt dat ook wetenschappers en anderen gebruik gaan maken van de mogelijkheden tot object detection, en er nieuwe toepassingen voor weten te verzinnen.
Semantische segmentatie van beeld geniet al jaren aandacht van wetenschappelijke onderzoekers, zoals aan de University of Cambridge:
Reacties
Om een reactie achter te laten is een account vereist.
Inloggen Word abonnee