Nieuws Artificial Intelligence Juridisch Wetenschap

25 maart 2025 leestijd 2 minuten 0 reacties

TNO zoekt datahulp voor Nederlands AI-taalmodel GPT-NL

Innovatie- en onderzoeksinstituut TNO zoekt mensen en partijen die willen meewerken aan de ontwikkeling van GPT-NL. Dat grote taalmodel (large language model, LLM) voor generatieve AI (genAI) wordt ontwikkeld door TNO, onderwijsorganisatie SURF en het Nederlands Forensisch Instituut (NFI).

Lees ook: Wat maakt de ontwikkeling Nederlands LLM zo belangrijk?

Jasper BakkerredacteurMeer van deze auteur

handen op elkaar, team, samenwerken — samenwerking

Shutterstock

"De opkomst van LLMs (Large Language Models) heeft veel teweeggebracht, maar vaak zijn deze modellen getraind op data die niet rechtmatig is verkregen. Met GPT-NL pakken we dit anders aan: voor de ontwikkeling van ons taalmodel gebruiken we alleen data die we rechtmatig hebben verkregen", schrijft TNO in een oproep op social network LinkedIn.

Datascraping en e-bookpiraterij

Een voornaam doel bij GPT-NL is om op verantwoorde wijze gebruik te maken van data voor het trainen van het onderliggende taalmodel. Dit in tegenstelling tot LLM's van techreuzen als Meta, die op grootschalige wijze informatie op internet hebben gescraped én in illegaal samengestelde verzamelingen. Een voorbeeld van dat laatste is het gebruik van de 'piratendatabase' LibGen, met daarin 7,5 miljoen illegaal gekopieerde e-books en wetenschappelijke papers.

Meta wordt aangeklaagd voor onrechtmatig datagebruik, om zijn zelfontwikkelde AI te trainen. Uit rechtbankdocumenten is begin dit jaar gebleken dat CEO Mark Zuckerberg het gebruik van LibGen zelf heeft goedgekeurd.

Auteursrechthebbenden

Bij het ontwikkelen van GPT-NL wordt een verantwoorde, juridisch veiligere aanpak gehanteerd. De drie organisaties die het Nederlandse taalmodel ontwikkelen werken samen met auteursrechthebbenden en dataproviders. Laatstgenoemden omvatten uitgeverijen, mediabedrijven, archieven, bibliotheken, en organisaties als de Vereniging Nederlandse Gemeenten (VNG).

Ook OpenAI belooft klanten bescherming tegen auteursrechtenzaken

Auteursrechtelijk beschermd materiaal niet wissen uit datasets waar OpenAI z'n AI's op traint, maar eventuele claims afweren - of afkopen.

1 min 1

Nieuws Auteursrecht

ChatGPT-gebruik lijkt juridisch nu veiliggesteld

Claims van Amerikaanse auteurs dat AI-chatbot hun werk steelt, zijn door rechter grotendeels afgewezen.

1 min

Nieuws Krant

OpenAI en Microsoft aangeklaagd over contentgebruik voor AI-training

New York Times klaagt OpenAI en Microsoft aan

2 min 1

Ook OpenAI belooft klanten bescherming tegen auteursrechtenzaken

Auteursrechtelijk beschermd materiaal niet wissen uit datasets waar OpenAI z'n AI's op traint, maar eventuele claims afweren - of afkopen.

1 min 1

Nieuws Auteursrecht

ChatGPT-gebruik lijkt juridisch nu veiliggesteld

Claims van Amerikaanse auteurs dat AI-chatbot hun werk steelt, zijn door rechter grotendeels afgewezen.

1 min

Nieuws Krant

OpenAI en Microsoft aangeklaagd over contentgebruik voor AI-training

New York Times klaagt OpenAI en Microsoft aan

2 min 1

Voor de ontwikkeling van GPT-NL wordt nu een oproep gedaan voor meer meewerkers. "Ben je iemand die kennis heeft van de ontwikkelingen rondom LLMs of een partij die betrokken is bij de bescherming van auteursrechten? Dan willen we graag met jou samenwerken. Of je nu beslisbevoegd bent of het mandaat hebt om draagvlak binnen je organisatie te creëren, we nodigen je uit om mee te doen en bij te dragen aan deze belangrijke ontwikkeling in Nederland."

3 stappen om mee te doen

Geïnteresseerden kunnen zich aanmelden "in 3 simpele stappen", aldus TNO. Deze kunnen worden gezet op de samenwerkingspagina van de GPT-NL website. De eerste stap is het bekijken van de licentievoorwaarden, waarin onder meer is vastgelegd dat data eigendom blijven van de rechtmatige eigenaar.

De tweede stap is het hebben van een kennismaking, gevolgd door het ondertekenen van het officiële contract (de content contributor agreement). Daarna kunnen data veilig gedeeld worden, waarbij de makers van GPT-NL nog eventuele persoonsgegevens uit aangeleverde teksten gaan verwijderen.

'Divers en eerlijk taalmodel'

De derde stap is voeren van een slotgesprek. "Daarna ben je KLAAR! Met jouw teksten zijn we een stuk dichter bij een divers en eerlijk taalmodel. Als dataleverancier ben je nu ook onderdeel van de Content Board. Vanuit hier wordt meegedacht aan de toekomst van GPT-NL." De sluitingsdatum voor deze datadeelname ligt op 15 april.

Identity Management Day 2025: 10 tips om identiteitsdiefstal bij medewerkers te voorkomen

KnowBe4 presenteert 10 tips om identiteitsdiefstal bij medewerkers te voorkomen

2 min

Achtergrond AI Partner

Countering information asymmetry with AI

In the digital age, data is the new gold.

2 min

Achtergrond Leadership Partner

Staying ahead as a leader: learning from failure

The digital landscape is changing fast. So how do you stay ahead of the game as a digital leader?

2 min

Meer whitepapers

Whitepaper Artificial Intelligence

The challenge of information asymmetry

In many organizations, decision-making is hindered by information asymmetry, where critical data is unevenly distributed

Whitepaper Marketing

High impact business stories creëren

De route naar de zakelijke beslisser.

Whitepaper Cloud

Praktische handleiding voor een succesvolle cloud migratie

Welke aandachtspunten zijn cruciaal voor een succesvolle cloudmigratie? Dit whitepaper biedt handvatten voor een soepele transitie.

MEER WHITEPAPERS

Reacties

Om een reactie achter te laten is een account vereist.

Inloggen Word abonnee

TNO zoekt datahulp voor Nederlands AI-taalmodel GPT-NL

Datascraping en e-bookpiraterij

Auteursrechthebbenden

Ook OpenAI belooft klanten bescherming tegen auteursrechtenzaken

ChatGPT-gebruik lijkt juridisch nu veiliggesteld

OpenAI en Microsoft aangeklaagd over contentgebruik voor AI-training

Ook OpenAI belooft klanten bescherming tegen auteursrechtenzaken

ChatGPT-gebruik lijkt juridisch nu veiliggesteld

OpenAI en Microsoft aangeklaagd over contentgebruik voor AI-training

3 stappen om mee te doen

'Divers en eerlijk taalmodel'

Identity Management Day 2025: 10 tips om identiteitsdiefstal bij medewerkers te voorkomen

Countering information asymmetry with AI

Staying ahead as a leader: learning from failure

The challenge of information asymmetry

High impact business stories creëren

Praktische handleiding voor een succesvolle cloud migratie

Reacties

Bevestig jouw e-mailadres

Er is iets mis gegaan

Maak een gratis account aan en geniet van alle voordelen:

Maak een gratis account aan en geniet van alle voordelen:

TNO zoekt datahulp voor Nederlands AI-taalmodel GPT-NL

Datascraping en e-bookpiraterij

Auteursrechthebbenden﻿

Ook OpenAI belooft klanten bescherming tegen auteursrechtenzaken

ChatGPT-gebruik lijkt juridisch nu veiliggesteld

OpenAI en Microsoft aangeklaagd over contentgebruik voor AI-training

Ook OpenAI belooft klanten bescherming tegen auteursrechtenzaken

ChatGPT-gebruik lijkt juridisch nu veiliggesteld

OpenAI en Microsoft aangeklaagd over contentgebruik voor AI-training

3 stappen om mee te doen﻿

'Divers en eerlijk taalmodel'﻿

Identity Management Day 2025: 10 tips om identiteitsdiefstal bij medewerkers te voorkomen

Countering information asymmetry with AI

Staying ahead as a leader: learning from failure

The challenge of information asymmetry

High impact business stories creëren

Praktische handleiding voor een succesvolle cloud migratie

Reacties

Auteursrechthebbenden

3 stappen om mee te doen

'Divers en eerlijk taalmodel'