Lizenzrechtliche Frage zur kommerziellen Nutzung eines KI-Modells

2. August 2023 Thema abonnieren
 Von 
luckman
Status:
Frischling
(2 Beiträge, 0x hilfreich)
Lizenzrechtliche Frage zur kommerziellen Nutzung eines KI-Modells

Liebe Rechtsexperten,

ich stehe vor einem komplexen rechtlichen Problem, zu dem ich gerne Ihre Einschätzung hören würde.

Ich habe ein frei verfügbares vortrainiertes neuronales Netzwerk mit meinen eigenen Daten weiter angepasst.
Vortrainiert bedeutet, dass es bereits auf einem großen Datensatz trainiert wurde.

Das vortrainierte Netzwerk ist Teil einer Software-Bibliothek, die unter der Apache 2.0 Lizenz steht und somit für die kommerzielle Nutzung freigegeben ist. Allerdings ist der Datensatz (eine Bilddatenbank), der zum vortrainieren des Netzwerks verwendet wurde, ausdrücklich nicht für kommerzielle Zwecke freigegeben.

Meine zentrale Frage ist, ob die Lizenzbedingungen der Daten, die für das Vortrainieren des Netzwerks verwendet wurden, Auswirkungen auf die kommerzielle Verwendbarkeit meines darauf basierenden, angepassten Netzwerks haben können.

Ich möchte betonen, dass das nachtrainierte Netzwerk keinerlei Informationen mehr über die ursprünglichen Bilddaten enthält. Es stellt lediglich eine Art Berechnungsvorschrift dar - eine Reihe von Zahlen, die die Entscheidungen des Netzwerks beeinflussen. Es ist daher nicht möglich, Rückschlüsse auf das ursprünglich verwendete Bildmaterial zu ziehen.

Unabhängig davon ob es überhaupt nachgewiesen werden kann, welche Daten zum Training verwendet wurden, interessiert mich ob eine derartige Lizenzverkettung rechtlich denkbar ist.
Oder kann man vielleicht sagen, dass zur Urherberrechts- oder Lizenzverletzung auch tatsächlich die entsprechend Lizensierten Daten im Produkt enthalten sein müssen?

Vielen Dank im Voraus für Ihre Einschätzung!




3 Antworten
Sortierung:
#1
 Von 
Harry van Sell
Status:
Unbeschreiblich
(129803 Beiträge, 41392x hilfreich)

Zitat (von luckman):
Liebe Rechtsexperten

Das 123recht.de Forum ist ein reines Laien-Forum
https://www.123recht.de/info.asp?id=nutzeragb#agb21




Zitat (von luckman):
Meine zentrale Frage ist, ob die Lizenzbedingungen der Daten, die für das Vortrainieren des Netzwerks verwendet wurden, Auswirkungen auf die kommerzielle Verwendbarkeit meines darauf basierenden, angepassten Netzwerks haben können.

Ja.
Das kann sogar dazu führen, das die ganzen Daten die man jetzt hat, nicht legal zustandekamen



Signatur:

Meine persönliche Meinung/Interpretation!
Im übrigen verweise ich auf § 675 Abs. 2 BGB

0x Hilfreiche Antwort

#2
 Von 
BigiBigiBigi
Status:
Junior-Partner
(5448 Beiträge, 1823x hilfreich)

Zitat (von luckman):
ob die Lizenzbedingungen der Daten, die für das Vortrainieren des Netzwerks verwendet wurden, Auswirkungen auf die kommerzielle Verwendbarkeit meines darauf basierenden, angepassten Netzwerks haben können


Das ist eine spannende und noch nicht höchstrichterlich geklärte Frage.

Mal dumm gesagt, wenn Adobe früher den (nicht KI-basierten) Content-Aware Fill getestet hat, hat man dazu sicherlich auch "irgendwelche" Bilder verwendet, es hat aber keinen interessiert, weil jedem klar war, dass nichts aus dem ursprünglichen Werk in der Software gelandet ist.

Bei KI ist es hingegen selbst den Entwicklern völlig unklar, was und wieviel von den Originalwerken noch "in anderer Form" in den gelernten Daten gespeichert ist. Was es andersherum für den Rechteinhaber nicht leichter macht, eine Urheberrechtsverletzung zu beweisen. Sofern aber unstrittig ist, dass eines seiner Werke zum Trainieren verwendet wurde, könnte ein Gericht hier der Auffassung sein, dann müsse der Verbreiter der Software beweisen, dass das Werk darin nicht gespeichert ist. (Selbst der BGH argumentiert manchmal zielorientiert, und wenn das Ziel ist "die Rechteinhaber sollen nicht wehrlos dastehen"...)

0x Hilfreiche Antwort

#3
 Von 
luckman
Status:
Frischling
(2 Beiträge, 0x hilfreich)

Danke schonmal für die Antworten.

Zitat (von BigiBigiBigi):
Bei KI ist es hingegen selbst den Entwicklern völlig unklar, was und wieviel von den Originalwerken noch "in anderer Form" in den gelernten Daten gespeichert ist. Was es andersherum für den Rechteinhaber nicht leichter macht, eine Urheberrechtsverletzung zu beweisen.


In Beispiel Adobe geht es um generative KI, also KI die in dem Fall selbst Bilder erzeugt auf Basis des gelernten. Hier könnte man ja eventuell sogar noch irgendwie nachweisen, dass das KI-Generierte Bild - mal blöd gesagt - die Nasenform aus einem der Trainingsbilder abgeschaut hat. In dem Fall sind das Format der Trainingsdaten und das des KI-Outputs gleich, nämlich ein Bild.

In meinem Fall geht es um diskriminative KI. Im Gegensatz zu generativer KI entstehen dabei keine neuen Inhalte, sondern der Input wird lediglich interpretiert und darauf hin eine Entscheidung zu treffen.

Um beim Thema Bild zu bleiben kann das eine KI sein, die Bilder Klassifiziert, also die Beispielsweise erkennt, ob auf einem Bild ein Hund oder eine Katze zu sehen ist. Diese lernt anhand der Trainingsdaten nur welche Bildmerkmale aus dem Eingangsbild extrahiert werden müssen, und erzeugt daraus einen Vektor von Wahrscheinlichkeiten dass das Eingangsbild zu einer der Beiden Klassen gehört.
Also ein Bild rein, zwei Zahlen raus.

Und auch die Ergebnisse des Trainings werden ja nur als Gewichte, also auch wieder eine Menge von Zahlen abgespeichert, ohne direkte Inhalte der Trainingsdaten zu beinhalten.

0x Hilfreiche Antwort

Und jetzt?

Für jeden die richtige Beratung, immer gleich gut.
Schon 303.077 Beratungen
Anwalt online fragen
Ab 30
Rechtssichere Antwort in durchschnittlich 2 Stunden
122.799 Bewertungen
  • Keine Terminabsprache
  • Antwort vom Anwalt
  • Rückfragen möglich
  • Serviceorientierter Support
Anwalt vor Ort
Persönlichen Anwalt kontaktieren. In der Nähe oder bundesweit.
  • Kompetenz und serviceoriente Anwaltsuche
  • mit Empfehlung
  • Direkt beauftragen oder unverbindlich anfragen
Alle Preise inkl. MwSt. zzgl. 5€ Einstellgebühr pro Frage.