
DACH - Deutschsprachige Community für Deutschland, Österreich, Schweiz
Das Sammelbecken auf feddit.org für alle Deutschsprechenden aus Deutschland, Österreich, Schweiz, Liechtenstein, Luxemburg und die zwei Belgier. Außerdem natürlich alle anderen deutschprechenden Länderteile der Welt.
Für länderspezifische Themen könnt ihr euch in folgenden Communities austauschen:
___
Aus gegebenem Anlass werden Posts zum Thema Palästina / Israel hier auf Dach gelöscht. Dasselbe gilt zurzeit für Wahlumfragen al´a Sonntagsumfrage.
___
Einsteigertipps für Neue gibt es hier.
___
Aus gegebenem Anlass: Bitte Titel von Posts nur sinnerweiternd und nicht sinnentstellend verändern. Eigene Meinungen gehören in den Superkommentar oder noch besser in einen eigenen Kommentar darunter.
___
Eine ausführliche Sidebar mit den Serverregeln usw. findet ihr auf der Startseite von feddit.org
___
Ich wette anstatt irgendwelche sinnvollen Änderungen anzustoßen wird das Ziel sein einfach ähnlich wie bei Datenträgern einfach eine Pauschalgebühr durchzusetzen.
Die stört mich gar nicht so sehr. Ich hab ein paar Festplatten, also hab ich ja meinen Teil gezahlt. Piraterie gerechtfertigt.
Mehr Details hierzu bei heise:
https://www.heise.de/news/GEMA-vs-OpenAI-Niederlage-fuer-ChatGPT-vor-Muenchner-Gericht-11073532.html
Konkret geht es darum, dass ChatGPT die Liedtexte auf Anfrage nahezu komplett und korrekt wiedergegeben hat. Für die GEMA ein klares Zeichen dafür, dass die Texte als solche im System abgespeichert sein müssen. OpenAI hingegen sagt, die Liedtexte würden quasi vom System neu erzeugt. Dass die neun Lieder für das Training der KI-Modelle genutzt wurden, stand außer Frage und war für beide Seiten unstrittig. Das Gericht entschied nun, die Texte seien "memorisiert" worden – und damit handele es sich um eine unerlaubte Vervielfältigung. Dass die exakte Wiedergabe quasi eine zufällige Ausgabe sei, hält das Gericht für ausgeschlossen.
Richtig interessant wird das bei Open Source Programmcode. Das Urheberrecht schützt in Deutschland ja auch die "kleine Münze", d.h. auch Werke ohne nennenswerte intellektuelle Leistung. Das heisst, selbst ein paar Zeilen Programmcode sind geschützt, und ebenso alle abgeleiteten Werke, die den Code modifizieren oder auch nur auf seiner Kenntnis beruhen. Der Begriff des "abgeleiteten Werkes" ist weit gefasst - um Urheberrechtsverletzungen zu vermeiden sind z.B. sehr aufwendige sog. Cleanroom-Implementierungen notwendig.
Nun ist es offenkundig, dass der Löwenanteil des Programmcodes, mit dem die LLMs trainiert wurden, Open Source Code ist - und während ein kleiner Teil davon keine Beschränkungen erhebt ("public Domain"), macht Code mit permissiven Lizenzen Auflagen (z.B. Nennung der Autoren), und "Copyleft" Code verlangt, dass abgeleitete Werke die gleiche oder ggfls. eine kompatible Lizenz verwenden.
Da ein grosser Teil der Open Source Projekte diese Copyleft-Lizenzen benutzen, und fast aller im Web veröffentlichter Code Open Source ist, sind Urheberrechtsverletzungen bei Verwendung von Code aus ChatGPT, Copilot und so weiter nahezu unvermeidbar.
die Liedtexte würden quasi vom System neu erzeugt.
AFAIK: Was Quatsch ist. Das System erzeugt für Input x immer identischen Output y. Da wird nichts erzeugt. Das ist mehr so eine lossy Datenbank.
sind Urheberrechtsverletzungen bei Verwendung von Code aus ChatGPT, Copilot und so weiter nahezu unvermeidbar.
"unvermeidbar" ist hier ein recht fragwürdiges framing.
Wenn etwas verboten ist, aber du tust es trotzdem und nennst es dabei unvermeidbar, dann darf man dich fragen:
Wärst du denn gestorben, wenn du das Verbotene nicht getan hättest?
Nö wenn die Rechtsverletzung unvermeidbar ist, darf das Zeug halt nicht kommerzslisiert werden.
Aber "unvermeidbar" heißt doch nicht, dass es gut ist oder geduldet werden sollte?
Aber Urheberrechtsverletzung heißt, dass es verboten ist.
Ja, eben