Skip to content

Volltext LG München liegt vor: GEMA obsiegt gegen OpenAI (ChatGPT) im Zusammenhang mit der Verwendung und Vervielfältigung von Songtexten

LG München
Urteil vom 11.11.2025
42 O 14139/24


Wir hatten bereits in dem Beitrag LG München: GEMA obsiegt gegen OpenAI (ChatGPT) im Zusammenhang mit der Verwendung und Vervielfältigung von Songtexten über die Entscheidung berichtet.

Den Volltext der Entscheidung finden Sie hier:

LG München: GEMA obsiegt gegen OpenAI (ChatGPT) im Zusammenhang mit der Verwendung und Vervielfältigung von Songtexten

LG München
Urteil vom 11.11.2025
42 O 14139/24


Das LG München hat einer Klage der GEMA gegen OpenAI (ChatGPT) im Zusammenhang mit der Verwendung und Vervielfältigung von Songtexten überwiegend stattegegeben.

Urteil GEMA gegen Open AI
Die auf das Urheberrecht spezialisierte 42. Zivilkammer des Landgerichts München I hat mit Urteil vom heutigen Tag den von der GEMA gegen zwei Unternehmen der Unternehmensgruppe Open AI geltend gemachten Ansprüchen auf Unterlassungs-, Auskunfts- und Schadensersatz im Wesentlichen stattgegeben (Az. 42 O 14139/24).

Soweit die Klägerin darüber hinaus Ansprüche auf Grund einer Verletzung des allgemeinen Persönlichkeitsrechts wegen fehlerhafter Zuschreibung veränderter Liedtexte geltend gemacht hat, hat die Kammer die Klage abgewiesen.

Das Urteil betrifft die Liedtexte neun bekannter deutscher Urheberinnen und Urheber (darunter „Atemlos“ von Kristina Bach oder „Wie schön, dass du geboren bist“ von Rolf Zuckowski).

Die Klägerin ist eine Verwertungsgesellschaft und hat die Ansprüche als solche geltend gemacht. Zur Begründung hatte sie vorgetragen, die Liedtexte seien in den Sprachmodellen der Beklagten memorisiert und würden bei Nutzung des Chatbots auf einfache Anfragen der Nutzer als Antworten (Outputs) in weiten Teilen originalgetreu ausgegeben.

Die Beklagten sind Betreiber von Sprachmodellen und darauf basierender Chatbots. Sie hatten gegen die erhobenen Ansprüche eingewandt, ihre Sprachmodelle speicherten oder kopierten keine spezifischen Trainingsdaten, sondern reflektierten in ihren Parametern, was sie basierend auf dem gesamten Trainingsdatensatz erlernt hätten. Da die Outputs nur als Folge von Eingaben von Nutzern (Prompts) generiert werden würden, seien nicht die Beklagten, sondern der jeweilige Nutzer als Hersteller des Outputs für diese verantwortlich. Ohnehin seien eventuelle Rechtseingriffe von den Schranken des Urheberrechts, insbesondere der Schranke für das sogenannten Text- und Data-Mining gedeckt.

Nach der Entscheidung der erkennenden Kammer stehen der Klägerin die geltend gemachten Ansprüche sowohl aufgrund der gegebenen Vervielfältigung der Texte in den Sprachmodellen als auch durch ihre Wiedergabe in den Outputs zu.

Sowohl durch die Memorisierung in den Sprachmodellen als auch durch die Wiedergabe der Liedtexte in den Outputs des Chatbot lägen Eingriffe in die urheberrechtlichen Verwertungsrechte vor. Diese seien nicht durch Schrankenbestimmungen, insbesondere die Schranke für das Text und Data Mining gedeckt.

Im Einzelnen:

Nach Überzeugung der Kammer seien die streitgegenständlichen Liedtexte reproduzierbar in den Sprachmodellen 4 und 4o der Beklagten enthalten. Aus der informationstechnischen Forschung sei bekannt, dass Trainingsdaten in Sprachmodellen enthalten sein können und sich als Outputs extrahieren lassen. Dies werde als Memorisierung bezeichnet. Eine solche liege vor, wenn die Sprachmodelle beim Training dem Trainingsdatensatz nicht nur Informationen entnähmen, sondern sich in den nach dem Training spezifizierten Parametern eine vollständige Übernahme der Trainingsdaten finde. Eine solche Memorisierung sei durch einen Abgleich der Liedtexte, die in den Trainingsdaten enthalten waren, mit den Wiedergaben in den Outputs festgestellt. Angesichts der Komplexität und Länge der Liedtexte sei der Zufall als Ursache für die Wiedergabe der Liedtexte ausgeschlossen.

Durch die Memorisierung sei eine Verkörperung als Voraussetzung der urheberrechtlichen Vervielfältigung der streitgegenständlichen Liedtexte durch Daten in den spezifizierten Parametern des Modells gegeben. Die streitgegenständlichen Liedtexte seien reproduzierbar in den Modellen festgelegt. Gemäß Art. 2 InfoSoc-RL liege eine Vervielfältigung „auf jede Art und Weise und in jeder Form“ vor. Die Festlegung in bloßen Wahrscheinlichkeitswerten sei hierbei unerheblich. Neue Technologien wie Sprachmodelle wären vom Vervielfältigungsrecht nach Art. 2 InfoSoc-RL und § 16 UrhG erfasst. Nach der Rechtsprechung des Unionsgerichtshofes sei für die Vervielfältigung ausreichend eine mittelbare Wahrnehmbarkeit, die gegeben sei, wenn das Werk unter Einsatz technischer Hilfsmittel wahrgenommen werden könne.

Diese Vervielfältigung in den Modellen sei weder durch die Schrankenbestimmungen des Text und Data Mining des § 44b UrhG noch durch § 57 UrhG als unwesentliches Beiwerk gedeckt.

Zwar unterfielen Sprachmodelle grundsätzlich dem Anwendungsbereich der Text und Data Mining Schranken. Die Vorschriften deckten erforderliche Vervielfältigungen beim Zusammenstellen des Datenkorpus für das Training, wie etwa die Vervielfältigung eines Werks durch seine Überführung in ein anderes (digitales) Format oder Speicherungen im Arbeitsspeicher. Hintergrund hierfür sei der Gedanke, dass diese Vervielfältigungen lediglich zu nachfolgenden Analysezwecken erstellt würden und damit die Verwertungsinteressen des Urhebers am Werk nicht beeinträchtigten. Da diese für das Text und Data Mining rein vorbereitenden Handlungen kein Verwertungsinteresse berührten, sehe das Gesetz keine Vergütungspflicht gegenüber dem Urheber vor.

Würden beim Training – wie hier - nicht nur Informationen aus Trainingsdaten extrahiert, sondern Werke vervielfältigt, stelle dies nach Auffassung der Kammer kein Text und Data Mining dar. Die Prämisse des Text und Data Mining und der diesbezüglichen Schrankenbestimmungen, dass durch die automatisierte Auswertung von bloßen Informationen selbst keine Verwertungsinteressen berührt sind, greife in dieser Konstellation nicht. Im Gegenteil, durch die gegebenen Vervielfältigungen im Modell werde in das Verwertungsrecht der Rechteinhaber eingegriffen.

Eine andere, mutmaßlich technik- und innovationsfreundliche Auslegung, die ebenfalls Vervielfältigungen im Modell von der Schranke als gedeckt ansehen wollte, verbiete sich angesichts des klaren Wortlauts der Bestimmung. Auch eine analoge Anwendung komme nicht in Betracht. Selbst wenn man eine planwidrige Regelungslücke annehmen wollte, weil dem Gesetzgeber die Memorisierung und eine damit einhergehende dauerhafte urheberrechtlich relevante Vervielfältigung in den Modellen nicht bewusst gewesen sein sollte, mangele es an einer vergleichbaren Interessenlage. Die Schrankenregelung normiere mit der Zulässigkeit vorbereitender Vervielfältigungshandlungen beim Text und Data Mining einen Sachverhalt, bei dem die Verwertungsinteressen der Urheber nicht gefährdet seien, weil bloße Informationen extrahiert und das Werk als solches gerade nicht vervielfältigt werde. Bei Vervielfältigungen im Modell werde die Werkverwertung hingegen nachhaltig beeinträchtigt und die berechtigten Interessen der Rechteinhaber hierdurch verletzt. Die Urheber und Rechteinhaber würden durch eine analoge Anwendung der Schrankenbestimmung, die keine Vergütung für die Verwertung vorsieht, somit schutzlos gestellt. Das Risiko der Memorisierung stamme allein aus der Sphäre der Beklagten. Bei einer Analogie der Schranke würde ausschließlich der verletzte Rechteinhaber dieses Risiko tragen.

Mangels Vorliegens eines Hauptwerks stellten die Vervielfältigungen der streitgegenständlichen Liedtexte kein unzulässiges Beiwerk nach § 57 UrhG dar. Entgegen der Ansicht der Beklagten seien die Liedtexte nicht neben dem gesamten Trainingsdatensatz als nebensächlich und verzichtbar anzusehen. Hierfür wäre erforderlich, dass es sich bei dem gesamten Trainigsdatensatz ebenfalls um ein urheberrechtlich geschütztes Werk handele.

Der Eingriff der Beklagten in die Verwertungsrechte der Klägerin sei auch nicht durch eine Einwilligung der Rechteinhaber gerechtfertigt, da das Training von Modellen nicht als eine übliche und erwartbare Nutzungsart zu werten sei, mit der der Rechteinhaber rechnen müsse.

Auch durch Wiedergabe der Liedtexte in den Outputs des Chatbots hätten die Beklagten nach der Entscheidung der Kammer unberechtigt die streitgegenständlichen Liedtexte vervielfältigt und öffentlich zugänglich gemacht. In den Outputs wären die originellen Elemente der Liedtexte stets wiedererkennbar.

Hierfür seien die Beklagten und nicht die Nutzer verantwortlich. Die Outputs seien durch einfach gehaltene Prompts generiert worden. Die Beklagten betrieben die Sprachmodelle, für die die Liedtexte als Trainingsdaten ausgewählt und mit denen sie trainiert worden sind. Sie seien für die Architektur der Modelle und die Memorisierung der Trainingsdaten verantwortlich. Damit hätten die von den Beklagten betriebenen Sprachmodelle die ausgegebenen Outputs maßgeblich beeinflusst, der konkrete Inhalt der Outputs werde von den Sprachmodellen generiert.

Der Eingriff in die Verwertungsrechte durch die Outputs sei ebenfalls nicht durch eine Schrankenbestimmung gedeckt.

Das Urteil ist nicht rechtskräftig.

Zum Hintergrund:
Normen:
§§ 15, 16, 19a, 44b UrhG
Art. 2, 3 InfoSoc-RL, Art. 4 DSM-RL


OLG Schleswig-Holstein: Antrag auf Erlass einer einstweiligen Verfügung gegen Meta wegen Verwendung von Nutzerdaten als KI-Trainingsdaten mangels Dringlichkeit abgelehnt

OLG Schleswig-Holstein
Urteil vom 12.08.202
6 UKI 3/25

Das OLG Schleswig-Holstein hat den Antrag auf Erlass einer einstweiligen Verfügung gegen Meta wegen der Verwendung von Nutzerdaten als KI-Trainingsdaten mangels Dringlichkeit abgelehnt.

Die Pressemitteilung des Gerichts:
Eilantrag einer niederländischen Verbraucherschutzstiftung gegen Meta auf Untersagung der Nutzung bestimmter Kundendaten scheitert an fehlender Dringlichkeit

Der 6. Zivilsenat des Schleswig-Holsteinischen Oberlandesgerichts hat mit Urteil vom heutigen Tag den Antrag einer niederländischen Verbraucherschutzstiftung gegen Meta Platforms Ireland Limited (Meta) auf Untersagung der Nutzung bestimmter Kundendaten von Facebook und Instagram für KI-Lernzwecke wegen fehlender Dringlichkeit zurückgewiesen.

Meta hatte am 27.05.2025 nach Vorankündigung begonnen, bestimmte Nutzerdaten der Dienste Facebook und Instagram für KI-Trainingszwecke ohne Einverständnis der Profilinhaber zu nutzen. Meta berief sich dafür auf ein berechtigtes Interesse an der Entwicklung und Verbesserung ihrer KI-Technologien für die Plattformen und den KI-Dienst Llama. Der Datenschutz sei gewährleistet. Es würden nur bestimmte Daten von öffentlichen Profilen volljähriger Kunden genutzt und die Daten würden für das KI-Training de-identifiziert und tokenisiert. Ein Antrag der Verbraucherzentrale Nordrhein-Westfalen auf einstweilige Untersagung dieser Nutzung war vor dem Oberlandesgericht Köln (Urteil vom 23.05.2025; Az. I-15 UKl 2/25) gescheitert.

Die niederländische Verbraucherschutzstiftung Stichtung Onderzoek Marktinformatie (SOMI) hatte am 27.06.2025 vor dem Schleswig-Holsteinischen Oberlandesgericht einen Antrag auf einstweilige Untersagung der Nutzung gegen Meta eingereicht. Die tatsächliche Nutzung der Daten ohne Einverständnis der Nutzer habe nun begonnen, und die Interessen und Grundrechte der Verbraucher seien höher zu bewerten als das Interesse von Meta.

Der Senat hat den Antrag nach mündlicher Verhandlung und Anhörung des Hamburgischen Beauftragen für Datenschutz und Informationsfreiheit zurückgewiesen. Die Angelegenheit sei nicht eilbedürftig und rechtfertige daher nicht den Erlass eines einstweiligen Nutzungsverbotes. SOMI muss etwaige Ansprüche mit einer Hauptsacheklage verfolgen. Der Senat weist in seiner Entscheidung darauf hin, dass Meta bereits im Jahr 2024 gegenüber der Öffentlichkeit und dann insbesondere per E-Mails im April 2025 konkret gegenüber den Nutzern - und damit auch der SOMI - bekannt gegeben habe, die Daten entsprechend nutzen zu wollen. Während es der Verbraucherzentrale Nordrhein-Westfalen (in dem Verfahren vor dem OLG Köln) möglich gewesen sei, aufgrund der Ankündigungen zügig im Mai 2025 noch vor Beginn der Datennutzung gegen Meta vorzugehen, habe SOMI mit der Beantragung bis zum 27.06.2025 gewartet. Zu diesem Zeitpunkt habe Meta die Kundendaten bereits einen Monat lang genutzt.

Durch das lange Abwarten vor der Inanspruchnahme gerichtlichen Rechtsschutzes stehe fest, dass die Angelegenheit aus Sicht von SOMI nicht derart eilbedürftig sei, dass es der Regelung durch eine einstweilige Verfügung bedürfe. Die behaupteten Datenschutzverstöße durch das Verhalten von Meta seien spätestens seit April 2025 erkennbar gewesen. Meta habe auch nicht etwa Dinge angekündigt, die sich dann bei Beginn der Datenverarbeitung anders dargestellt hätten. So sei bereits seit einer Pressemitteilung vom 14.04.2025 erkennbar gewesen, dass die Datensätze aus Beiträgen, Kommentaren und Bildern von öffentlichen Profilen volljähriger Nutzer auch personenbezogene Daten von Kindern und nichtregistrierten Dritten enthalten könnten. Diese wüssten im Zweifel nichts von der Nutzung und könnten demnach auch nicht widersprechen. Zudem könnten sie ihre Daten nicht im Trainingsdatensatz oder innerhalb der Daten des KI-Modells selbst identifizieren, um eine unzulässige Datenverarbeitung zu beanstanden. Gleiches gelte für besonders geschützte personenbezogene Daten im Sinne von Art. 9 Datenschutzgrundverordnung (DSGVO). Solche Daten können etwa Angaben zur ethnischen oder rassischen Herkunft, sexuellen Orientierung oder politischen Meinungen enthalten. Sofern die Betroffenen ihre Daten nicht selbst öffentlich gemacht haben, ist eine Verarbeitung dieser Daten in der Regel untersagt. Nach eigener Aussage von Meta sei - so der Senat - nicht ausgeschlossen, dass solche Daten ohne Einverständnis der Betroffenen verarbeitet und von KI-Modellen ausgegeben würden. Die Möglichkeit der unzulässigen Nutzung von Verbraucherdaten sei SOMI spätestens durch eine E-Mail von Meta vom 19.04.2025 bekannt gewesen. Ein einstweiliges Verbot habe also zügig vor Beginn der Datenverarbeitung beantragt werden können.


Volltext OLG Köln liegt vor: Meta darf Daten aus öffentlichen Profilen bei Facebook und Instagram für das KI-Training verwenden - kein Verstoß gegen DSGVO und DMA

OLG Köln
Urteil vom 23.05.2025
15 UKl 2/25


Wir hatten bereits in dem Beitrag OLG Köln: Meta darf Daten aus öffentlichen Profilen bei Facebook und Instagram für das KI-Training verwenden - kein Verstoß gegen DSGVO und DMA über die Entscheidung berichtet.

Aus den Entscheidungsgründen:
Es besteht bereits kein Verfügungsanspruch. Auf Grundlage der im einstweiligen Verfügungsverfahren gebotenen (OLG Köln, Beschluss vom 5. Juli 2024 – I-5 W 33/24 –, juris, Rn. 29; OLG Hamm, Beschluss vom 11. Dezember 2024 – I-30 U 40/24 –, juris, Rn. 95; OLG Koblenz, Urteil vom 12. September 2007 – 1 U 223/07 –, juris, Rn. 14) summarischen Prüfung vermag der Senat keinen Unterlassungsanspruch aus § 2 UKlaG im Hinblick auf die – nach Klarstellung des Antrags durch den Verfügungskläger allein verfahrensgegenständlichen – First Party Data festzustellen.

a) Die Verfügungsbeklagte verstößt durch die Einbringung von Daten aus dem Social Media-Angebot Facebook und dem Social Media-Angebot Instagram in einen einheitlichen Datensatz zum Training ihrer KI nicht gegen ihre Pflichten aus Art. 5 Abs. 2 UAbs. 1 lit b) DMA, da sie diese Daten hierdurch nicht im Rechtssinne „zusammenführt“.

aa) Die Verfügungsbeklagte ist unstreitig ein „Torwächter“ im Sinne des Art. 5 Abs. 2 i.V.m. Art. 1 Ziffer 1 DMA. Sowohl bei dem Social Media-Angebot Facebook als auch bei dem Social Media-Angebot Instagram handelt es sich unstreitig um zentrale Plattformdienste der Verfügungsbeklagten.

bb) Nach Art. 5 Abs. 2 UAbs. 1 lit b) DMA darf ein Torwächter personenbezogene Daten aus dem betreffenden zentralen Plattformdienst nicht mit personenbezogenen Daten aus weiteren zentralen Plattformdiensten oder aus anderen vom Torwächter bereitgestellten Diensten oder mit personenbezogenen Daten aus Diensten Dritter zusammenführen. Damit wird ein Verbot jeglicher Zusammenführung statuiert (Podszun, in: Podszun, DMA, 2023, § 5 Rn. 17; Louven, in: Gersdorf/Paal, BeckOK Informations- und Medienrecht, 01.08.2023, Art. 5 Rn. 23).

Der Begriff der „Zusammenführung“ ist im DMA (und auch in der DSGVO) nicht legal definiert (vgl. Hornkohl in: Jaeger u.a., FK Kartellrecht, 2/2025, Art. 5 EUV 2022/1925 Rn. 96). Der Senat, der im Eilverfahren weder die Möglichkeit der Einholung einer Stellungnahme der Kommission (Art. 39 Abs. 1 DMA) noch der Vorlage an den Europäischen Gerichtshof hatte, geht davon aus, dass die von der Verfügungsbeklagten angekündigte Einbringung von teilweise deidentifizierten und zerlegten Daten aus zwei zentralen Plattformdiensten in einen unstrukturierten Trainingsdatensatz für eine KI keine Zusammenführung im Sinne des Art. 5 Abs. 2 UAbs. 1 lit b) DMA ist. Es fehlt an der gezielten Verknüpfung von personenbezogenen Daten eines Nutzers aus einem zentralen Plattformdienst mit personenbezogenen Daten desselben Nutzers aus dem anderen zentralen Plattformdienst. Auf Art. 5 Abs. 2 UAbs. 1 lit c) DMA hat sich der Verfügungskläger nicht berufen.

Der Senat verkennt nicht, dass im deutschen Schrifttum teilweise vertreten wird (Hacker, GRUR 2022, 1278, 1279; Wielsch, in: Mast u.a., DSA, DMA, 2024, Art. 5 Abs. 2 DMA Rn. 60), dass die die Verbindung von Datensätzen aus Plattformdiensten zum verbesserten Training von KI eine „Zusammenführung“ im genannten Sinne darstellen soll. Hierfür spricht, dass der spezifische Nutzen der besonderen Möglichkeit, Daten zu aggregieren und damit „Verbundvorteile“ (Becker in: Jaeger u.a., FK Kartellrecht, 2/2025, Art. 5 EUV 2022/1925 Rn. 94; zu Verbundvorteilen bei der KI-Anwendungen, vgl. KönigBorges/Keil, Rechtshandbuch Big Data, 2024, Rn. 9) zu erzielen, bei einer solchen Datennutzung thematisiert ist. Die Ausnutzung solcher Vorteile soll von Art. 5 Abs. 2 DMA verhindert werden (vgl. Erwägungsgrund 36 zum DMA).

Dennoch sprechen aus Sicht des Senats überwiegende Gründe gegen die Annahme, dass eine bloße Einbringung von teilweise deidentifizierten und zerlegten Daten aus zwei Plattformdiensten in einen KI-Trainingsdatensatz bereits als Zusammenführung im Rechtssinne gewertet werden kann. Die bloße Einschlägigkeit des Schutzzwecks bedeutet noch nicht, dass der Fall von der Norm auch erfasst wird. Insbesondere enthält Art. 5 DMA gerade keine Generalklausel, sondern eine „erschöpfende Enumeration“ (Hornkohl in: Jaeger u.a., FK Kartellrecht, 2/2025, Art. 5 EUV 2022/1925 Rn. 13) von Tatbeständen, um die Durchsetzung der Regelungen zu erleichtern und die Rechtssicherheit zu erhöhen (aaO, Rn. 13). Insoweit kommt es darauf an, ob gerade der hier zu entscheidende Fall durch Art. 5 Abs. 2 UAbs. 1 lit b) DMA normiert ist.

Erforderlich ist insoweit eine gezielte Verbindung von Daten gerade derselben Person (so auch: Hornkohl in: Jaeger u.a., FK Kartellrecht, 2/2025, Art. 5 EUV 2022/1925 Rn. 96). Unbehelflich mag insoweit noch ein Abgleich mit der englischen Sprachfassung des Art. 5 Abs. 2 UAbs. 1 lit b) DMA sein. Soweit dort von „combining“ die Rede ist, kann hierunter sowohl ein bloßes Zusammenfassen von personenbezogenen Daten aus zwei zentralen Plattformdiensten in einem Datensatz als auch eine gezielte „Kombination“ gerade von Daten ein- und derselben Person gefasst werden. Auch der insoweit maßgebliche Erwägungsgrund 36 der DMA gibt keine Hinweise. Insbesondere ist dem Erwägungsgrund ein spezifischer Zweck, die Verbindung von Daten im Rahmen des Trainings von KI-Systemen einzuschränken, nicht zu entnehmen. Es ist, worauf die Verfügungsbeklagte in der mündlichen Verhandlung mit Recht hingewiesen hat, nicht ersichtlich, dass dem Gesetzgeber bei Schaffung des Art. 5 Abs. 2 DMA die spezifischen Fragen im Zusammenhang mit Datenverarbeitungen zum Zwecke der Entwicklung und Verbesserung von Systemen künstlicher Intelligenz vor Augen gestanden haben. Mit der vom Senat vertretenen Auslegung der Vorschrift steht es ferner in Einklang, dass in einer Entscheidung der Kommission vom 23. April 2025 (C(2025) 2091) ausdrücklich darauf verwiesen wird, dass das Zusammenführen Daten derselben Person betrifft. Dort heißt es:

Die Entscheidung enthält an dieser Stelle ein Bild oder eine Grafik.

Wenngleich sich aus dieser Entscheidung, die dem Senat durch die Verfügungsbeklagte aufgrund einer vor Veröffentlichung durch die Kommission bestehenden Vertraulichkeit nicht vollständig vorgelegt werden konnte, keine Hinweise – in die eine oder andere Richtung – ergeben, ob diese Begriffsbestimmung abschließend zu verstehen ist, sprechen für ein solches Verständnis im Sinne eines Schutzes vor der Erstellung von Nutzerprofilen die besseren Gründe. Aus der Gesetzeshistorie folgt, dass Art. 5 Abs. 2 UAbs. 1 lit a) und b) DMA insbesondere die in dem Facebook-Verfahren des Bundeskartellamtes (vgl. hierzu die erst nach Erlass der DMA ergangene Entscheidung des Europäischen Gerichtshofs vom 4. Juli 2023 (Az. C-252/21)) zugrundeliegende Konstellation einer plattformübergreifenden „Personalisierung mittels Datenzusammenführung“ zugrunde liegt (Bueren/Weck, in: Münchener Kommentar zum Wettbewerbsrecht, 2023, Art. 5 DMA Rn. 59 und 80; Louven, in: Gersdorf/Paal, BeckOK Informations- und Medienrecht, 01.08.2023, Art. 5 Rn. 17; Hornkohl in: Jaeger u.a., FK Kartellrecht, 2/2025, Art. 5 EUV 2022/1925 Rn. 72). Dies spricht dafür, dass ein „Zusammenführen“ von Daten allein im Fall ihrer Verbindung im Rahmen von Nutzerprofilen, nicht aber bei ihrer – wie hier – nicht näher zugeordneten und sogar deidentifizierten Einbringung in ein einheitliches „Datensilo“ anzunehmen ist. Nur bei dem erstgenannten Verständnis erklärt sich auch die Möglichkeit der betroffenen Nutzer, in eine Zusammenführung einzuwilligen (vgl. auch Göhsl/Zimmer, in: Immenga/Mestmäcker, Wettbewerbsrecht, 2025, Art. 5 DMA Rn. 31). Nach Art. 5 Abs. 2 DMA ist die Zusammenführung der Daten rechtmäßig, wenn „dem Endnutzer“ die spezifische Wahl gegeben wurde und „er“ eingewilligt hat. Die Vorschrift geht also davon aus, dass ein Endnutzer in die Zusammenführung von Daten aus mehreren Quellen einwilligt und die Zusammenführung dann rechtmäßig ist. Auch daran zeigt sich, dass die Vorschrift auf den Fall der gezielten Verknüpfung von Daten ein und desselben Nutzers zugeschnitten ist.

b) Der Senat vermag ferner nicht festzustellen, dass die von der Verfügungsbeklagten beabsichtigte und von dem Verfügungskläger angegriffene Verarbeitung personenbezogener Daten nicht rechtmäßig (Art. 5 Abs. 1 lit a) DSGVO) wäre und damit Datenschutzrecht verletzen würde.

aa) Die datenschutzrechtlichen Anforderungen werden durch die – zwar in Kraft getretene, aber ohnehin noch nicht vollständig anwendbare (vgl. Art. 113 der Verordnung) – Verordnung (EU) 2024/1689 des Europäischen Parlaments und des Rates vom 13. Juni 2024 zur Festlegung harmonisierter Vorschriften für künstliche Intelligenz und zur Änderung der Verordnungen (EG) Nr. 300/2008, (EU) Nr. 167/2013, (EU) Nr. 168/2013, (EU) 2018/858, (EU) 2018/1139 und (EU) 2019/2144 sowie der Richtlinien 2014/90/EU, (EU) 2016/797 und (EU) 2020/1828 (Verordnung über künstliche Intelligenz; im Folgenden: KI-VO) nicht verdrängt. Nach deren Art. 2 Abs. 7 S. 2 berührt die KI-VO die DSGVO grundsätzlich nicht (vgl. im Einzelnen etwa Schwartmann/Keber/Köhler in: Schwartmann u.a., DSGVO, 2024, Anhang 3 Rn. 37 ff.; Schwartmann/Köhler, in: Schwartmann u.a., KI-VO - Leitfaden, 2024, 2. Teil, 3. Kapitel Rn. 3; Golland, EuZW 2024, 846, 853).

Gleiches gilt für eine etwaige Verdrängung der DSGVO durch Art. 5 Abs. 2 DMA. Dieser verdrängt die Regelungen aus der DSGVO nicht, beide Regelungsmaterien gelten parallel (Hornkohl in: Jaeger u.a., FK Kartellrecht, 2/2025, Art. 5 EUV 2022/1925, Rn. 86; Podszun in: Podszun, DMA, Art. 5 Abs. 2 Rn. 31.).

bb) Die Verfügungsbeklagte beabsichtigt im Rahmen des Trainings der von ihr entwickelten KI Nutzerdaten und damit – was sie selbst auch nicht in Abrede stellt – personenbezogene Daten im Sinne des Art. 4 Nr. 1 DSGVO zu nutzen. Insoweit verarbeitet die Verfügungsbeklagte als Verantwortliche im Sinne des Art. 4 Nr. 7 DSGVO personenbezogene Daten (mit gleichem Ergebnis für eine solche Konstellation auch: Schaffland/Holthaus in: Schaffland/Wiltfang, DSGVO, 2025, Art. 4 EUV 2016/679, Rn. 54a; Golland, EuZW 2024, 846, 847; Hüger, ZfDR 2024, 263, 267; Dieker, ZD 2024, 132, 133; Landesbeauftragte BW, Diskussionspapier: Rechtsgrundlagen im Datenschutz beim Einsatz von Künstlicher Intelligenz, 17. Oktober 2024, S. 10 ff.).

cc) Die von der Verfügungsbeklagten beabsichtigte Datenverarbeitung ist bei summarischer Prüfung allerdings rechtmäßig, da sie sich, was entscheidend ist, da andere Rechtsgrundlagen nicht ersichtlich sind, auf den Rechtfertigungsgrund des Art. 6 Abs. 1 S. 1 lit f) DSGVO stützen kann.

aaa) Speziellere, Art. 6 Abs. 1 S. 1 lit f) DSGVO verdrängende Rechtsgrundlagen zum Training von KI mittels Nutzerdaten ergeben sich insbesondere nicht aus der KI-VO (vgl. insoweit Erwägungsgrund 63, S. 3 zur KI-VO; hierzu auch: Schwartmann/Mühlenbeck/Pieper in: Schwartmann u.a., DSGVO, 2024, Art. 6 EUV 2016/679, Rn. 288; Schaffland/Holthaus in: Schaffland/Wiltfang, DSGVO, 2025, Art. 6 EUV 2016/679, Rn. 119a). Auch aus der DSGVO ergeben sich keine vorrangigen Rechtsgrundlagen. Soweit in der Literatur gelegentlich Art. 6 Abs. 4 DSGVO für Datenverarbeitungen im Bereich der KI-Trainings herangezogen wird (vgl. die – kritische – Darstellung - bei Schwartmann/Mühlenbeck/Pieper in: Schwartmann u.a., DSGVO, 2024, Art. 6 EUV 2016/679, Rn. 307 und Schulz, in: Gola/Heckmann, Datenschutz-Grundverordnung – Bundesdatenschutzgesetz, 2022, Art. 6 Rn. 152), hat sich die Verfügungsbeklagte hierauf bereits nicht berufen. Art. 6 Abs. 4 DSGVO bietet richtigerweise zudem bereits keinen eigenen Erlaubnistatbestand (so wohl: EuGH, Urteil vom 21. Dezember 2023 - C-667/21 – juris, Rn. 75; aus der Literatur vgl. Schwartmann/Mühlenbeck/Pieper in: Schwartmann u.a., DSGVO, 2024, Art. 6 EUV 2016/679, Rn. 239 mit Nachweisen zur Gegenauffassung; Heberlein, in: Ehmann/Selmayr, DSGVO, 2024, Art. 6 Rn. 69; Albers/Veit, in: Wolff/Brink/v. Ungern-Sternberg, BeckOK, Datenschutzrecht, 01.02.2025, Art. 6 Rn. 107 f.).

bbb) Bei einer summarischen Prüfung ist die streitgegenständliche Datenverarbeitung zur Wahrung der berechtigten Interessen der Verfügungsbeklagten erforderlich und überwiegen die Interessen oder Grundrechte und Grundfreiheiten der betroffenen Personen, die den Schutz personenbezogener Daten erfordern, nicht.

Aus der Rechtsprechung des Europäischen Gerichtshofs (vgl. etwa EuGH, Urteil vom 4.- Juli 2023 – C-252/21 – Rn. 106) ergibt sich folgende Prüfungstrias: Erstens muss von dem für die Verarbeitung Verantwortlichen oder von einem Dritten ein berechtigtes Interesse wahrgenommen werden, zweitens muss die Verarbeitung der personenbezogenen Daten zur Verwirklichung des berechtigten Interesses erforderlich sein und drittens dürfen die Interessen oder Grundrechte und Grundfreiheiten der Person, deren Daten geschützt werden sollen, gegenüber dem berechtigten Interesse des Verantwortlichen oder eines Dritten nicht überwiegen.

Auf dieser Grundlage vermag der Senat auf Basis einer summarischen Prüfung nicht festzustellen, dass Art. 6 Abs. 1 S. 1 lit f) DSGVO die von der Verfügungsbeklagten beabsichtigte Datenverarbeitung nicht zu rechtfertigen vermag.

ccc) Die Verfügungsbeklagte verfolgt mit dem Training einer von ihr entwickelten KI mit den von ihren Nutzern in deren Nutzerkonten veröffentlichen Daten ein berechtigtes Interesse.

(1.) Als berechtigte Interessen kommen neben rechtlichen und ideellen insbesondere auch wirtschaftliche Belange in Betracht (EuGH, Urteil vom 4. Oktober 2024 – C-621/22 –, juris, Rn. 47; Hüger, ZfdR 2024, 263, 272). In seiner Stellungnahme vom 17. Dezember 2024 hat der Ausschuss Art. 6 Abs. 1 S. 1 lit f) DSGVO auf dieser Basis als taugliche Grundlage angesehen, KI-Modell mit Datensätzen, die personenbezogene Daten enthalten, zu trainieren und hat das entsprechende Interesse damit als berechtigt angesehen. Diese Auffassung hat der Hamburgische Beauftragte für Datenschutz und Informationsfreiheit in der mündlichen Verhandlung am 22. Mai 2025 geteilt (entsprechend der ganz h.M. so etwa auch: Landesbeauftragte BW, Diskussionspapier: Rechtsgrundlagen im Datenschutz beim Einsatz von Künstlicher Intelligenz, 17. Oktober 2024, S. 21: „regelmäßig anzunehmen“; Schaffland/Holthaus in: Schaffland/Wiltfang, DSGVO, 2025, Art. 6 EUV 2016/679, Rn. 119a; Keber, in: Schwartmann u.a., KI-VO - Leitfaden, 2024, 2. Teil, Kapitel 3 Rn. 28; Golland, EuZW 2024, 846, 849; Dieker, ZD 2024, 132, 134).

(2.) Erforderlich ist weiter, dass das Interesse hinreichend klar und präzise formuliert und real und gegenwärtig und nicht bloß spekulativ ist (EuGH, Urteil vom 4. Oktober 2024 – C-621/22 –, juris, Rn. 49).

Diese Voraussetzungen sind auf Basis einer summarischen Prüfung erfüllt.

Die Verfügungsbeklagte hat beschrieben, die Möglichkeiten generativer KI nutzen zu wollen, um einen Gesprächsassistenten bereitzustellen, der etwa Antworten in Echtzeit für Chats, Hilfe bei der Organisation und Planung etwa eines Urlaubs bis hin zu Hilfen bei der Formulierung von Texten bietet. Hierzu soll die KI an regionale Gepflogenheiten angepasst werden. Zudem sollen Inhalte wie etwa Texte, Bilder und Audios erstellt werden können. Da die Verfügungsbeklagte mit dem entsprechenden Training zeitlich unmittelbar beginnen möchte, ist das entsprechend konkret beschriebene Interesse auch gegenwärtig und nicht bloß spekulativ.

(3.) Damit die Wahrnehmung dieses Interesses eine Verarbeitung personenbezogener Daten gemäß Art. 6 Abs. 1 Unterabs. 1 Buchst. f DSGVO rechtfertigen kann, ist ferner ist erforderlich, dass die Verfügungsbeklagte allen anderen, ihr obliegenden Pflichten aus der DSGVO nachkommt (EuGH, Urteil vom 4. Oktober 2024 – C-621/22 –, juris, Rn. 50).

Auf solche weiteren datenschutzrechtlichen Anforderungen, die im Rahmen des Trainings von KI-Modellen zu beachten sind (etwa: Grundsatz der Datenrichtigkeit, Art. 5 Abs. 1 lit d) DSGVO; Grundsatz der Zweckbindung, Art. 5 Abs. 1 lit b) DSGVO; Transparenzgrundsatz, Art. 5 Abs. 1 lit a) Var. 3 DSGVO und Art. 12 ff. DSGVO; vgl. Paal, ZfDR 2024, 129, 141 ff.), beziehen sich die Angriffe des Verfügungsklägers nicht im Schwerpunkt. Oftmals erscheint eine Beachtung auch noch im Rahmen des Betriebs der KI möglich. Unabhängig von einer Anwendbarkeit des Art. 14 Abs. 5 lit b) DSGVO ist den Transparenzerfordernissen (Art. 12 ff. DSGVO) durch die von der Verfügungsbeklagten umfangreich zur Verfügung gestellten Informationen (Anlage AG 8, 22 bis 29) Rechnung getragen. Ferner kommt es nicht darauf an, ob die Verfügungsbeklagte gegen eine – in Art. 83 Abs. 4 lit a) DSGVO allerdings bußgeldbewehrte – Pflicht zur Einholung einer Datenschutz-Folgenabschätzung nach Art. 35 DSGVO verstoßen hat. Diese ist – wie sich aus ihrer Stellung in Kapitel IV der DSGVO ergibt, dessen Anforderungen der Europäische Gerichthof nicht als Rechtmäßigkeitsvoraussetzungen der Datenschutzverordnung erachtet (EuGH, Urteil vom 4. Mai 2023 – C-60/22 -, juris, Rn. 62; Hansen, in: Wolff/Brink/v. Ungern-Sternberg, BeckOK Datenschutzrecht, 01.02.2024, Art. 35 Rn. 76a) – keine Rechtmäßigkeitsvoraussetzung der Datenverarbeitung (BSG, Urteil vom 20. Januar 2021 – B 1 KR 7/20 R –, juris, Rn. 84 mwN.; Karg, in: Simitis/Hornung/Spiecker gen. Döhmann, Datenschutzrecht, 2025, Art. 35 Rn. 104; Nolte/Werkmeister, in: Gola/Heckmann, Datenschutz-Grundverordnung – Bundesdatenschutzgesetz, 2022, Art. 35 Rn. 74).

ddd) Die entsprechende Datenverarbeitung erweist sich bei einer summarischen Prüfung auch – unter gemeinsamer Prüfung mit dem Grundsatz der Datenminimierung nach Art. 5 Absatz 1 lit c) DSGVO (vgl. hierzu EuGH Urteil vom 4. Juli 2023 – C-252/21 -, juris, Rn. 109; EuGH, Urt. v. 9.1.2025 - Rs. C-394/23, Rn. 48f.) – als erforderlich.

Mit dieser Ansicht steht der Senat im Wesentlichen im Einklang mit der in der mündlichen Verhandlung am 22. Mai 2025 geschilderten Auffassung des Hamburgischen Beauftragten für Datenschutz und Informationsfreiheit, der eine Erforderlichkeit im Grundsatz anerkannte und lediglich Zweifel hinsichtlich der Verwendung besonders eingriffsintensiver Daten äußerte (etwa Nummernschilder von Fahrzeugen, Kreditkartennummern).

Eine Datenverarbeitung ist erforderlich, wenn sie zur Erreichung des Interesses des Verarbeiters geeignet ist und es keine weniger in die Privatsphäre eingreifende Möglichkeit gibt, den entsprechenden Zweck zu erreichen (EuGH, Urteil vom 4. Juli 2023 – C-252/21 -, juris, Rn. 108).

Hierfür ist – worauf der Verfügungskläger mit Recht hinweist – die Verfügungsbeklagte beweisbelastet (EuGH, Urteil vom 11. Juli 2024 - C-757/22 -, Rn. 52; OLG Stuttgart, Urteil vom 22. November 2023 - 4 U 20/23 -, juris, Rn. 182 ff). Die entsprechenden Verfahrensvorschriften ergeben sich mangels konkreter Regelungen im europäischen Recht aus dem nationalen Recht. § 5 UKlaG verweist insoweit auf die Zivilprozessordnung. Für die im Verfahren des einstweiligen Rechtsschutzes erforderliche Glaubhaftmachung besteht insoweit eine Abweichung vom Regelbeweismaß der vollen Überzeugung von der Wahrheit einer Tatsache. Es genügt, wenn ihr Vorliegen überwiegend wahrscheinlich ist, d.h., dass etwas mehr für das Vorliegen der Tatsache spricht als gegen sie (Kessen, in: Kessen/Tholen, KK-Vorläufiger Rechtsschutz, § 920 Rn. 19; Kessen, aaO., § 935 Rn. 9). Ob das Beweismaß erreicht ist, beurteilt das Gericht in freier Würdigung (Kessen, in: Kessen/Tholen, KK-Vorläufiger Rechtsschutz, § 920 Rn. 21; Kessen, aaO., § 935 Rn. 9).

Nach diesen Maßstäben hat der Senat keine Zweifel, dass das Training der von der Verfügungsbeklagten entwickelten KI mit den Nutzerdaten geeignet ist, die aufgezeigten, mit ihm verfolgten Zwecke zu erreichen, d.h. eine generative KI optimiert an regionale Gepflogenheiten anzubieten und in die Dienste der Verfügungsbeklagten zu implementieren.

Im Hinblick auf weniger in die Privatsphäre eingreifende – aber gleich geeignete – Möglichkeiten der Zielerreichung hat zwar der Verfügungskläger entsprechend der Stellungnahme vom 17. Dezember 2024 des Ausschusses (Rn. 75; ähnlich auch: Landesbeauftragte BW, Diskussionspapier: Rechtsgrundlagen im Datenschutz beim Einsatz von Künstlicher Intelligenz, 17. Oktober 2024, S. 22) auf die Möglichkeit des Trainings mittels anonymisierter oder sog. synthetischer Daten hingewiesen. Zudem hat der Verfügungskläger vorgetragen, die Verfügungsbeklagte könne das Training der KI auf sog. Flywheel-Daten beschränken. Ferner hat er vorgetragen, die Erforderlichkeit müsse hinsichtlich jedes einzelnen Datenpunktes gegeben sein. Angesichts der Vielzahl der für das Training der KI erhobenen Daten sei nicht dargetan, dass jeder einzelne Datenpunkt erforderlich sei.

Dennoch erscheint dem Senat der mittels eidesstattlicher Verfügung glaubhaft gemachte Vortrag der Verfügungsbeklagten, dass es

„keine andere sinnvolle Alternative für Meta [gibt], um seine Interessen ebenso wirksam mit anderen, milderen Mittel zu verfolgen und zu erreichen. Meta hat zur Zielerreichung verfügbare Alternativen geprüft [im übersetzten Original: „considered available alternative ways], die eine weniger intensive Nutzung personenbezogener Daten ermöglichen würden“

als überwiegend wahrscheinlich. Die Notwendigkeit des Trainings großer generativer KI-Modelle mit „riesigen Mengen an Text, Bildern, Videos und anderen Daten“ ist im Erwägungsgrund 105 der KI-VO ausdrücklich anerkannt (vgl. zu dem erforderlichen Einsatz von Massendaten aus dem juristischen Schrifttum etwa Paal, ZfDR 2024, 129, 141). Der Vortrag der Verfügungsbeklagten wird im Hinblick auf eine fehlende Möglichkeit zur Anonymisierung durch Stellungnahmen im juristischen Schrifttum bestätigt, die eine solche für unpraktikabel halten (vgl. Paal, ZfDR 2024, 129, 136; Dieker, ZD 2024, 132, 134; Schürmann ZD 2022, 316, 317). Im Hinblick auf den bloßen Einsatz von sog. Flywheel-Daten ist es kaum plausibel, dass die so zu erzielende, deutlich geringere Menge an Daten im Vergleich zu dem vorhandenen Datenbestand aus aktiven Nutzerkonten zu vergleichbaren Ergebnissen beim Training der KI führt. Das insoweit ein „minderwertiges Produkt“ entstehen würde, hat die Verfügungsbeklagte mit eidesstattlicher Versicherung des Direktors GenAI Produkt Management bei Meta Platforms Inc, U. R., vom 18. Mai 2025 (Anlage AG 42) ebenso glaubhaft gemacht, wie die fehlende Gleichwertigkeit des Rückgriffs auf synthetische Daten (eidesstattliche Versicherung vom 21. Mai 2025, Anlage AG 45). Dem ist der Verfügungskläger nicht substantiiert entgegengetreten. Eine Pflicht, die Erforderlichkeit bezüglich jedes Datenpunktes zu belegen, trifft die Verfügungsbeklagte nicht. Das Training einer KI erfordert die Verwendung von Massen von Daten zur Generierung von Mustern und Wahrscheinlichkeitsparametern (Schwartmann/Köhler, in: Schwartmann u.a., KI-VO - Leitfaden, 2024, 2. Teil Kapitel 3 Rn. 9). Insoweit kommt dem einzelnen Datum im Zweifel kaum je ein messbarer Einfluss zu (vgl. insoweit Paal, ZfDR 2024, 129, 141: „Prüfung der Erforderlichkeit für jedes einzelne Datum weder zielführend noch praktikabel“). Der Senat geht – wie dargelegt – in Übereinstimmung mit dem Ausschuss und der ganz h.M. davon aus, dass Art. 6 Abs. 1 S. 1 lit f) DSGVO ein tauglicher Rechtfertigungsgrund für Datenverarbeitung zum Training von KI sein kann. Unmöglich zu erfüllende Anforderungen würden diese Annahme konterkarieren und dürfen nicht aufgestellt werden. Zwar werden in der Literatur teilweise Möglichkeiten diskutiert, die die Diskrepanz zwischen dem „Datenhunger“ des KI-Trainings und dem Grundsatz der Datenminimierung auflösen (vgl. insoweit Paal, ZfDR 2024, 129, 141 mwN). Im Rahmen der im Eilrechtsschutz zur Verfügung stehenden Erkenntnismöglichkeiten sieht der Senat aber keine hinreichend verlässlichen Alternativen. Soweit erwogen werden kann, den Grundsatz der Erforderlichkeit auf die Art der verarbeiteten Daten zu beziehen, also die Verarbeitung personenbezogener Daten möglichst zu meiden (vgl. Hüger, ZfDR 2024, 263, 273), hat die Verfügungsbeklagte glaubhaft gemacht, auf Methoden der Deidentifizierung der in den Trainingsdatensatz eingestellten Daten zurückzugreifen. Damit wird auch den geschilderten Bedenken des Hamburgischen Beauftragten für Datenschutz und Informationsfreiheit Rechnung getragen. Soweit in der Literatur die häufig durchgeführte Form der Datensammlung durch Web-Scraping und Crawling als die „effektivste“ Form (Dieker, ZD 2024, 132,134) der Datensammlung angesehen wird, kommt es hierauf nicht an: Diese wäre mit deutlich erheblicheren Eingriffen in die Rechte der Betroffenen verbunden, da die von der Verfügungsbeklagten implementierten Abschwächungsmaßnahmen insoweit nicht greifen würden. Zudem beabsichtigt die Verfügungsbeklagte gerade ein Training mit „regionalen“ Daten, sodass diese Art der Datengewinnung nicht gleich geeignet wäre.


"Volltext OLG Köln liegt vor: Meta darf Daten aus öffentlichen Profilen bei Facebook und Instagram für das KI-Training verwenden - kein Verstoß gegen DSGVO und DMA" vollständig lesen

OLG Köln: Meta darf Daten aus öffentlichen Profilen bei Facebook und Instagram für das KI-Training verwenden - kein Verstoß gegen DSGVO und DMA

OLG Köln
Urteil vom 23.05.2025
15 UKl 2/25


Das OLG Köln hat im Rahmen eines einstweiligen Verfügungsverfahrens entschieden, dass Meta Daten aus öffentlichen Profilen bei Facebook und Instagram für das KI-Training verwenden darf. Das Gericht sah insbesondere keinenn Verstoß gegen die Vorgaben der DSGVO und des DMA.

Die Pressemitteilung des Gerichts:
Meta darf Daten aus öffentlich gestellten Nutzerprofilen für KI-Training verwenden

Der 15. Zivilsenat des Oberlandesgerichts Köln hat heute (23.05.2025) in einem Eilverfahren einen Antrag der Verbraucherzentrale NRW e.V. gegen den Mutterkonzern von "Facebook" und "Instagram" abgelehnt, mit dem eine Verarbeitung öffentlich gestellter Nutzerdaten ab der kommenden Woche verhindert werden sollte.

Im April 2025 kündigte die Meta Platforms Ireland Limited (nachfolgend: Meta) öffentlich an, ab dem 27.05.2025 personenbezogene Daten aus öffentlichen Profilen ihrer Nutzer zum Training von Künstlicher Intelligenz zu verwenden. Meta betreibt unter anderem die Dienste "Facebook" und "Instagram". Die Verbraucherzentrale Nordrhein-Westfalen e.V. ist ein qualifizierter Verbraucherverband. Sie geht mit ihrem Antrag vom 12.05.2025 auf Grundlage des Unterlassungsklagengesetzes (UKlaG) gegen Meta vor. Betroffen sind Daten von Verbrauchern und von Dritten in öffentlich gestellten Profilen, soweit die Nutzer keinen Widerspruch eingelegt haben.

Nach vorläufiger und summarischer Prüfung im Rahmen des am 12.05.2025 eingeleiteten Eilverfahrens liegt weder ein Verstoß von Meta gegen Vorschriften der Datenschutz-Grundverordnung (DSGVO) noch gegen den Digital Markets Act (DMA) vor. Diese Einschätzung stimmt mit der aufsichtsrechtlichen Bewertung durch die für Meta zuständige irische Datenschutzbehörde überein. Diese führt wegen des Sachverhalts keine aufsichtsrechtlichen Maßnahmen durch und hat angekündigt, die Handlungen zu begleiten. Hinsichtlich der Daten, die von Nutzern nach Mitte des Jahres 2024 öffentlich gestellt wurden, sieht auch der Hamburgische Beauftragte für Datenschutz und Informationsfreiheit die Verarbeitung als rechtlich möglich an. Er wurde in der mündlichen Verhandlung am 22.05.2025 angehört.

Die angekündigte Verwendung der Daten für KI-Trainingszwecke stellt sich bei vorläufiger Betrachtung auch ohne Einwilligung der Betroffenen als rechtmäßig im Sinne des Art. 6 Abs. 1 Buchstabe f) DSGVO dar. Meta verfolgt mit der Verwendung zum Training von Systemen Künstlicher Intelligenz einen legitimen Zweck. Dieser Zweck kann nicht durch gleich wirksame andere Mittel, die weniger einschneidend wären, erreicht werden. Unzweifelhaft werden für das Training große Datenmengen benötigt, die nicht zuverlässig vollständig anonymisiert werden können. Im Rahmen der Abwägung der Rechte von Nutzern und Meta als Betreiberin überwiegen die Interessen an der Datenverarbeitung. Diese heutige Bewertung beruht unter anderem auf einer Stellungnahme des Europäischen Datenschutzausschusses (EDSA) aus Dezember 2024, welcher die Beklagte durch verschiedene Maßnahmen Rechnung getragen hat. Es sollen ausschließlich öffentlich gestellte Daten verarbeitet werden, die auch von Suchmaschinen gefunden werden. Der Umstand, dass große Mengen von Daten, auch von Dritten einschließlich Minderjährigen und auch sensible Daten im Sinne des Art. 9 DSGVO, betroffen sind, überwiegt bei der Abwägung nicht. Meta hat insoweit wirkungsvolle Maßnahmen ergriffen, welche den Eingriff wesentlich abmildern. Die geplante Verarbeitung wurde bereits im Jahre 2024 angekündigt. Die Nutzer wurden über die Apps und - soweit möglich - auf anderem Wege informiert. Sie haben die Möglichkeit, die Datenverarbeitung durch Umstellung ihrer Daten auf "nicht-öffentlich" oder durch einen Widerspruch zu verhindern. Die verwendeten Daten enthalten keine eindeutigen Identifikatoren wie Name, E-Mail-Adresse oder Postanschrift einzelner Nutzer.

Nach Ansicht des Senats liegt bei vorläufiger und summarischer Prüfung im Rahmen des vorliegenden Eilverfahrens auch kein Verstoß gegen Art. 5 Abs. 2 DMA vor. Es fehlt bei vorläufiger rechtlicher Würdigung an einer "Zusammenführung" von Daten, weil Meta im Rahmen der beabsichtigten Vorgehensweise keine Daten aus Nutzerprofilen bei verschiedenen Diensten oder aus anderen Quellen im Hinblick auf einen einzelnen konkreten Nutzer kombiniert. Insoweit fehlt es an einschlägiger Rechtsprechung. Dem Senat war im Eilverfahren auch keine in der Rechtsgrundlage vorgesehene Kooperation mit der Europäischen Kommission möglich.

Das heutige Urteil ist in einem Eilverfahren infolge einer summarischen Prüfung ergangen. Es gelten hier abweichende rechtliche Anforderungen, insbesondere an die Beurteilung von streitigem Tatsachenvortrag. Die Parteien können ihre Rechte in einem gesonderten Hauptsacheverfahren wahrnehmen.

Das heute verkündete Urteil ist rechtskräftig. Die Revision zum Bundesgerichtshof findet nicht gegen Entscheidungen eines Oberlandesgerichts im einstweiligen Rechtschutz statt (§ 542 Abs. 2 Satz 1 ZPO). Für Verfahren nach dem Unterlassungsklagengesetz sind die Oberlandesgerichte in erster Instanz zuständig. Die örtliche Zuständigkeit des Oberlandesgerichts Köln folgt aus dem behaupteten Ort des drohenden Verstoßes gegen Verbraucherschutzgesetze (vergleiche § 6 Abs. 1 Satz 2 Nr. 2 UKlG).

Aktenzeichen: 15 UKl 2/25

LG Hamburg: Gemeinnützer Verein LAION darf Fotos für die Erstellung von KI-Traingsdaten nach § 60d UrhG herunterladen und verwenden

LG Hamburg
Urteil vom 27.09.2024
310 O 227/23


Das LG Hamburg hat entschieden, dass der gemeinnütze Verein LAION Fotos für die Erstellung von KI-Traingsdaten nach § 60d UrhG herunterladen und verwenden darf.

Aus den Entscheidungsgründen:
I. Die zulässige Klage hat in der Sache keinen Erfolg. Der Beklagte hat durch die Vervielfältigung der streitgegenständlichen Fotografie zwar in die Verwertungsrechte des Klägers eingegriffen. Dieser Eingriff ist aber durch die Schrankenregelung des § 60d UrhG gedeckt. Ob sich der Beklagte ergänzend auf die Schrankenregelung des § 44b UrhG berufen kann, bedarf vor diesem Hintergrund keiner abschließenden Beurteilung.

Die streitgegenständliche Fotografie ist jedenfalls als Lichtbild nach § 72 Abs. 1 UrhG geschützt. Das Gericht hat nach Inaugenscheinnahme der auf dem Laptop des Klägers befindlichen Rohdaten auch keinen Zweifel an der Lichtbildnereigenschaft des Klägers, § 72 Abs. 2 UrhG. Der Kläger ist auch zur Geltendmachung von Verletzungsansprüchen nach § 97 UrhG aktiv legitimiert, so auch für den Unterlassungsanspruch nach Abs. 1 der Vorschrift; dass der Kläger der Bildagentur ... weitergehende als (unterlizenzierbare) einfache Nutzungsrechte eingeräumt hat, hat der Beklagte nicht dargelegt. Die Bildagentur ... hat das Foto mit einem Wasserzeichen versehen; das war eine unfreie Umgestaltung im Sinne des § 23 Abs. 1 S. 1 UrhG, so dass auch zu deren Verwertung grundsätzlich die Zustimmung des Klägers als des Urhebers erforderlich war. Im Rahmen des durchgeführten Downloads hat der Beklagte diese Fassung vervielfältigt i.S.d. § 16 Abs. 1 UrhG, ohne dafür eine Zustimmung des Klägers eingeholt zu haben.

Allerdings war der Beklagte hierzu aufgrund gesetzlicher Erlaubnis berechtigt. Die Vervielfältigung war zwar nicht durch die Schrankenregelung des § 44a UrhG gedeckt (im Folgenden 1.), und ob sich der Beklagte auf die Schrankenregelung des § 44b UrhG berufen kann, erscheint als zweifelhaft (im Folgenden 2.). Letzteres bedarf aber vorliegend keiner abschließenden Entscheidung, da die Vervielfältigungshandlung jedenfalls durch die Schrankenregelung des § 60d UrhG gedeckt war (im Folgenden 3.).

1. Die erfolgte Vervielfältigung ist nicht durch die Schrankenregelung des § 44a UrhG gedeckt.

Danach sind vorübergehende Vervielfältigungshandlungen zulässig, die flüchtig oder begleitend sind und einen integralen und wesentlichen Teil eines technischen Verfahrens darstellen und deren alleiniger Zweck es ist, eine Übertragung in einem Netz zwischen Dritten durch einen Vermittler oder eine rechtmäßige Nutzung eines Werkes oder sonstigen Schutzgegenstands zu ermöglichen, und die keine eigenständige wirtschaftliche Bedeutung haben.

Die vorliegend erfolgte Vervielfältigung war bereits weder flüchtig noch begleitend.

a) Flüchtig i.S.d. § 44a UrhG ist eine Vervielfältigung dann, wenn ihre Lebensdauer auf das für das ordnungsgemäße Funktionieren des betreffenden technischen Verfahrens Erforderliche beschränkt ist, wobei dieses Verfahren derart automatisiert sein muss, dass es diese Handlung automatisch, d.h. ohne Beteiligung einer natürlichen Person löscht, sobald ihre Funktion, die Durchführung eines solchen Verfahrens zu ermöglichen, erfüllt ist (EuGH, Urt. v. 16.07.2009, Az. C-5/08 – Infopaq/Danske Dagblades Forening, Rn. 64 (juris) zu Art. 5 Abs. 1 DSM-RL).

Soweit sich der Beklagte insoweit darauf beruft, dass im Rahmen des von ihm durchgeführten Analyseverfahrens die Dateien "automatisch" gelöscht worden seien, vermag dies eine Flüchtigkeit der Vervielfältigung im vorgenannten Sinne nicht zu begründen. Abgesehen davon, dass der Beklagte nichts zu der konkreten Dauer der Speicherung vorgetragen hat, erfolgte die Löschung gerade nicht "nutzerunabhängig", sondern aufgrund einer entsprechenden bewussten Programmierung des Analyseprozesses durch den Beklagten.

b) Begleitend i.S.d. § 44a UrhG ist eine Vervielfältigung dann, wenn sie gegenüber dem technischen Verfahren, dessen Teil sie ist, weder eigenständig ist noch einem eigenständigen Zweck dient (EuGH, Urt. v. 05.06.2014, Az. C-360/13, Rn. 43 (juris)).

Im vorliegenden Fall erfolgte ein gezieltes Herunterladen der Bilddateien, um sie mittels einer spezifischen Software zu analysieren. Damit ist das Herunterladen kein bloß begleitender Prozess zu der durchgeführten Analyse, sondern ein der Analyse vorgelagerter bewusster und aktiv gesteuerter Beschaffungsprozess.

2. Ob sich der Beklagte auf die Schrankenregelung des § 44b UrhG berufen kann, erscheint im vorliegenden Fall durchaus als zweifelhaft. Zwar unterfällt der von dem Beklagten vorgenommene Download grundsätzlich der Schrankenregelung des § 44b Abs. 2 UrhG, insbesondere erfolgte er zum Zwecke des Text und Data Mining im Sinne des § 44b Abs. 1 UrhG (im Folgenden lit. a). Allerdings spricht ‒ ohne dass dies vorliegend einer abschließenden Entscheidung bedürfte ‒ Einiges dafür, dass aufgrund eines wirksam erklärten Nutzungsvorbehalts im Sinne des § 44b Abs. 3 die Vervielfältigungshandlung nicht bereits nach § 44b Abs. 2 UrhG zulässig war (im Folgenden lit. b).

a) Die streitgegenständliche Vervielfältigungshandlung unterfällt grundsätzlich der Schrankenregelung des § 44b Abs. 2 UrhG.

(1) Der streitgegenständliche Download erfolgte zum Zwecke des Text und Data Mining im Sinne des § 44b Abs. 1 UrhG. Danach ist Text und Data Mining die automatisierte Analyse von einzelnen oder mehreren digitalen oder digitalisierten Werken, um daraus Informationen insbesondere über Muster, Trends und Korrelationen zu gewinnen. Jedenfalls für die vorliegend streitgegenständliche Vervielfältigungshandlung ist dies zu bejahen (nachfolgend (a)); eine teleologische Reduktion des Schrankentatbestands kommt insofern nicht in Betracht (unten (b)).

Vorliegend keiner Entscheidung bedarf daher die weitere, im Schrifttum eingehend diskutierte Frage, ob das Training von Künstlicher Intelligenz in seiner Gesamtheit der Schrankenregelung des § 44b UrhG unterfällt oder nicht (eingehend zum Meinungsstand BeckOK UrhR/Bomhard, 42. Ed. 15.2.2024, UrhG § 44b Rn. 11a-11b m.w.N.; dazu auch eingehend die als Anlage K11 vorgelegte, im Auftrag der Initiative Urheberrecht erstellte Studie "Urheberrecht & Training generativer KI-technologische und rechtliche Grundlagen").

(a) Der Beklagte hat die Vervielfältigungshandlung zum Zwecke der Gewinnung von Informationen über "Korrelationen" im Wortsinn des § 44b Abs. 1 UrhG vorgenommen. Der Beklagte hat das streitgegenständliche Lichtbild von seinem ursprünglichen Speicherort heruntergeladen, um mittels einer bereits verfügbaren Software ‒ offenbar der Anwendung ... von ... ‒ den Bildinhalt mit der zu dem Text bereits hinterlegten Bildbeschreibung abzugleichen. Diese Analyse der Bilddatei zum Abgleich mit einer vorbestehenden Bildbeschreibung stellt ohne Weiteres eine Analyse zum Zwecke der Gewinnung von Informationen über "Korrelationen" (nämlich der Frage der Nicht-/Übereinstimmung von Bildern und Bildbeschreibungen) dar. Dass der Beklagte die in den Datensatz ... aufgenommenen Bilder auf diese Art und Weise analysiert hat, wurde klägerseits als solches nicht bestritten.

Die Anwendbarkeit von § 44b Abs. 1 UrhG ist ‒ entgegen der Auffassung des Klägers (Replik S. 13 f., Bl. 47 f. d.A.) ‒ auch nicht deshalb ausgeschlossen, weil der Beklagte den von ihm erstellten Datensatz ... ausweislich eines zu diesem Datensatz ausgesprochenen "Disclaimers" nicht "kuratiert" habe. Der klägerseits wiedergegebene Disclaimer bezieht sich allein auf eine Warnung, dass der Datensatz nicht nach "verstörenden Inhalten" o.Ä. durchsucht worden sei. Eine solche ‒ zusätzliche ‒ Filterung des zu erstellenden Datensatzes ist aber nicht Anwendungsvoraussetzung für § 44b Abs. 1 UrhG und steht nicht der Annahme entgegen, dass die heruntergeladenen Bilder ‒ wie ausgeführt ‒ auf ihre Korrelation zwischen Bildinhalt und Bildbeschreibung hin analysiert wurden.

(b) Die streitgegenständliche Vervielfältigungshandlung ist auch nicht im Wege der teleologischen Reduktion der Schrankenregelung des § 44b UrhG aus dieser auszuschließen.

Soweit eine Herausnahme der Vervielfältigung von Daten zum Zwecke des KI-Trainings im Wege der teleologischen Reduktion im Schrifttum vereinzelt mit der Begründung befürwortet wird, dass § 44b UrhG nur die Erschließung "in den Daten verborgener Informationen", nicht aber die Nutzung "des Inhalts der geistigen Schöpfung" erfasse (Schack, NJW 2024, 113; in diese Richtung auch Dormis/Stober, Urheberrecht und Training generativer KI-Modelle, Anlage K11, S. 67 ff. mit einer Differenzierung zwischen Semantik und Syntax), bestehen Zweifel, ob dies zu überzeugen vermag; denn dabei wird nicht ausreichend deutlich, worin bei digitalisierten Werken der Unterschied zwischen "in den Daten verborgenen Informationen" und "dem Inhalt der geistigen Schöpfung" liegen soll.

Soweit ergänzend angeführt wird, dass es beim "KI-Webscraping" um den geistigen Inhalt der zu Trainingszwecken genutzten Werke und "letztlich" um die Schaffung inhaltsgleicher oder ähnlicher Konkurrenzerzeugnisse gehe (Schack, a.a.O.), unterscheidet diese Argumentation nach Auffassung der Kammer nicht streng genug zwischen

- zum einen der (hier allein streitgegenständlichen) Erstellung eines ‒ auch ‒ für KI-Training nutzbaren Datensatzes,

- zum anderem dem nachfolgenden Training des künstlichen neuronalen Netzes mit diesem Datensatz und

- zum dritten der nachfolgenden Nutzung der trainierten KI zum Zwecke der Erstellung neuer Bildinhalte.

Diese letztere Funktionalität mag zwar bereits bei der Erstellung des Trainingsdatensatzes angestrebt sein. Jedoch ist im Zeitpunkt der Zusammenstellung des Trainingsdatensatzes weder absehbar, in welcher Weise der zweite Schritt (das Training) erfolgreich sein wird, noch, welche konkreten Inhalte im dritten Schritt (bei der KI-Anwendung) durch die trainierte KI werden generiert werden können. Die konkreten Anwendungsmöglichkeiten bei einer sich rasant entwickelnden Technologie wie der KI sind zum Zeitpunkt der Erstellung des Trainingsdatensatzes daher nicht abschließend absehbar und mithin nicht rechtssicher feststellbar. Wegen dieser Rechtsunsicherheit ist die bei der Erstellung des Trainingsdatensatzes zunächst allein bestehende nur allgemeine Absicht, zukünftige KI-generierte Inhalte erlangen zu wollen, kein taugliches Kriterium für die Beurteilung der rechtlichen Zulässigkeit der Erstellung des Trainingsdatensatzes als solchen.

Soweit für eine teleologische Reduktion der Schrankenregelung des § 44b UrhG schließlich angeführt wird, dass der europäische Gesetzgeber 2019 bei Schaffung der zugrundeliegenden Richtlinienbestimmung (Art. 4 DSM-RL) "das KI-Problem" "schlicht noch nicht auf dem Schirm" gehabt habe (Schack, a.a.O.; ebenso für das Training von KI-Modellen Dormis/Stober, a.a.O., S. 71 ff., 87 ff.), genügt allein dieser Befund für eine teleologische Reduktion ersichtlich nicht. Dabei ist insbesondere zu berücksichtigen, dass die technische Fortentwicklung im Bereich der sog. Künstlichen Intelligenz seit 2019 weniger Art und Umfang des (streitgegenständlichen) Data Mining zur Beschaffung von Trainingsdaten betrifft, sondern die Leistungsfähigkeit der mit den Daten trainierten künstlichen neuronalen Netze (dementsprechend gehen Dormis/Stober, a.a.O., S. 95 gleichfalls davon aus, dass die reine Erstellung von Trainingsdatensätzen "im Vorfeld des eigentlichen Trainings" durchaus der TDM-Schranke unterfallen dürfte). Zu beachten wäre außerdem, dass die beklagtenseits abgerufene Datenbank der Common Crawl Foundation bereits seit dem Jahr 2008 (!) erstellt wird, vgl. https://commoncrawl.org/overview.

Davon abgesehen hat jedenfalls der aktuelle europäische Gesetzgeber der KI-Verordnung (Verordnung (EU) 2024/1689 vom 13.06.2024, ABl. L v. 12.07.2024 S. 1) unzweifelhaft zum Ausdruck gebracht, dass auch die Erstellung von zum Training von künstlichen neuronalen Netzen bestimmten Datensätzen der Schrankenregelung des Art. 4 DSM-RL unterfällt. Denn nach Art. 53 Abs. 1 lit. c KI-Verordnung sind Anbieter von KI-Modellen mit allgemeinem Verwendungszweck verpflichtet, eine Strategie insbesondere zur Ermittlung und Einhaltung eines gemäß Art. 4 Abs. 3 DSM-RL geltend gemachten Rechtsvorbehalts vorzusehen.

Dass auch die Erstellung von zum Training von künstlichen neuronalen Netzen bestimmten Datensätzen der Schrankenregelung des Art. 4 DSM-RL unterfalle, entspricht im Übrigen auch der Einschätzung des deutschen Gesetzgebers im Rahmen der Umsetzung der vorgenannten Schrankenbestimmung im Jahr 2021 (Begr. RegE BT-Drs. 19/27426, S. 60).

(c) Auch der in Art. 5 Abs. 5 InfoSoc-RL (i.V.m. Art. 7 Abs. 2 S. 1 DSM-RL) verankerte sog. 3-Stufen-Test rechtfertigt letztlich keine andere Beurteilung. Danach dürfen die normierten Ausnahmen nur in bestimmten Sonderfällen angewandt werden, in denen die normale Verwertung des Werks oder des sonstigen Schutzgegenstands nicht beeinträchtigt wird und die berechtigten Interessen des Rechtsinhabers nicht ungebührlich verletzt werden. Diese Anforderungen sind im vorliegenden Fall erfüllt.

Die vorliegend urheberrechtlich relevante Vervielfältigung ist auf den Zweck der Analyse der Bilddateien auf ihre Übereinstimmung mit einer vorbestehenden Bildbeschreibung nebst anschließender Einstellung in einen Datensatz beschränkt. Dass durch diese Nutzung die Verwertungsmöglichkeiten der jeweils betroffenen Werke beeinträchtigt werden würden, ist nicht ersichtlich und wird auch klägerseits nicht behauptet.

Zwar mag der auf diese Weise erstellte Datensatz nachfolgend zum Trainieren künstlicher neuronaler Netze genutzt werden können und die dabei entstehenden KI-generierten Inhalte mögen in Konkurrenz zu den Werken (menschlicher) Urheber treten können. Das allein rechtfertigt es jedoch noch nicht, bereits in der Erstellung der Trainingsdatensätze eine Beeinträchtigung auch der Verwertungsrechte an Werken i.S.v. Art. 5 Abs.5 InfoSoc-RL zu erblicken. Dies hat schon allein deshalb zu gelten, weil die Berücksichtigung bloß zukünftiger, derzeit noch gar nicht im Einzelnen absehbarer technischer Entwicklungen keine rechtssichere Abgrenzung zulässiger von unzulässigen Nutzungen erlaubt (vgl. ähnlich oben (b)).

Da eine Verwendung von im Wege des Text und Data Mining gewonnenen Erkenntnissen zum Trainieren künstlicher neuronaler Netze, die dann in Konkurrenz zu Urhebern treten können, auf Grundlage der aktuellen technologischen Entwicklung im Zweifel nie ausgeschlossen werden kann, würde die Gegenauffassung in letzter Konsequenz sogar dazu nötigen, das Text und Data Mining i.S.d. § 44b UrhG letztlich in seiner Gänze zu untersagen; eine solche vollständige Außerkraftsetzung der Schrankenregelung liefe aber der gesetzgeberischen Intention offenkundig zuwider und kann daher kein tragbares Auslegungsergebnis darstellen.

(2) Die von dem Beklagten heruntergeladene Bilddatei war auch ‒ was der Kläger im Übrigen auch nicht in Abrede stellt ‒ rechtmäßig zugänglich i.S.d. § 44b Abs. 2 S. 1 UrhG.

"Rechtmäßig zugänglich" in diesem Sinne ist ein Werk insbesondere dann, wenn es frei im Internet zugänglich ist (Begr. RegE BT-Drucks. 19/27426, S. 88).

Hiervon ist für das von dem Beklagten heruntergeladene Bild auszugehen. Anders als klägerseits zunächst vorgetragen, hat der Beklagte nicht das in dem in der Klageschrift zunächst formulierten Unterlassungsantrag wiedergegebene "Originalbild" ‒ das von der Bildagentur ... nur bei Erwerb einer Lizenz zur Verfügung gestellt worden wäre ‒, sondern eine mit einem Wasserzeichen der Bildagentur versehene Fassung des Bildes heruntergeladen. Hierbei handelte es sich ersichtlich um das auf der Agenturseite quasi zu Werbezwecken eingestellte Vorschaubild. Dieses mit dem Wasserzeichen versehene Vorschaubild wurde von der Agentur aber gerade frei zugänglich ins Internet gestellt.

b) Allerdings spricht einiges dafür, dass vorliegend die Schrankenregelung des § 44b Abs. 2 UrhG ‒ ohne dass dies einer abschließenden Entscheidung bedürfte ‒ nicht eingreift, da ein wirksam erklärter Nutzungsvorbehalts im Sinne von Abs. 3 der Vorschrift vorlag; insbesondere dürfte der auf der Webseite ...com unstreitig erklärte Nutzungsvorbehalt wohl den Anforderungen an eine Maschinenlesbarkeit i.S.d. § 44b Abs. 3 S. 2 UrhG genügen.

(1) Es spricht manches dafür, dass der auf der Webseite der Agentur ausgesprochene Nutzungsvorbehalt durch eine hierzu berechtigte Person ausgesprochen wurde und der Kläger sich hierauf auch zum Schutz seiner eigenen Rechte berufen kann.

Nach dem Wortlaut des § 44b Abs. 3 UrhG kann "der Rechtsinhaber" den Nutzungsvorbehalt aussprechen. Zu beachten sind also nicht allein Vorbehaltserklärungen des Urhebers selbst, sondern auch nachfolgender Rechteinhaber, seien sie Rechtsnachfolger oder Inhaber von vom Urheber abgeleiteten Rechten. Nach dem ohne Weiteres schlüssigen Vortrag des Klägers (Protokoll v. 11.07.2024 S. 3, Bl. 122 d.A.) hatte er der Bildagentur ... weiterlizenzierbare einfache Nutzungsrechte an dem Originalbild eingeräumt. Die Bildagentur war danach selbst Rechteinhaberin an den auf ihrer Seite eingestellten Bildern und konnte daher ohne Weiteres einen Nutzungsvorbehalt nach § 44b Abs. 3 UrhG aussprechen; dass insofern dinglich wirkende Vereinbarungen im Vertragsverhältnis zwischen dem Kläger und der Bildagentur entgegengestanden hätten, ist weder ersichtlich noch geltend gemacht worden.

Der Kläger ist wohl auch berechtigt, sich auf diese Vorbehaltserklärung seiner Lizenznehmerin zu berufen. Wirtschaftlich betrachtet fand hier die Auswertung des streitgegenständlichen Originalfotos über die Agentur statt. Damit lag in der Praxis die konkrete Entscheidung, welcher Dritte die Berechtigung zu welcher Nutzung erhalten sollte, bei der Agentur; Abschlusszwang bestand für diese nicht. In einer solchen Situation spricht aus Sicht der Kammer vieles dafür, dass sich der Urheber bei der Geltendmachung bei ihm verbliebener Verbietungsrechte auf einen von seinem Lizenznehmer erklärten Vorbehalt nach § 44b Abs. 3 UrhG berufen darf.

(2) Auch der Einwand des Beklagten, dass das in den AGB der Agentur gegenüber deren Kunden ausgesprochene Nutzungsverbot für Webcrawler schon in zeitlicher Hinsicht nicht "in Bezug auf § 44b Abs. 3 UrhG" formuliert sein könne, ist unerheblich. Für die Rechtswirkungen der Erklärung ist es keine Voraussetzung, dass sie bewusst mit Blick auf eine bestimmte Gesetzesfassung erklärt wird.

(3) Der Vorbehalt ist auch hinreichend klar formuliert. Art. 4 Abs. 3 DSM-RL verlangt eine ausdrückliche Erklärung des Nutzungsvorbehalts. Dieses Ausdrücklichkeitserfordernis ist mithin bei richtlinienkonformer Auslegung des § 44b Abs. 3 UrhG mitzuberücksichtigen (so auch Begr. RegE BT-Drs. 19/27426, 89). Der erklärte Vorbehalt muss damit sowohl expressis verbis (nicht konkludent) als auch so zielgenau (konkret-individuell) erklärt werden, dass er zweifelsfrei einen bestimmten Inhalt und eine bestimmte Nutzung erfasst (Hamann, ZGE 16 (2024), S. 134). Diesen Anforderungen genügt der auf der Webseite der Bildagentur ... formulierte Nutzungsvorbehalt ohne Weiteres.

Soweit darüber hinaus argumentiert wird, dass ein für sämtliche auf einer Webseite eingestellte Werke erklärter Nutzungsvorbehalt dem Ausdrücklichkeitserfordernis des § 44b Abs. 3 UrhG widerspreche (so in Erweiterung der eigenen abstrakten Herleitung Hamann, a.a.O., S. 148), vermag dies nicht zu überzeugen. Denn auch der explizit für sämtliche auf einer Webseite eingestellte Werke erklärte Vorbehalt ist in seiner Reichweite und seinem Inhalt nach zweifelsfrei bestimmbar und damit ausdrücklich erklärt.

(4) Schließlich dürfte auch Einiges dafür sprechen, dass der Nutzungsvorbehalt den Anforderungen an eine Maschinenlesbarkeit i.S.d. § 40b Abs. 3 S. 2 UrhG genügt.

Dabei wird man zwar den Begriff der Maschinenlesbarkeit im Hinblick auf den ihm zugrunde liegenden gesetzgeberischen Willen, eine automatisierte Abfrage durch Webcrawler zu ermöglichen (vgl. Begr. RegE BT-Drucks. 19/27426, S. 89), durchaus im Sinne einer "Maschinenverständlichkeit" auszulegen haben (eingehend zum Meinungsstand Hamann, a.a.O., S. 113, 128 ff.).

Die Kammer neigt allerdings dazu, als "maschinenverständlich" auch einen allein in "natürlicher Sprache" verfassten Nutzungsvorbehalt anzusehen (anders als die wohl überwiegende Auffassung im Schrifttum, s. Hamann, a.a.O., S. 131 ff., 146 ff. m.w.N. zum Meinungsstand, wobei dort auf einen Beitrag der hiesigen Beklagtenvertreter, nämlich auf Akinci/Heidrich, IPRB 2023, 270, 272 verwiesen wird, die offenbar ebenfalls die Auffassung der Kammer vertreten; der Beitrag war der Kammer allerdings bis zur Urteilsabfassung nicht unmittelbar zugänglich). Allerdings wird man die Frage, ob und unter welchen konkreten Voraussetzungen ein in "natürlicher Sprache" erklärter Vorbehalt auch als "maschinenverständlich" angesehen werden kann, stets in Abhängigkeit von der zum jeweils relevanten Werknutzungszeitpunkt bestehenden technischen Entwicklung beantworten müssen.

Dementsprechend hat auch der europäische Gesetzgeber im Rahmen der KI-Verordnung festgelegt, dass Anbieter von KI-Modellen eine Strategie insbesondere zur Ermittlung und Einhaltung eines gemäß Art. 4 Abs. 3 DSM-RL geltend gemachten Rechtsvorbehalts "auch durch modernste Technologien" vorzuhalten haben (Art. 53 Abs. 1 lit. c KI-Verordnung). Zu diesen "modernsten Technologien" gehören aber unzweideutig gerade auch KI-Anwendungen, die in der Lage sind, in natürlicher Sprache geschriebenen Text inhaltlich zu erfassen (so offenbar insbesondere auch die hiesigen Beklagtenvertreter Akinci/Heidrich in dem der Kammer nicht unmittelbar zugänglichen Beitrag IPRB 2023, 270, 272, hier zit. nach Hamann, a.a.O. S. 148, dieser im Übrigen diese Möglichkeit in technischer Hinsicht grds. bejahend, a.a.O.). Es spricht insoweit alles dafür, dass der Gesetzgeber der KI-Verordnung mit seinem Hinweis auf "modernsten Technologien" gerade solche KI-Anwendungen im Blick hatte.

Gegen eine solche Sichtweise wird teilweise eingewandt, sie führe zu einem Zirkelschluss: Wenn gefordert werde, der Betreiber des Text und Data Mining müsse mittels KI-Anwendungen überprüfen, ob ein Nutzungsvorbehalt erklärt worden sei, dann erfordere doch diese KI-gestützte Suche ihrerseits eine Musteranalyse, die bereits den Tatbestand des Text und Data Mining i.S.d. § 44b Abs. 1 UrhG erfülle; mit anderen Worten: Erst die Anwendung der Schranke entscheide über die Zulässigkeit ihrer Anwendung (so Hamann, a.a.O., S. 148). Die Kammer teilt diese Bewertung nicht: Die urheberrechtlich relevante, rechtfertigungsbedürftige Nutzungshandlung ist entgegen vorgenannter Ansicht nicht die Durchführung einer "Musteranalyse" als solche, sondern die Vervielfältigung des urheberrechtlich geschützten Werks i.S.d. § 16 UrhG. Dass das vorausgehende Auffinden solcher Werke im Netz und deren Überprüfung, ob Vorbehalte i.S.d. § 44b Abs. 3 S. 2 UrhG erklärt sind, zwingend ein quasi vorgeschaltetes weiteres Text und Data Mining i.S.v. § 44b Abs. 1 UrhG erfordere, erscheint nicht als zwingend, denn zu denken ist insbesondere an Prozessierungen des Webseiteninhalts durch den Einsatz von Webcrawlern, bei denen lediglich flüchtige und beiläufige Vervielfältigungen entstehen, die ihrerseits bereits unter § 44a UrhG gerechtfertigt sind.

Ferner wird gegen das von der Kammer erwogene, weitere Verständnis des Begriffes der "Maschinenlesbarkeit" auch eingewandt, dieser Begriff werde vom europäischen Gesetzgeber in anderem Zusammenhang enger verstanden. Verwiesen wird in diesem Zusammenhang auf den Erwägungsgrund 35 der PSI-Richtlinie (RL (EU) 2019/1024), der für eine "Maschinenlesbarkeit" im Sinne dieser Richtlinie u.a. eine "einfache" Erkennbarkeit verlange (so BeckOK UrhR/Bomhard, 42. Ed. 15.2.2024, UrhG § 44b Rn. 31 m.w.N.); dies könne für einen nur in natürlicher Sprache formulierten Vorbehalt nicht angenommen werden. Eine solche Argumentation setzt allerdings voraus, dass die Begrifflichkeiten beider Richtlinien in gleicher Weise verstanden werden müssen. Die Kammer hat Zweifel, ob eine solche Gleichsetzung der Begrifflichkeiten überzeugen kann, denn die Richtlinien haben unterschiedliche Zielrichtungen: Während die PSI-Richtlinie den rein einseitigen Zugang der Öffentlichkeit zu Informationen bzw. die rein einseitige Verpflichtung der öffentlichen Hand zur Veröffentlichung bestimmter Informationen zum Gegenstand hat, geht es im Rahmen von Art. 4 Abs. 3 DSM-RL um einen Ausgleich zwischen den Interessen der Nutzer des Text und Data Mining (dieses möglichst einfach und möglichst rechtssicher betreiben zu können) und den Interessen der Rechteinhaber (ihre Rechte möglichst einfach und möglichst effektiv zu sichern). Dieser Interessenausgleich kann nach Auffassung der Kammer nicht einseitig zugunsten der Nutzer des Text und Data Mining gelöst werden, indem allein die für diese denkbar einfachste technische Lösung als ausreichend für die Wirksamkeit eines ausgesprochenen Nutzungsvorbehalts erachtet wird. Gegen ein solches Verständnis spräche auch die Wertung des Gesetzgebers der DSM-RL, der im Erwägungsgrund 18 gerade nicht die Erklärung eines Vorbehalts "in möglichst einfach auszulesender Weise" fordert, sondern lediglich "in angemessener Weise". Und auch der deutsche Umsetzungsgesetzgeber verlangt lediglich eine Erklärung in einer Weise, die "den automatisierten Abläufen beim Text und Data Mining angemessen" ist (Begr. RegE BT-Drucks. 19/27426, S. 89).

Es wäre zudem aus Sicht der Kammer ein gewisser Wertungswiderspruch, den Anbietern von KI-Modellen einerseits über die Schranke in § 44b Abs. 2 UrhG die Entwicklung immer leistungsfähigerer textverstehender und -kreierender KI-Modelle zu ermöglichen, ihnen aber andererseits im Rahmen der Schranken-Schranke von § 44b Abs. 3 S. 2 UrhG die Anwendung bereits bestehender KI-Modelle nicht abzuverlangen.

Ob und in welchem Maße zum Zeitpunkt der streitgegenständlichen Vervielfältigungshandlung im Jahr 2021 eine ausreichende Technologie zur automatisierten inhaltlichen Erfassung des streitgegenständlichen Nutzungsvorbehalts bereits zur Verfügung stand, ist zwar klägerseits bislang nicht dargetan; der Kläger hat insoweit nur auf im Jahr 2023 verfügbare Dienste verwiesen (Replik S. 14 ff., Bl. 48 ff. d.A.). Allerdings bestehen Anzeichen dafür, dass der Beklagte bereits über geeignete Technologie verfügte. Denn nach eigenem Vortrag des Beklagten erforderte die im Rahmen der Erstellung des Datensatzes ... durchgeführte Analyse in Form eines Abgleichs von Bildinhalten mit vorbestehenden Bildbeschreibungen ersichtlich auch und gerade eine inhaltliche Erfassung dieser Bildbeschreibungen durch die eingesetzte Software. Vor diesem Hintergrund spricht einiges dafür, dass – insbesondere auch dem Beklagten – bereits im Jahr 2021 Systeme zur Verfügung standen, die in der Lage waren, einen in natürlicher Sprache formulierten Nutzungsvorbehalt in automatisierter Weise zu erfassen.

3. Der Beklagte kann sich hinsichtlich der streitgegenständlichen Vervielfältigung jedoch auf die Schrankenregelung des § 60d UrhG berufen.

Danach sind Vervielfältigungen für Text und Data Mining für Zwecke der wissenschaftlichen Forschung durch Forschungsorganisationen zulässig.

a) Die Vervielfältigung erfolgte – wie dargelegt – für den Zweck des Text und Data Mining i.S.d. § 44b Abs. 1 UrhG. Sie erfolgte darüber hinaus auch zu Zwecken der wissenschaftlichen Forschung i.S.d. § 60d Abs. 1 UrhG.

Wissenschaftliche Forschung bezeichnet allgemein das methodisch-systematische Streben nach neuen Erkenntnissen (Spindler/Schuster/Anton, 4. Aufl. 2019, UrhG § 60c Rn. 3; BeckOK UrhR/Grübler, 42. Ed. 1.5.2024, UrhG § 60c Rn. 5; Dreier/Schulze/Dreier, 7. Aufl. 2022, UrhG § 60c Rn. 1). Der Begriff der wissenschaftlichen Forschung ist, indem er bereits das methodisch-systematische "Streben" nach neuen Erkenntnissen ausreichen lässt, nicht so eng zu verstehen, dass er nur die unmittelbar mit der Gewinnung von Erkenntnisgewinn verbundenen Arbeitsschritte erfassen würde; vielmehr genügt es, dass der in Rede stehende Arbeitsschritt auf einen (späteren) Erkenntnisgewinn gerichtet ist, wie es z.B. bei zahlreichen Datensammlungen der Fall ist, die zunächst durchgeführt werden müssen, um anschließend empirische Schlussfolgerungen zu ziehen. Insbesondere setzt der Begriff der wissenschaftlichen Forschung auch keinen späteren Forschungserfolg voraus.

Danach kann – entgegen der Auffassung des Klägers – auch bereits die Erstellung eines Datensatzes der streitgegenständlichen Art, der Grundlage für das Trainieren von KI-Systemen sein kann, durchaus als wissenschaftliche Forschung im vorstehenden Sinne anzusehen sein. Zwar mag die Erstellung des Datensatzes als solche noch nicht mit einem Erkenntnisgewinn verbunden sein; sie ist aber grundlegender Arbeitsschritt mit dem Ziel, den Datensatz zum Zwecke späteren Erkenntnisgewinns einzusetzen. Dass eine solche Zielsetzung auch im vorliegenden Fall bestand, kann bejaht werden. Dafür genügt es, dass der Datensatz – unstreitig – kostenfrei veröffentlicht und damit gerade (auch) auf dem Gebiet künstlicher neuronaler Netze Forschenden zur Verfügung gestellt wurde. Ob der Datensatz – wie es der Kläger hinsichtlich der Dienste ... und ... behauptet – daneben auch von kommerziellen Unternehmen zum Training bzw. zur Weiterentwicklung ihrer KI-Systeme genutzt wird, ist schon deshalb unerheblich, weil auch die Forschung kommerzieller Unternehmen noch Forschung – wenn auch nicht als solche nach §§ 60c f. UrhG privilegiert – ist.

Auf die zwischen den Parteien streitige Frage, ob der Beklagte über die Erstellung entsprechender Datensätze hinaus auch wissenschaftliche Forschung in Gestalt der Entwicklung eigener KI-Modelle tätigt, kommt es vor diesem Hintergrund nicht an.

b) Der Beklagte verfolgt auch nicht kommerzielle Zwecke i.S.d. § 60d Abs. 2 Nr. 1 UrhG.

Für die Frage, ob Forschung nicht kommerziell ist, kommt es allein auf die konkrete Art der wissenschaftlichen Tätigkeit an, während Organisation und Finanzierung der Einrichtung, in der die Forschung erfolgt, unbeachtlich sind (ErwGr 42 InfoSoc-Rl).

Die nicht-kommerzielle Zweckverfolgung des Beklagten in Bezug auf die streitgegenständliche Erstellung des Datensatzes ... ergibt sich dabei bereits daraus, dass der Beklagte diesen unstreitig kostenfrei öffentlich zur Verfügung stellt. Dass die Entwicklung des streitgegenständlichen Datensatzes darüber hinaus zumindest auch der Entwicklung eines eigenen kommerziellen Angebots des Beklagten dienen würde (vgl. zu diesem Kriterium BeckOK IT-Recht/Paul, 14. Ed. 1.4.2024, UrhG § 60d Rn. 10), ist weder klägerseits vorgetragen noch sonst ersichtlich. Dass der streitgegenständliche Datensatz auch von kommerziell tätigen Unternehmen zum Training bzw. zur Weiterentwicklung ihrer KI-Systeme genutzt werden mag, ist für die Einordnung der Tätigkeit des Beklagten hingegen ohne Relevanz. Allein der Umstand, dass einzelne Mitglieder des Beklagten neben ihrer Tätigkeit für den Verein auch bezahlten Tätigkeiten bei solchen Unternehmen nachgehen, genügt nicht, die Tätigkeit dieser Unternehmen dem Beklagten als eigene zuzurechnen.

c) Dem Beklagten ist eine Berufung auf die Schrankenregelung des § 60d UrhG auch nicht nach Abs. 2 S. 3 der Vorschrift verwehrt.

Danach können sich Forschungsorganisationen, die mit einem privaten Unternehmen zusammenarbeiten, das einen bestimmenden Einfluss auf die Forschungsorganisation und einen bevorzugten Zugang zu den Ergebnissen der wissenschaftlichen Forschung hat, nicht auf die Schrankenregelung des § 60d UrhG berufen. Die Darlegungs- und Beweislast für die tatsächlichen Voraussetzungen des Gegenausschlusses nach § 60d Abs. 2 S. 3 UrhG obliegt dabei nach dem Wortlaut der Norm dem Kläger.

(1) Soweit der Kläger mit der Replik zunächst darauf verwiesen hat, dass das Unternehmen ... über die Finanzierung des gegenständlichen Datasets und die Besetzung "relevanter Posten" beim Beklagten durch eigene Mitarbeiter unmittelbaren Einfluss auf den Beklagten habe (Replik S. 18, Bl. 52 d.A.), so entbehrt dieser Vortrag der Substanz.

Der Kläger verweist insoweit lediglich darauf, dass einer der Mitbegründer des Beklagten, Herr ..., bei ... als "Head of Machine Learning Operations" angestellt sei, ferner ein Mitglied des Beklagten, Herr ..., ebendort als "Research Scientist" (Replik S. 4 f., Bl. 38 f. d.A.). Allein diese Tätigkeit von zwei Vereinsmitgliedern für das Unternehmen ... belegt aber keinen bestimmenden Einfluss dieses Unternehmens auf die Forschungsarbeit des Beklagten.

Davon abgesehen hat der Kläger noch nicht einmal behauptet, dass der Beklagte dem Unternehmen ... auch bevorzugten Zugang zu den Ergebnissen seiner wissenschaftlichen Forschung, namentlich dem streitgegenständlichen Datensatz, gewährt habe. Vielmehr wird insoweit nur vorgetragen, dass ... seinen Dienst ... mithilfe des streitgegenständlichen Datensatzes trainiert habe (Replik S. 8 f., Bl. 42 f. d.A.).

(2) Soweit der Kläger mit Schriftsatz vom 03.07.2024 auf einen im Jahr 2021 erfolgten Chat auf der Plattform ... verweist, wonach sich der Mitbegründer des Beklagten, Herr ..., dazu bereit erklärt haben soll, dem Unternehmen ... aufgrund eines von diesem geleisteten Finanzierungsbeitrags von 5.000,- $ einen vorzeitigen Zugang zu dem (damaligen kleineren) Datensatz zu gewähren, erfüllt auch dieser Vortrag nicht den Ausnahmetatbestand in § 60d Abs. 2 S. 3 UrhG.

Dabei kann dahinstehen, ob dieser – von dem Beklagten als solcher nicht bestrittene (vgl. Schriftsatz vom 09.07.2024 S. 3, Bl. 112 d.A.) – Chatverlauf die vom Kläger gezogene Interpretation überhaupt trägt. Gleichfalls kann dahinstehen, ob die Erklärung einer solchen Bereitschaft zur Gewährung eines vorzeitigen Zugangs – ob dieser tatsächlich gewährt wurde, hat der Kläger nicht vorgetragen – für das Innehaben eines bevorzugten Zugangs zu den Forschungsergebnissen i.S.d. § 60d Abs. 2 S. 2 UrhG ausreichen kann.

Denn es ist jedenfalls weder klägerseits dargetan noch sonst ersichtlich, dass das Unternehmen ... einen bestimmenden Einfluss auf den Beklagten hätte. Soweit überhaupt personelle Verflechtungen zwischen dem Beklagten und Unternehmen der KI-Branche dargetan sind, handelt es sich um die Unternehmen ... und ... (Replik S. 4 ff., Bl. 38 ff. d.A.).


Den Volltext der Entscheidung finden Sie hier: