Das Projekt TrustKI konzentriert sich auf die Entwicklung einer Plattform zur Bewertung der Vertrauenswürdigkeit von künstlicher Intelligenz. Die zunehmende Komplexität dieser Technologie erschwert es den Menschen, sie zu verstehen und zu bewerten. Wir sprechen mit Expertern, Wissenschaftlern und Anwendern über das Vertrauen in Künstliche Intelligenz.
Zum Thema künstliche Intelligenz gibt es täglich Neuigkeiten und spannende Entwicklungen. Unternehmen setzen die KI bereits im Alltag ein, zum Beispiel bei der Auswahl von Bewerbern. Die Technologie wird schon in naher Zukunft viele Bereiche unseres Alltags verändern. Dabei spielt der Faktor Vertrauen eine entscheidende Rolle. Mit dieser Frage beschäftigt sich das Institut für Internetzicherheit an der Westfälischen Hochschule in Westfälischen Hochschule in Gelsenkirchen im Rahmen des Forschungsprojekts Trust KI.
Ulla Coester:Mein Name ist Ulla Coester, ich bin Projektleiterin des Forschungsprojektes Trust KI. Schön, Herr Pieper, dass wir uns heute zum zweiten Podcast treffen. Ich hab heute ein superinteressantes Thema, wo ich auch schon viele Fragen von Studierenden unter anderem bekommen habe, die ich heute gerne mit mit Ihnen klären würde. Das Thema ist, wie man sich vielleicht denken kann, ChatGPT oder andere Gen-I-Anwendungen wie Mid Journey, weil die werden ja mittlerweile häufig genutzt. Vielfach, ohne dass sich die Anwender großartig Gedanken darüber machen, sie bei der Nutzung beachten müssen.
Ulla Coester:Am besten, Sie geben erst mal eine allgemeine Einleitung bezüglich des Urheberrechts und aller möglichen Implikationen, die daraus entstehen können.
Fritz Ulli Pieper:Ja, mach ich gerne. Noch mal hallo. Vielen Dank, dass ich zweites Mal dabei sein darf, freu ich mich. Genau, Sie haben's schon gesagt, das Thema KI und Urheberrecht ist 'n riesengroßes Thema, hat durch das Aufkommen dieser ganzen generative AI Modelle 'n Riesenschub erfahren, eine Riesendiskussion auch in der Rechtswissenschaft erfahren. Und was diese allgemeine Einleitung angeht, könnte man eigentlich eine Urheberrechtsvorlesung erst mal drüber machen und besuchen, aber es ist superkurz zu komprimieren.
Fritz Ulli Pieper:Vielleicht einfach mal gesagt, Urheberrecht funktioniert, also deutsches Urheberrecht, es ist mittlerweile ja sehr viel auch europäisch geprägt durch europäisches Recht, durch Richtlinien et cetera, aber ich geh jetzt mal vom deutschen Urheberrecht aus, hat eine ganz stringente Systematik. Da wird gesagt, dass ein Mensch eine persönliche geistige Schöpfung nach außen trägt in Form 1 Werkes. Also zum Beispiel er malt ein besonders schönes Bild oder er kreiert, komponiert ein ein Lead oder er schreibt aufwendigen Software Code, ne. Das ist alles, wo sehr viel Hirnschmalz, sag ich jetzt mal, reingeht und dann etwas herauskommt, was man nutzen kann, das Werk. Und das Urheberrecht sagt, wenn jemand so kreativ ist und so etwas erschafft, dann soll er dafür auch schon vom Gesetz her Schutz genießen.
Fritz Ulli Pieper:Er soll dieses Werk auf alle denkbaren Arten und Weisen verwerten können, ja. Ja. Früher war das so, da war das eben, ja, sag mal, für viele so die Lebensgrundlage so Kreatives Schaffen. Und das Urheberrecht hat dadurch, dass dieses Verwertungsrecht dem Urheber erst mal allein zusteht, dafür gesorgt, dass er sich dann daran so davon leben kann, könnte man eigentlich sagen. Das dieses Grundprinzip gilt heut immer noch.
Fritz Ulli Pieper:Und dann, nachdem so diese ganzen Nutzungsarten allein dem Urheber zugeschrieben werden, ändern sich ja auch im Lauf der Zeit. Irgendwann konnte man so was hochladen, online, ja, öffentlich verfügbar machen. Wer durfte das dann nutzen oder machen, wenn das so im Urheberrecht nicht drinstand? Dann wurde das Urheberrecht doch mal weiterentwickelt. Und zusätzlich zu diesen Nutzungsarten, die eigentlich dem Urheber immer zustehen, gibt es sogenannte Schranken.
Fritz Ulli Pieper:Also der Gesetzgeber hat gesagt, so ganz so 100 Prozent umfassend alleine dem Urheber so was zuzuschreiben, ist auch nicht ganz angemessen. Zum Beispiel die Presse soll ja kluge Gedanken auch zitieren können dürfen, ja, über Ereignisse berichten zu können zum Beispiel. Deswegen ist eine bekannte Schranke das Zitatrecht zum Beispiel. Gibt's ganz viele Schranken, auch im Bereich Wissenschaft und Lehre gibt's eine Schranke, dass man eigentlich urheberlich geschütztes Material auf eine bestimmte Art und Weise benutzen darf, obwohl's einem nicht selber gehört so? Und das ist erst mal der Rahmen, ganz, ganz grob, der urheberrechtliche Rahmen, der eben jetzt auch Anwendung findet, wenn man KI generierte Inhalte auf die ein oder andere Art und Weise eben generiert und nutzt, also Bilder, Texte zum Beispiel.
Fritz Ulli Pieper:Und dann sieht man sich eben auch diesen ganzen urheberrechtlichen Fragen ausgesetzt.
Ulla Coester:Fangen wir mal ganz einfach an. Wie ist das denn, wenn ich jetzt 'n super Gedanken habe, den vielleicht noch vor mir keiner gedacht hat, ich den aber jetzt nicht perfekt formulieren kann und bitte halt ChatGPT Hilfe bei der Formulierung. Und ChatGPT könnte das ja jetzt als Trainingsdaten nutzen und meinen Gedanken so eigentlich in die Welt raustragen, ohne dass ich das eigentlich jetzt schon wollte. Was hab ich jetzt hier? Was könnten da für Probleme für mich auftreten?
Fritz Ulli Pieper:Ich versuch's mal in 'n Beispiel zu packen, dann ist es vielleicht 'n bisschen greifbarer. Es hängt am Ende natürlich immer vom konkreten Sachverhalt ab, ne, was da eigentlich, ich sagen wir mal rechtlich urheberrechtlich passiert und welche Folgen sich daraus ergeben. Aber mal Ihr Beispiel aufzugreifen, sagen wir mal, ich denke mir einen lustigen 4 Zeilen Reim aus, ne. Der ist wirklich sehr genial, bringt jeden zum Lachen aufgrund der Schlagkraft der Worte, aufgrund der kreativen Reimtechnik. Und den tipp ich bei ChatGPT ein und sage, entwirf mir 5 weitere Verse im gleichen Stil, sagen wir mal so.
Fritz Ulli Pieper:Und ich hätte jetzt diese ganz allgemeine Subscription von ChatGPT oder eigentlich von welcher generativen KI, von welchem Produkt auch immer, wo ja in der Regel drinsteht, das, was ich da inputte, das wird dann von dem Modell genommen und in die eigenen Trainingsdaten übernommen, damit eben auch weiterarbeiten zu dürfen, so. Dann ist beispielsweise schon die Frage, habe ich, obwohl ich ja, wenn ich diesen genialen Gedanken hatte für die ersten 4 Zeilen, als erster ever, ja, und dann ist das 'n kleines Minigidicht, was aber wahrscheinlich urheberrechtlichen Schutz genießen würde, hab ich da reinputtet, geprompttet, wie auch immer. Und möglicherweise hab ich durch die dem Modell, dem Produkt zugrunde liegenden Nutzungsbedingungen dem Unternehmen, was hinter diesem Modell steht, was diese Daten dann nutzt, ein Nutzungsrecht eingeräumt, weil das eben aus den AGBs sich ergibt. Das Modell nimmt es dann und nimmt es in die Trainingsdaten auf, die kriegt ja in der Regel niemand zu sehen, ja. Das wird ja dann später beim Output, keine Ahnung, über 300 Ecken wird's wieder out geputtet, sag ich jetzt mal, ja, wenn jemand anders irgendwas promptet in 'nem ähnlichen Bereich.
Fritz Ulli Pieper:Und dann wird's wahrscheinlich gar nicht genauso rausgeworfen, wie das mal reingekommen ist sozusagen. Wenn der jetzt wirklich 1 zu 1, also ich sag mal so, wenn ich jetzt wenn ich jetzt diese AGB Klausel nicht hätte, wenn ich das Urheberrecht nicht wirksam eingeräumt hätte dem Betreiber des KI Produkts und das wird einfach nur reingegeben, in Trainingsdatensatz genutzt und dann auch nach hinten wieder rausgegeben woanders und jemand nutzt es dann, dann hab ich ein urheberige geschütztes Werk, sagen wir mal so, einmal so durchgereicht und der Schutz bleibt bestehen. Und der andere, der es dann hinten rausholt und nutzt, der würde dann, wenn er das weiter entsprechend nutzt, zum Beispiel veröffentlich es in einem eigenen Buch, bringt 'n bringt 'n Gedichtbuch raus, auf der ersten Seite stehen diese 4 Zeilen, dann könnte es tatsächlich sein, dass er sich dann 1 Urheberrechtsverletzung schuldig gemacht hat.
Ulla Coester:Also kann man jedem nur raten, der 'n brillanten Gedanken hat, besser nicht, 'n Large Language Model zu nutzen, den noch besser zu formulieren, sondern lieber sich irgendwo anders Hilfe sucht, auf der ganz sicheren Seite zu sein.
Fritz Ulli Pieper:Ja, würd ich pauschal jetzt vielleicht erst mal so sagen. Wie gesagt, man muss gucken, ne, was was hat dieses Modell für AGB, für rechte Pflichten, die ich eingehe, wenn ich es nutze? Was schreibt es mir urheberrechtlich vor? Was hat das für urheberrechtliche Regelungen? Ja genau, aber ich, es kommt auch immer son bisschen wie gesagt auf den Zusammenhang an.
Fritz Ulli Pieper:Wenn ich, wenn ich das selber kreiere, diese 4 Verse, diesen Satz, diese Sätze, diesen dieses Gedicht, da ist natürlich die Frage, was mache ich damit? Und wenn ich's veröffentlichen will, würde ich's wahrscheinlich nicht bei ChatGPT oder bei irgendeinem anderen Textgenerator reinhauen. Wie gesagt, wenn man es erweitern möchte, dann vielleicht schon, aber dann hat man eben auch dieses Risiko.
Ulla Coester:Ein anderes Problem ist ja das Zitieren. Also wenn ich jetzt wirklich 'n kompletten Absatz von ChatGPT erstellen lasse für eine Dissertation, ein Buch oder was auch immer, muss ich das kennzeichnen, dass dieser komplette Absatz von ChatGPT erstellt wurde?
Fritz Ulli Pieper:Es gibt bislang, sagen wir mal so, bislang gab es eigentlich keine, also man muss sich ja fragen, woher kommt dieses Müssen, ja? Wer was kann mich eigentlich verpflichten, mich als Menschen, sone Kennzeichnung, wirksam verpflichten, so eine Kennzeichnung vorzunehmen? Und das können eigentlich nur entweder, ich verpflichte mich vertraglich gegenüber wem, ist jetzt hier nicht der Fall nach Ihrem Beispiel vielleicht, dann kann es eigentlich nur ein Gesetz. Und so ein Gesetz, das sagt, wenn Du KI nutzt und daraus Inhalte generierst und die weiter nutzt und das musst Du kennzeichnen, das das gab's bislang nicht. An dieser Prämisse hat jetzt insbesondere beispielsweise der AI Act 'n bisschen was verändert.
Fritz Ulli Pieper:Der hat nämlich beispielsweise für Deep Fakes oder für Chatbots, ne, also so interagierende Produkte, KI Produkte, wo der Mensch vielleicht, weiß man ja auch nicht, aber sozusagen nicht auf Anhieb merkt, dass er mit 'ner KI interagiert oder dass es 'n Deep Fake Video ist, da ist eine entsprechende Transparenzpflicht im AI Act niedergelegt worden. Dann muss ich darüber informieren, dass ich da KI genutzt habe und das generiert habe, dass ich mit der KI mich austausche. Wo das auch noch eine Riesenrolle spielt, ist ja beispielsweise im Journalismus. Da ist dann halt die Frage, kommen da kurz- bis mittelfristig eventuell auch Regelungen, die Journalisten im Rahmen der Arbeit und auch der Veröffentlichung verpflichten, das dann auch entsprechend zu kennzeichnen.
Ulla Coester:Mhm. Aber bleiben wir doch aber beim Zitieren. Was ist denn, wenn jetzt ich von ChatGPT irgendwas erstellt bekomme? Und ChatGPT hat in dem Text ein Zitat verwendet, ohne dieses Zitat kenntlich zu machen. Also nehmen wir mal Adam Smith und die unsichtbare Hand, die ist ja eigentlich geläufig, aber vielleicht auch nicht jedem, sodass derjenige, der dieses Zitat dann bekommt, das nicht erkennt, der nutzt es eigentlich, der Anwender nutzt es dann einfach, ohne halt das als Zitat anzugeben, was passiert dann?
Fritz Ulli Pieper:Dann ist es son bisschen so ähnlich wie wie wir eingangs drüber gesprochen haben, wenn ich was überlege, was Kreatives, was woran das Urheberrecht entsteht, ich hab das Inpute die das KI Modell nutzt es dann weiter. Das ist hier ähnlich, ne. Dann arbeitet das KI Modell mit einem möglicherweise urheberischützlichen Werk oder Werksteil, nämlich mit dieser Passage, Textpassage. Und wenn das dann ausgespuckt wird, ohne es zu kennzeichnen, dann ändert das nichts daran, dass das 'n urheberrechtlich geschützter Werkteil ist, ja. Und wenn ich den dann, also das machen, ich glaub, KI Modelle machen das so eigentlich nicht.
Fritz Ulli Pieper:Die arbeiten ja auf Basis von unfassbar vielen Daten, die auf eine bestimmte Art und Weise verknüpft und zusammengesetzt werden in dem jeweilige Fragekontext und dass dann wirklich aus den Trainingsdaten genau dieser eine Satzteil, Bestandteil so übernommen und ausgespuckt wird, das passiert relativ selten. Aber jetzt mal unterstellt, das passiert, dann ändert sich nichts am urheberrechtlichen Schutz dieses Teils, dieses Werkteils. Und dann hab ich auch als Nutzer ein Problem, denn ich nutze das, welches veröffentliche, vervielfältige, das sind alles urheberrechtsrelevante Handlungen, wo ich eigentlich eine Erlaubnis für bräuchte. Und wenn ich das ohne Erlaubnis nutze, dann handle ich möglicherweise urheberrechtswidrig. Und ich, wenn ich's in 'nem Zitatkontext verwenden wollen würde, weil ich beispielsweise wissenschaftliche Arbeit schreibe oder einen Artikel, 'n Presseartikel schreibe, dann könnte ich's vielleicht nutzen nach diesem Zitatrecht, das eingangs erwähnt ich habe.
Fritz Ulli Pieper:Dann müsste ich's aber auch entsprechend kennzeichnen.
Ulla Coester:Es gibt ja KI Anwendungen, die auch Bilder generieren, wie zum Beispiel MidJourney. Was ist denn, wenn ich von MidJourney mir ein Bild erstellen lasse? Muss ich das kennzeichnen? Kann ich sagen, also durch den Prompt ist das mein Werk geworden und ich kann da 'n Copyright drauf anmelden?
Fritz Ulli Pieper:Das ist ja auch also 1 der großen oder 1 der großen Zankapfel, glaub ich, wenn man aktuell über KI, generative AI, Urheberrecht spricht. Was ist eigentlich mit dem Output, der von solchen KI Modellen generiert wird urheberrechtlich? Also ich glaub, allgemeine Meinung oder sagen wir mal so, die aktuell, würd ich sagen, herrschende Ansicht in Juristen, in Fachkreisen ist, dass wenn wenn dieses KI Modell eben auf Basis dieser gigantischen Datensätze, keine Ahnung, ich mach jetzt 'n Prompt, Fußballspieler auf Wiese im Zweikampf mit einem Fußballer oder Fußballspielerin von 'nem Gegnerverein als Beispiel. Dann wird auf Basis dieser gigantischen Datensätze die entsprechende Bilder möglicherweise beinhalten. Woraus dann was Neues von der KI generiert wird, wird irgendwie jegliche Ähnlichkeit üblicherweise mit dem bestehenden Trainingsdatensatz mehr oder weniger verwischt, sodass da nichts, kein Verhältnis mehr erkennbar ist, sodass man eigentlich sagen müsste, die KI hat das eigenständig neu generiert.
Fritz Ulli Pieper:Und dann ist es so, dann ist es keine persönliche geistige Schöpfung mehr 1 Menschen. Und die braucht es aber, urheberrechtsschutzfähig zu sein. Und dann würde man tatsächlich sagen, ist 'n rein KI generierter Inhalt, daran kann eigentlich kein Urheberrecht entstehen. Und damit wäre das Bild dann im Umkehrschluss eigentlich automatisch gemeinfrei jetzt erst mal per se. Ja, das heißt, ich generier's und ich find's besonders schön.
Fritz Ulli Pieper:Denke, ich hab da jetzt 'n Urheberrecht dran, ich will's vielleicht sogar verkaufen, dann verkauf ich's an den ersten für 10 Euro ein Bild, ein eine Kopie, ein JPEG oder so. Ja, und der sagt sich, ach, das ist ja rein KI generiert, dann verkauf ich's mal für 15 weiter und man kann sozusagen nix machen. Gibt's sogar 'n schon 'n interessanten Fall in den USA, da hat ein, ja, KI Künstler hat mittels Tausender, also wirklich wahnsinnig aufwendiger Prompts ein wirklich unfassbar beeindruckendes riesengroßes Bild erstellen lassen. Und da hat er dann versucht, Urheberrechtsschutz drauf zu beanspruchen. In USA muss man wissen, funktioniert es noch 'n kleines bisschen anders, aber machen wir mal das Beispiel so im Vergleich.
Fritz Ulli Pieper:Und da wurde ihm gesagt, es ist uns egal, wie viel und aufwendig Du gepombt hast, der Output kommt immer von diesem KI Modell und deswegen kannst Du darauf kein Urheberrecht beanspruchen. Und das ist son bisschen der Parallelfall hier, sag ich mal. Dann ist nur noch die Frage, was ist denn eigentlich mit Proms selber? Da könnte man noch drüber nachdenken, ob die irgendwie so kreativ sind, dass die vielleicht Urheberschutz genießen. Und aber das also müssten sie schon extrem aufwendig und kreativ sein und und im Zusammenhang wie son Promptbuch oder so gelesen werden können.
Fritz Ulli Pieper:Das ist mir jetzt bislang jedenfalls nicht bekannt, dass so was existiert.
Ulla Coester:Das ist wirklich spannend. Also das Gleiche würde ja dann auch für Texte gelten. Also der Prompt macht mich nicht zum, der geniale prompt macht mich nicht zum Urheber.
Fritz Ulli Pieper:In Deutschland gibt's zum Beispiel auch noch keine Gerichtsentscheidungen dazu, ob sich das nicht irgendwann mal ändert. Deswegen beispielsweise auch, ne, dieses Beispiel aus den USA, da hat jemand, ich weiß nicht, Monate wahrscheinlich, geproptet und dieses Bild erstellt. Trotzdem wurde ihm gesagt, sorry, leider kein Urheberrechtsschutz.
Ulla Coester:Also ich hab gelesen, es gibt 'n neues Tool, das einem eine komplette Onlinezeitung erstellen kann, also sowohl das Layout als auch die Inhalte. Ich muss nur vorgeben, ich möchte gerne eine liberale Zeitung erstellen zum Beispiel. Und dann werden die Texte also so generiert, dass eine liberale Onlinezeitung entsteht. Das würde ja bedeuten, wenn jetzt wirklich 'n vielleicht strafbarer Inhalt da produziert würde, dass ich gar nicht dafür verantwortlich bin, weil es erstellt ja die KI.
Fritz Ulli Pieper:Ich glaub, ganz so einfach ist es nicht, ne. Sagen wir mal, da steht eine Beleidigung drin. Dann ist der Tatbestand der Beleidigung durch, ich sag mal, Veröffentlichung dieses Artikels, gehen wir jetzt mal davon aus, ist erfüllt, ja. Dann ist irgendwie ein Straftatbestand nach dem deutschen Strafgesetzbuch betroffen. Und ich sag mal so, dann kommt's son bisschen darauf an, wer hat das geschrieben, wer hat es herausgegeben?
Fritz Ulli Pieper:Bei Presse ist es halt noch mal auch 'n bisschen was Besonderes. Da gibt es, sag ich mal so, Verantwortlichkeitsregelungen, Zurechnungsregelungen. Da wird ja zum Beispiel gefordert, dass ein verantwortlicher Redakteur beispielsweise für eine Publikation auch medienrechtlich, inhaltsrechtlich inhaltlich verantwortlich ist für das, was in der Zeitung da drinsteht, dann draußen gegeben wird. Und dann könnte es sein, dass er möglicherweise oder sie als Verantwortlicher nach den darunterliegenden gesetzlichen Regularien eben verantwortlich gemacht wird, ne. Und dann könnte es sein, dass dieser Redakteur, diese Redakteurin sich dann wegen dieser Beleidigung, die da veröffentlicht wurde, strafkräftig verantworten müsste.
Fritz Ulli Pieper:Also da geht's jetzt weniger so darum, dass eine KI das generiert hat. Da geht's mehr darum, was auch immer generiert wurde, ist tat wahrscheinlich eine Beleidigung und es wurde veröffentlicht, sodass das auch 'ner Masse zugänglich war. Da wird dann sozusagen die Zurechnung beispielsweise an diese Verantwortlichen dieser Publikationen weitergeleitet, könnte man so sagen.
Ulla Coester:Bei Lügen funktioniert das nicht, weil ich kann mir ja quasi per KI jede Meinung, die ich habe, die vielleicht auch wissenschaftlich nicht haltbar ist, nachweisen lassen und veröffentlichen.
Fritz Ulli Pieper:Genau, Lügen ist nicht strafbar. Es ist, man könnte sagen, son Stück weit Form der Meinungsäußerung auch. Kommt vielleicht bisschen auf den Kontext an, aber genau. Ich kann die abstruseste Theorie vertreten. Ist einfach 'n 'n Auswuchs, wie gesagt, von der verfassungsrechtlich garantierten Meinungsfreiheit vielleicht, je nach Situation auch der Pressefreiheit möglicherweise.
Fritz Ulli Pieper:Wenn's Fakten geht, ich stelle Fakten dar, wo wo jeder weiß, die sind dem Beweis zugänglich. Das ist unumstößlich, da kann ich nicht nein sagen. So, die Sonne scheint heute, da muss man nur zum Himmel gucken und dann sieht man das, wenn keine Wolke am Himmel ist, sag ich mal, ne. Das ist 'n Fakt, den kann ich irgendwie wissenschaftlich beweisen so. Da wenn ich da sage, ist nicht so, dann kann man, das machen ja auch viele, das ist son bisschen diese Fake News Debatte, ne, kann man sagen, okay, verstehe ich nicht so ganz, warum er oder sie das jetzt sagt.
Fritz Ulli Pieper:Ist ja völlig eindeutig, dass das sorry Bullshit ist sozusagen. Dann kann der oder diejenige zwar immer noch sagen, das ist meine Meinung, aber da weiß man eigentlich, ist Quatsch. Das ist 'n Fakt so, hat nichts mit Meinungen zu tun. Aber genau umgekehrt, wenn's darum geht, heute ist ein schöner Tag, dann kann man auch sagen, egal wie toll die Sonne scheint, man hat eigene persönliche Dinge in sich, ne, mit denen man sich grad rumschlägt, dann kann man sagen, nein, finde ich eben nicht. Und dann ist es eine Meinungsäußerung und das geht halt bis hoch zu auch Hate Speech, wenn das jetzt eben nicht beleidigend strafrechtlich relevant ist, vielleicht auch Lügen sozusagen, ne.
Fritz Ulli Pieper:Das ist dann alles dadrunter gecovert, sag ich mal, ja.
Ulla Coester:Wir haben ja jetzt schon viel über Trainingsdaten diskutiert. Manche Leute veröffentlichen ja sehr viel im Internet über Zeitungsartikel. Was ist eigentlich, wenn diese Artikel oder Interviews genutzt werden als Trainingsdaten und ich irgendwann zufällig merke, also genau das, was jetzt hier als Prompt rausgegeben wird, beziehungsweise was als Ergebnis aufm Prompt rausgegeben wird, das ist das, was ich geschrieben habe. Was kann ich da machen?
Fritz Ulli Pieper:Auch 1 der 2, 3, sag ich mal, riesengroßen Themen im Zusammenhang mit KI und Urheberrecht. Ich mein, mit 'nem Beispiel antworten, die New York Times hat ja eine groß angelegte Klage gestartet gegen die Nutzung von ihren Artikeldaten, nenn ich's jetzt mal, Artikelinhalten durch Large Language Models, durch KI Modelle, weil offenbar rausgekommen ist, dass also die ja beispielsweise das Web oder ne, bestimmte Plattformen je nach Interessen und Anwendungsbereich dieses KI Modells. Also eine ganz besonders wichtige Art, Daten für die zu sammeln, ist unter anderem Web Crawling, sag ich jetzt einfach mal, ne. Es gibt noch andere Datentöpfe, aber das ist sehr verbreitet und es ist ja auch naheliegend, ne. Es gibt keine so tolle, sag ich mal, Informations vielfältige Informationsquelle und Landschaft wie das Internet mit Zeitschriften, Zeitungswebseiten, Blogs, wie Sie grad schon gesagt haben, LinkedIn oder oder Xing, wo sehr viele Texte draufstehen.
Fritz Ulli Pieper:Und das zu durchforsten wäre wahrscheinlich auch mein erster Gedanke als jemand, der mit ganz vielen Daten ganz viel Trainingsinput sich holen möchte. Urheberrechtlich ist es jetzt so, dass diese Inhalte auf diesen Webseiten grundsätzlich natürlich auch erst mal, wenn die eben, ne, persönliche geistige Schöpfung, Schöpfungsfähig erreicht haben et cetera, dass die dann auch urheberrechtlich geschützt sind. Und dann hab ich als Verlag oder auch als Autor, je nachdem hab ich das Recht, die im Internet hochzuladen, zu veröffentlichen. Und die darf man dann auch erst mal nicht einfach so übernehmen. Also im Wesentlichen würde das hier in eine Vervielfältigung gehen.
Fritz Ulli Pieper:Jemand scrollt den Text bei sich aufn Server mit, keine Ahnung, 3000000000 anderen Texten als KI Modellanbieter, damit 'n eigenes Modell zu trainieren. Dann würde ich sonen Text vervielfältigt haben. Und für sone Vervielfältigung brauch ich sozusagen wie so was wie eine Rechtsgrundlage, entweder eine Schranke ausm Urheberrecht oder jemand stimmt zu beispielsweise. Und das hab ich per se jetzt erst mal nicht. Es sei denn, da steht son riesen Disclaimer gleich auf Seite 1 der Webseite, jeder darf meine Texte nutzen, ne.
Fritz Ulli Pieper:Oder es ist sone CC Lizenz, Creative Commons, muss man's ja auch entsprechend kennzeichnen, darf man das weiterverwerten. Aber das sind so schon wieder Spezialfälle generell erst mal, dann ist das meins und dann darfst auch erst mal kein anderer Nutzen, kopieren, vervielfältigen. Es gibt aber auch da im deutschen Urheberrecht, das kommt aus Europa, aus dem europäischen Vorgaben, eine sogenannte Schranke. Und das ist die Schranke fürs Text- und Data Mining. Da wird eigentlich schon gesagt, dass wenn ich, also es wird nie so wortwörtlich gesagt, aber man kann da rauslesen, wenn ich KI Modelle trainieren möchte, dann darf ich solche Datensätze durch Forsten kurzfristig kopieren fürs Training und dann muss ich's aber auch wieder löschen.
Fritz Ulli Pieper:Das ist son bisschen umstritten alles jetzt grade in der Rechtswissenschaft, ob das wirklich auch fürs breit großflächige Training von KI Modellen überhaupt anwendbar ist. Und dann gibt's da auch noch eine Einschränkung drin, wenn ich das nicht möchte als Webseitenbetreiber, als als als Verlag, der Onlinemedium rausbringt, dann kann ich auf meine Webseite zum Beispiel irgendwo einen maschinenlesbaren Hinweis setzen. Ich möchte nicht, dass Du, liebe KI, hier meine Webseite crawst und die Inhalte vervielfältigst, dich zu trainieren. Das ist wieder sone Rückausnahme von dieser Schranke sozusagen. Und dann hat eigentlich, soll es damit dem Urheber sozusagen gegeben sein, die Möglichkeit zu sagen, möcht ich oder möcht ich nicht.
Fritz Ulli Pieper:Im Detail, also ist auch die Frage, muss das ins Impressum, muss es 'n eigenen Webseitenbefehl dafür geben, muss es in die Robots Punkt Text Datei? Da gibt's ja diverse Möglichkeiten und nichts genaues weiß man leider noch nicht, wo das am besten aufgehoben ist und wo es wirksam maschinenlesbar mitgeteilt wurde. Da ist noch sehr, sehr, sehr, sehr viel im Fluss, deswegen wird da auch sehr, sehr viel drüber gestritten. Aber auf jeden Fall sehr spannendes Thema und das sind so die Grundlagen. Und da muss man auf jeden Fall genau hingucken, wie sich da jetzt auch die Rechtsprechung dann weiterentwickelt.
Ulla Coester:Bedank ich mich erst mal recht herzlich und freu mich schon auf unseren nächsten Podcast. Ja,
Fritz Ulli Pieper:herzlich gerne. Ich freu mich, wenn 'n paar Denkanstöße dabei waren und ich freu mich auch auf den nächsten Podcast. Vielen Dank.
Michael Voregger:Wir werden das Thema künstliche Intelligenz und Vertrauen natürlich noch weiter vertiefen. Es wird also weitere Podcast dazu geben. Bis dahin, danke
Fritz Ulli Pieper:und tschüs.