Elementos filtrados por fecha: Abril 2026

ENTRENAMIENTO DE IAG Y DERECHOS DE AUTOR: ¿USO JUSTO O APROPIACIÓN MASIVA? ESTADO DE LA CUESTIÓN.

(La autora es estudiante de la XX edición del Máster en Propiedad Intelectual, Industrial y Nuevas Tecnologías)

La irrupción de la inteligencia artificial generativa (en adelante, IAG) ha dado lugar a uno de los debates jurídicos más complejos de los últimos años, especialmente en relación con su funcionamiento y con los datos empleados en su desarrollo. Esta problemática se centra en una cuestión clave: ¿el entrenamiento de la IAG constituye un uso legítimo de las obras o una infracción sistemática del derecho de autor? En esta entrada, abordaremos esta cuestión desde una perspectiva comparada.

El argumento de las empresas tecnológicas, aunque hasta ahora les haya resultado eficaz, presenta importantes debilidades. Estas sostienen que el entrenamiento de sus modelos es una forma legítima de aprendizaje automatizado, negando el uso de obras protegidas o alegando no poder determinarlo con certeza, y amparándose en el secreto empresarial para no revelar los datos utilizados. Sin embargo, resulta difícil encontrar otros sectores en los que las empresas desconozcan la composición de sus propios activos o eludan las exigencias normativas sin asumir consecuencias. La conclusión parece clara: si no pueden cumplir dichas exigencias, tampoco deberían poder invocar el beneficio de los límites previstos en la norma.

Para comprender la gravedad de la cuestión, conviene atender a algunos datos especialmente reveladores. Solo el sector cultural español genera más de 700.000 empleos y representa alrededor del 3 % del PIB. A nivel europeo, cerca de 8 millones de personas trabajan en las industrias culturales y creativas, y la Unión Europea ha destinado 2.440 millones de euros para el periodo 2021–2027. No estamos, por tanto, ante un debate meramente simbólico, sino ante un mercado con una relevancia económica propia y significativa.

A continuación, analizaremos brevemente cuáles son las normativas vigentes que regulan esta situación y cuáles son los límites legales a los que se acogen los operadores tecnológicos para continuar su actuación.

  1. Marco normativo: Opt-out y Fair use

Europa:

A nivel europeo, la Directiva 2019/790 (1) sobre derechos de autor en el mercado único digital introduce en su artículo 4 una excepción obligatoria de minería de textos y datos (text and data mining o TDM). Esta permite la reproducción y extracción de obras tanto para fines de investigación científica (artículo 3) como, de forma más amplia, para cualquier finalidad legítima (artículo 4), siempre que el titular de los derechos no haya reservado expresamente su uso mediante mecanismos legibles por máquina (el denominado opt-out).

No obstante, este límite presenta diversas deficiencias. En primer lugar, el ejercicio de los derechos de propiedad intelectual queda condicionado a un indeterminado estándar de “finalidad legítima”, una noción abierta sujeta a la interpretación de los propios operadores, cuyo interés principal radica en la adquisición y explotación de las obras.

En segundo lugar, su aplicabilidad resulta discutida, ya que la minería de textos y datos no fue concebida para el entrenamiento de modelos de inteligencia artificial generativa, sino para el análisis de grandes volúmenes de información.

En tercer lugar, el requisito de acceso legítimo a las obras se ve comprometido en la práctica, puesto que algunos conjuntos de datos utilizados para entrenar modelos proceden de fuentes no autorizadas o ilícitas, como LibGen, LAION o BOOK3, lo que cuestiona el presupuesto de licitud exigido por la normativa.

Por último, el sistema de opt-out presenta una eficacia limitada. Una vez realizado el entrenamiento, su reversión resulta extremadamente compleja. A ello se suma la marcada asimetría entre los titulares de derechos y los grandes operadores tecnológicos, así como las dudas sobre su coherencia con los estándares internacionales de protección del derecho de autor, en particular en relación con la efectividad de los derechos exclusivos reconocidos en el Convenio de Berna.

Ante las insuficiencias del régimen de minería de textos y datos, el Reglamento de Inteligencia Artificial de la Unión Europea (AI Act) (2),  adoptado en junio de 2024, introduce obligaciones específicas para los modelos de IA de uso general, entre las que destacan la elaboración de un resumen suficientemente detallado del contenido utilizado en el entrenamiento, con el fin de garantizar una cierta trazabilidad de las fuentes (art. 53.1 d), y el establecimiento de políticas internas orientadas a asegurar el cumplimiento del Derecho de la Unión en materia de propiedad intelectual, especialmente en relación con los derechos de autor (art. 53.1 c). Estas exigencias se refuerzan en el considerando 107, que subraya la necesidad de facilitar a los titulares el ejercicio y la defensa de sus derechos frente al uso de sus obras en el entrenamiento de sistemas de inteligencia artificial. Aun así, en la práctica este régimen de transparencia aún dista de ser plenamente efectivo.

Estados Unidos:

Por otro lado, en contraposición al sistema de opt-out europeo, se sitúa la doctrina del fair use en el ordenamiento jurídico estadounidense. Esta doctrina, recogida en el §107 del Copyright Act de 1976, permite, en determinados supuestos, el uso de obras protegidas sin necesidad de autorización del titular. A diferencia de los sistemas basados en excepciones cerradas, el fair use opera como una cláusula abierta cuya aplicación se determina caso por caso.

El §107 recoge, además, una enumeración no exhaustiva de finalidades que pueden justificar el uso, como la crítica, el comentario, la información periodística, la enseñanza o la investigación. No obstante, la inclusión en esta lista no garantiza por sí sola la aplicación del fair use. Para determinarlo, los tribunales deben ponderar conjuntamente cuatro factores.

El primero es el propósito y carácter del uso. Aquí se analiza si tiene una finalidad comercial o no lucrativa y, sobre todo, si es transformativo, es decir, si añade un nuevo significado o mensaje a la obra original. Este criterio, aunque no figura expresamente en la ley, fue desarrollado por el juez Pierre Leval y consolidado por el Tribunal Supremo en Campbell v. Acuff-Rose Music, Inc. (1994). Más recientemente, en Andy Warhol Foundation v. Goldsmith (2023),

el Tribunal Supremo ha precisado su alcance, señalando que no basta con una mera alteración estética, sino que debe concurrir un propósito sustancialmente diferente.

El segundo factor atiende a la naturaleza de la obra original, distinguiendo entre obras fácticas, que reciben una protección más limitada, y obras creativas, en las que el margen para la aplicación del fair use es más reducido.

El tercer factor se refiere a la cantidad y sustancialidad de la parte utilizada, valorando no solo la extensión del fragmento reproducido, sino también su relevancia cualitativa, de modo que la utilización del «corazón» de la obra puede operar en contra incluso cuando la porción empleada sea reducida.

Por último, el cuarto factor examina el efecto del uso sobre el mercado potencial o el valor de la obra, en particular si el nuevo uso actúa como sustituto de la obra original o de sus explotaciones derivadas.

Estos factores no son exhaustivos ni se aplican de forma mecánica, sino que se ponderan conjuntamente según las circunstancias del caso. Esta flexibilidad permite adaptarse a nuevas realidades tecnológicas, pero genera incertidumbre jurídica al ser difícil prever el resultado hasta una decisión judicial.

  1. Litigios que podrían fijar las reglas globales

Getty Images:

Uno de los casos más sonados en los últimos meses ha sido el de Getty Images contra Stability AI. La empresa, especializada en la distribución y licencia de imágenes, presentó demandas en dos jurisdicciones distintas: en Estados Unidos, ante el U.S. District Court for the District of Delaware (caso n.º 1:23-cv-00135, de 3 de febrero de 2023), y en Reino Unido, ante la High Court of Justice, Business and Property Courts of England and Wales, Intellectual Property List (Chancery Division) (caso n.º IL-2023-000007, de 16 de enero de 2023).

En ambos procedimientos, Getty Images alegó que Stability AI había copiado e infringido los derechos de autor de millones de fotografías de su catálogo para entrenar su modelo de generación de imágenes, Stable Diffusion, sin obtener licencia ni consentimiento. Asimismo, sostuvo que las imágenes generadas por dicho sistema reproducían en ocasiones incluso su propia marca de agua, lo que, a su juicio, evidenciaba el uso                       no autorizado de ese material y la capacidad del modelo para emular obras protegidas.  Esta circunstancia puede generar confusión en el público sobre el origen de las imágenes y, además, menoscabar el valor comercial de la marca y dañar la reputación de la compañía, al asociar su signo distintivo con contenidos sintéticos que no han sido producidos ni autorizados por ella.

  1. a) En el Reino Unido, donde no existe un equivalente al fair use estadounidense, sino un sistema de excepciones tasadas (fair dealing) y una excepción específica de text and data mining, la reclamación se articuló principalmente en torno a la infracción primaria y secundaria de copyright conforme a la Copyright, Designs and Patents Act 1988 (CDPA). Asimismo, se ejercitaron acciones por infracción de derechos sobre bases de datos, infracción de marca registrada en virtud de la Trade Marks Act 1994 y passing off.

La sentencia británica fue dictada el 4 de noviembre de 2025 por Mrs Justice Joanna Smith. Sin embargo, Getty Images acabó abandonando sus reclamaciones por infracción primaria de copyright poco antes de los alegatos finales, al considerar que no existían pruebas suficientes de que el entrenamiento y desarrollo de Stable Diffusion se hubieran llevado a cabo en territorio del Reino Unido. En consecuencia, las cuestiones efectivamente resueltas en la sentencia se limitaron a la infracción secundaria de copyright y a la infracción de marca registrada.

En relación con la infracción secundaria, el Tribunal debía determinar si los «pesos» (model weights) de Stable Diffusion constituían una «copia infractora» (infringing copy) de un «artículo» (article) a efectos de las secciones 22 y 23 de la CDPA. La jueza concluyó, en primer lugar, que un modelo de IA puede constituir un «artículo» a estos efectos, incluso en formato intangible. No obstante, consideró que los model weights no constituían una copia infractora, al no almacenar ni contener reproducciones de las obras de Getty. En palabras de la propia sentencia: «the Model itself does not store any of those Copyright Works; the model weights are not themselves an infringing copy and they do not store an infringing copy. They are purely the product of the patterns and features which they have learnt over time during the training process» (párrafo 600). En consecuencia, la reclamación por infracción secundaria fue desestimada.

En materia de marca registrada, el Tribunal sí apreció una infracción, aunque de alcance limitado. Conforme a las secciones 10(1) y 10(2) de la Trade Marks Act 1994, se declaró probada la infracción respecto de las marcas de agua «iStock» y «getty images» reproducidas por versiones antiguas del modelo, al considerar que Stability AI era la entidad con control efectivo sobre la generación de dichas marcas y que su aparición en imágenes sintéticas podía generar en el consumidor medio la impresión de una vinculación comercial con Getty Images. Sin embargo, la reclamación basada en la sección 10(3) (daño a marca con reputación) fue desestimada, al no acreditarse perjuicio económico efectivo, dilución de la marca ni aprovechamiento indebido de su prestigio. La propia jueza calificó sus conclusiones como «both historic and extremely limited in scope».

  1. b) En Estados Unidos, donde la defensa del fair use (§107 del Copyright Act) constituye el eje central de la posición de Stability AI, la demanda abarcó un conjunto más amplio de reclamaciones. Entre ellas, la infracción de copyright (tanto en la fase de entrenamiento como en los outputs), la infracción de marca, la competencia desleal, la dilución de marca y posibles vulneraciones de la Digital Millennium Copyright Act (en adelante, DMCA).

Tras años de disputas jurisdiccionales ante el tribunal de Delaware, Getty Images desistió voluntariamente de aquella demanda el 14 de agosto de 2025 y, ese mismo día, presentó una nueva ante el U.S. District Court for the Northern District of California (caso n.º 3:25-cv-06891), asignada a la jueza Trina L. Thompson. El procedimiento se encuentra aún en una fase inicial, con una moción de desestimación presentada por Stability AI en la que, entre otros argumentos, se sostiene que las imágenes distorsionadas generadas por el modelo no son suficientes para fundamentar las reclamaciones de dilución ni de infracción de marca.

A diferencia del procedimiento británico, la cuestión territorial no constituye aquí un obstáculo, dado que las pruebas apuntan a que el entrenamiento de Stable Diffusion se realizó en territorio estadounidense. En consecuencia, las reclamaciones por infracción primaria de copyright y, con ellas, la defensa del fair use, podrán ser objeto de un enjuiciamiento pleno.

GEMA v. OpenAI

Otro caso reciente de gran relevancia se produjo también en noviembre de 2025, cuando el Landgericht München I (Tribunal Regional de Múnich I) dictó sentencia en el asunto GEMA v. OpenAI (caso n.º 42 O 14139/24, de 11 de noviembre de 2025), declarando que OpenAI infringió los derechos de autor de compositores y letristas alemanes al entrenar sus modelos de lenguaje GPT-4 y GPT-4o con letras de canciones protegidas sin licencia. GEMA, la entidad encargada de la gestión de derechos musicales en Alemania, calificó el fallo como la primera sentencia relevante sobre IAG en Europa.

El Tribunal consideró que el hecho de que las letras queden memorizadas dentro de los parámetros del modelo constituye un acto de reproducción, conforme al artículo 2 de la Directiva InfoSoc (3) y al §16 de la Ley alemana de Propiedad Intelectual (UrhG). Asimismo, resolvió que toda reproducción en los outputs generados por ChatGPT supone un acto adicional de reproducción y comunicación pública no autorizado. Por tanto, se rechazó la aplicación de la excepción de TDM (§44b UrhG), al entender que la memorización íntegra de las obras excede el mero análisis de información permitido por dicha excepción.

Finalmente, el Tribunal atribuyó la responsabilidad a OpenAI como entidad responsable del entrenamiento y funcionamiento del sistema. La empresa ha anunciado su intención de apelar, por lo que este criterio podría ser revisado e incluso dar lugar a una cuestión prejudicial ante el Tribunal de Justicia de la Unión Europea. No obstante, si esta línea interpretativa se consolida, las empresas de IA que operen en Europa podrían verse obligadas a negociar licencias masivas o a acreditar el cumplimiento estricto de los mecanismos de opt-out.

  1. Francia: la presunción de uso como arma regulatoria

Francia ha dado un paso potencialmente transformador al plantear una inversión de la carga de la prueba. El 8 de abril de 2026, el Senado francés aprobó por unanimidad una proposición de ley que introduce una «presunción de uso» (art. L. 331-4-1 CPI). En la práctica, ello supone presumir la responsabilidad de la empresa cuando existan indicios de utilización no autorizada de contenidos culturales, de modo que corresponde a las empresas tecnológicas demostrar que no han vulnerado derechos, y no a los creadores probar la infracción. Pese al respaldo unánime del Senado, el proceso legislativo sigue abierto y su tramitación en la Asamblea Nacional se prevé aún incierta.

Si esta iniciativa llegara a prosperar, podría convertirse en un precedente decisivo en la Unión Europea y ejercer presión sobre otros Estados para adoptar soluciones similares. No obstante, este desarrollo plantea todavía numerosas dudas, en particular en relación con si la exigencia de transparencia sobre los datos y métodos de entrenamiento puede frenar la innovación y situar a la UE en desventaja competitiva. Además, acreditar que un modelo no ha utilizado determinados datos puede resultar extremadamente complejo en la práctica.

  1. Conclusiones

El debate sobre el entrenamiento de la IAG y los derechos de autor no es solo un debate jurídico, sino también una cuestión relativa a la configuración de las reglas en una industria que ya se encuentra plenamente en funcionamiento. Los marcos normativos actuales resultan insuficientes y, mientras la regulación avanza, los modelos continúan entrenándose sin una remuneración efectiva para los creadores y con escasa transparencia sobre los datos utilizados.

El marco jurídico comienza a evolucionar con mayor rapidez, pero la cuestión de fondo permanece abierta: si es posible reconfigurar e imponer nuevas normas en una industria que lidera la carrera tecnológica, de modo que se garantice una protección efectiva de los derechos frente al uso masivo de obras ajenas sin autorización.

 - - - - - - - - - - - - 

Notas a pie:

(1)  Directiva (UE) 2019/790 del Parlamento Europeo y del Consejo, de 17 de abril de 2019, sobre los derechos de autor y derechos afines en el mercado único digital y por la que se modifican las Directivas 96/9/CE y 2001/29/CE. España transpuso esta directiva mediante el Real Decreto-ley 24/2021.

(2)  Reglamento (UE) 2024/1689 del Parlamento Europeo y del Consejo de 13 de junio de 2024 por el que se establecen normas armonizadas en materia de inteligencia artificial y por el que se modifican los Reglamentos (CE) n.o 300/2008, (UE) n.o 167/2013, (UE) n.o 168/2013, (UE) 2018/858, (UE) 2018/1139 y (UE) 2019/2144 y las Directivas 2014/90/UE, (UE) 2016/797 y (UE) 2020/1828 (Reglamento de Inteligencia Artificial).

(3)  Directiva 2001/29/CE del Parlamento Europeo y del Consejo, de 22 de mayo de 2001, relativa a la armonización de determinados aspectos de los derechos de autor y derechos afines a los derechos de autor en la sociedad de la información.

 

Suscribirse a este canal RSS