当前人工智能领域的核心争议聚焦于大语言模型(LLM)及其训练数据引发的问题。一系列法律疑问随之产生:LLM 能否使用受版权保护的数据开展训练?该过程构成侵权还是合理使用?其生成内容属于衍生创作还是单纯复制?围绕创作者权利、创新与 AI 的新纠纷每日涌现。印度商业和工业部近期加入这场讨论,发布《生成式人工智能与版权工作文件》( “工作文件”)。
《工作文件》探讨印度版权法能否解决生成式 AI 引发的相关问题。它重点关注两大核心议题:用于训练的版权作品输入,以及 AI 生成内容的输出。工作文件第一部分聚焦前者,指出无法获取受版权保护的内容会引发“重大公共利益关切”。当然,这留下了一 个未解的基本问题:要求私人AI 模型获取版权训练数据何以能构成重大公共利益?不过,与工作文件所提出的混合许可模式存在的问题相比,这一不合理之处根本不值一提。
针对AI 的强制一揽子许可

管理合伙人
Obhan Mason
《工作文件》建议引入针对AI系统的强制一揽子许可,允许其使用受版权保护的作品,以换取法定报酬。该模式不仅独一无二,而且未经测试,因为它明确摒弃了其他法域已成熟可行的机制。
该模式排除了广受认可的选择退出机制,即允许权利人自主选择是否同意其作品用于训练。《工作文件》给出的理由是选择退出机制负担过重。由于所用数据缺乏透明度,选择退出机制实际上并不能帮助权利人。自愿或直接许可协议也因规模和交易成本带来的操作不便而被排除。《工作文件》推测,如果谈判失败,模型将无法获取相关内容,进而产生偏差。
美国版权局支持的延伸性集体许可模式同样被否决,因其属于条款可协商的自愿框架。英国采用的文本与数据挖掘例外条款也被认为存在不足,因为权利人可能不允许其作品用于训练,这将阻碍大语言模型访问大型代表性数据集的需求,从而降低大语言模型的质量。然而在该模式下,开发者无需另行获取许可即可“合法访问”受版权保护的材料,包括印度境外权利人的作品。
强制 AI 许可:希望与缺陷

顾问
Obhan Mason
该模式通过否决了零对价许可,即允许免费将版权内容作为训练数据,看似平衡了大语言模型的需求与创作者权利。该模式提议建立一个非营利政府机构,向开发者收取使用费,再分配给权利人。开发者无需与多方单独协商条款。
尽管初衷良好,该模式仍存在缺陷。其统一费率的收益分配机制意味着,权利人只能获得政府设定的固定费率获得使用费。有关权利人必须在官方机构注册,并且无条件接受有关定价。除了使用费定价机制及其实施缺乏清晰度外,该提议也未考虑对创意产业造成的负面经济影响:使用费将按照大语言模型 产生的收入比例计提。如果大语言模型未产生收入,即便权利人作品已被用于训练,也无法获得补偿。
该模式要求开发者自行申报用于训练的数据,以此换取使用所有版权作品的权限。这一机制看起来实际作用甚微。
越界的模式需切实改革
该模式或许具有创新性,但也过于激进且越出合理边界,它不符合《伯尔尼公约》第 9 条第 2 款及《与贸易有关的知识产权协定》第 13 条所允许的版权例外情形。
该模式试图平衡所有利益相关方的权利与需求,却徒增了规则复杂性和合规负担。鉴于它目前仅为一份工作文件,后续包容性利益相关方磋商应促成对现有法定框架更切实的评估。它们应产出基于原则、灵活、中立且可行的解决方案。
Essenese Obhan 是 Obhan & Associates律师事务所管理合伙人,Sumathi Chandrashekaran 是顾问。

Advocates and Patent Agents
N – 94, Second Floor
Panchsheel Park
New Delhi 110017, India
Contact details:
Ashima Obhan
T: +91 98 1104 3532
E: email@obhans.com | ashima@obhans.com












