文著协张洪波：高质量数据对AI至关重要，应重视版权保护

南方都市报APP • AI前哨站

原创2024-12-20 09:10

12月18日下午，由南都数字经济治理研究中心、清华大学智能法治研究院主办的第八届啄木鸟数据治理论坛在北京举行。本次论坛聚焦“AI应用落地提速，如何向善治理”，众多专家学者进行了深入讨论。

中国文字著作权协会常务副会长兼总干事张洪波在第八届啄木鸟论坛

中国文字著作权协会常务副会长兼总干事张洪波在论坛上分享了他对生成式人工智能数据使用的版权边界与利益平衡的看法。

“我们呼吁关注版权保护的重要性，人工智能要高质量发展必须得有版权内容，没有版权内容成了无源之水。”他认为，在AI时代，既要保护创作者和内容生产者的合法权益，又要激发全社会的创新创造活力。二者共同作用，才能推动产业的高质量发展。

AI技术发展中，高质量数据是竞争力源泉

在人工智能时代，数据被比作“养料”，尤其对于生成式AI和深度学习系统来说，高质量数据至关重要。张洪波指出，生成式AI的发展离不开大规模的数据训练，而这些数据的质量直接影响到AI的输出效果和专业性。

他进一步区分了两类数据：一类是普遍的网络爬取数据，虽然有一定价值，但缺乏专业性和精确度；另一类是高质量数据，这类数据对专业领域尤其重要，通常需要通过合法合规的方式获取。

张洪波强调，在AI技术的发展过程中，高质量数据是竞争力的源泉，能够为人工智能提供更准确、更专业的训练材料。这使得数据获取和使用成为推动AI技术发展的关键因素。

将数据投喂AI，建议明确“合理使用”具体范围

紧接着，张洪波重点讨论了AI在使用数据进行训练时可能面临的版权问题。他强调，AI技术的应用必须遵循现有的法律框架，特别是要确保数据来源的合法性和合规性。例如，在生成式AI的语料库建设、大模型训练和应用中，AI开发者应确保所使用的数据已经获得授权，而非简单依赖“合理使用”的概念。

“合理使用”原则是指在特定条件下，法律允许他人使用受著作权保护的作品，无需征得权利人同意，也无需支付报酬。该原则旨在平衡版权人和公众的利益，促进知识传播。

当天，南都数字经济治理研究中心发布的《生成式AI用户风险感知和信息披露透明度测评报告（2024）》显示，仅有11.23%的人赞同将版权作品用于训练大模型纳入“合理使用”范畴，而高达42.72%的人认为必须征得版权人同意方能使用，还有43.33%的人认为需要分情况讨论。

不仅如此，法律工作者和高校科研者在“合理使用”问题上的态度也较为摇摆。报告显示，59.32%的法律工作者和54.55%的高校科研人员认为，应根据具体情况来判断是否纳入“合理使用”。

“将AI应用一概视为‘合理使用’是武断的，需要更为细致的法律规定和审查。”为此，张洪波建议，国家有关部门在修改完善著作权法律法规、制定相关政策和司法解释时，应当在现行著作权法第24条框架下，明确人工智能适用“合理使用”的应用场景、范围和条件。

他还提到根据“三步检验法”，判断AI是否能够合理使用他人版权作品需要满足以下条件：一是不得影响原作品的正常使用；二是不得不合理地损害版权人的合法权益；三是不得构成新作品的实质或核心部分，不能对原作品构成实质性替代或竞争关系。

应推动技术创新与版权保护实现平衡

作为文著协负责人，张洪波强调了集体管理组织在版权保护中的重要作用。他表示，通过集体管理，文著协可以帮助作品的权利人统一授权，从而避免版权问题引发的纠纷。尤其在AI使用受版权保护的数据时，文著协能够提供合法授权渠道，确保技术开发者在合规框架内使用版权内容。

随着人工智能技术的不断进步，关于版权补偿的问题逐渐浮现。张洪波提到，文著协将积极参与制定合理的版权补偿标准，特别是为AI训练数据的使用提供合理的补偿机制，以保护版权人的权益。

最后张洪波强调，政府部门应牵头，结合专家学者的意见，制定相关政策，为AI技术的版权实践提供指导。他认为，文著协可以帮助行业理解和遵守版权法律，推动行业自律，确保技术创新与版权保护之间的平衡。此外，文著协还应为版权授权机制的建立和产业的高质量发展提供政策建议和支持。

采写：南都记者黄莉玲发自北京

编辑：李玲

南都新闻，未经授权不得转载。授权联系方式
banquan@nandu.cc. 020-87006626

本文作者

AI数字人进医院中山三院训练AI数字护士做健康宣教

01:21