面向机器学习的知识产权保护可以围绕以下五方面展开:训练集保护、训练参数保护、架构保护、机器学习系统保护、模型防复制保护。
训练集保护
为特定的机器学习应用创建出色的训练集是一项耗时耗财的工作。尽管在典型环境中,侵权人无法直接访问此训练集,但是如果通过某些方式获得了访问权限,那么复制训练集轻而易举。知识产权法律的作用正在于此。
如果训练集所有者的主要营业地点位于欧盟地区,那么训练集将受到数据库权利的保护。但是,这一权利仅对同样位于该司法管辖区的侵权者具有法律效力。
而更加困难的是能否针对机器学习训练集主张版权。训练集并不是一件艺术作品。其目的通常是确保数据适合用例。根据版权法的规定,针对主题创建合适的数据集并不是一项创造性活动。但是,仍然可以主张版权的一个方面是对数据进行分类的方式。如果类别是通过创造性过程(例如,“美丽/丑陋”、“强/弱”、“大/小”)进行筛选的,那么就可以认为通过创造性标记方式创造的训练集受到版权保护。基于事实要素(例如“猫/狗”、“交通信号灯/路灯/停车标志”)的分类不具备创造性,因此不受版权保护。
在某些应用领域,训练集是通过模拟或其他人工手段生成的。有另一种观点认为,这样的训练集可以受到版权保护,因为所选的模拟或生成方式可以看作是一种创造性选择。但是,这一观点从未在法庭上得到检验。
通常,公司会对其训练集严格保密。这种做法十分合理,因为使用机器学习模型无需共享训练集。避免训练集被恶意复制,并对需要拥有训练集的各方施加严格的契约约束似乎是最好的方法。
训练参数保护训练集和模型只是机器学习系统宝贵价值的一部分。驱动训练算法的参数也同样十分宝贵:选择正确的训练参数需要经验丰富的工程师花费大量时间和精力。
对于创建机器学习系统所用的训练参数集,版权保护是最有用的。如果数据科学家通过创造性工作来选择合适的训练参数,从而确定这些参数,那么最终得到的参数集就很有可能受到版权保护。但是,如果是通过详尽搜索(例如评估文献中提出的许多选项)或算法过程发现的训练参数,则不受版权保护。这一原则同样适用于使用这些训练参数和指定训练集生成的模型。
数据库权利可能不太适用于参数集,因为数据库权利的一个标准是集合中的各个元素必须系统地或有条理地排列。参数集很难符合这个标准。
架构保护系统架构是机器学习系统的基础。其设计是确保系统正常运行的关键要素。在完成训练后,架构就将投入使用。这类系统包含两部分:定义架构的图形和实现架构的软件。图形符合保护的条件与模型参数相同。从理论上讲,架构的创新硬件层面可以申请专利;但是由于这一领域的大多数创新基本只与软件有关,因此硬件专利不太现实。实施训练和/或推理的软件通常会受到版权保护,因为软件主要是通过创造性工作设计而成的。
机器学习系统保护理论上,使用精心选择的参数集编程并基于特定训练集训练的电脑系统属于可获专利的主题范围。但是,欧洲和美国的现行判例法要求系统的设计目标是执行现实世界中的任务,例如驾驶汽车或识别现实世界中的图像。对于以更抽象的方式运行的机器学习系统(例如,在现实世界中缺少特定用例的情况下,进行识别和/或分类),能否获得专利仍未可知。
就像任何其他软件一样,机器学习系统的软件一定可以受到版权保护。
机器学习系统的数据库权利在理论上是有争议的:争议点在于数据集可通过模型和执行该模型的软件进行搜索。但是,这一观点从未在法庭上或法律文献中得到检验。
模型防复制保护当机器学习系统在对公众没有契约或使用限制的情况下推出时,就可以使用某种独特的方法来复制其功能。本质上,抄袭者使用一个未分类项目数据集,并将每个项目提交到机器学习系统。每个答案都仔细地记录为抄袭者的数据集分类。从而获得一个带有标签的数据集,用来训练相似质量的模型。事实证明,即使数据集包含非问题域数据,并且目标系统和克隆系统的架构与模型参数不匹配,这一方法仍然有效。根据版权或数据库法律的规定,暂时无法界定这种行为是否合法。原始机器学习系统中的数据集未被复制;只是利用了系统输出,而且只用来标记另一个数据集。
如果数据集分类本身具有创造性,那么抄袭者可能会因为重复使用标签而侵犯版权。即使只是复制和复用标签以对完全独立的数据集进行分类,也有可能侵犯版权。但是,这一观点从未在法庭上得到检验。
举证责任
发现侵权者和在法庭上证明侵权是两件截然不同的事情。在知识产权诉讼案件中,举证责任可能难以实现。一般而言,法院需要得到充分的证据来确信很有可能存在侵权。被指控的侵权人没有义务提供相关证据。因此,如果需要的证据在侵权人的掌握之下,那么知识产权权利所有者就可能会遇到问题。一些司法管辖区允许扣押证据或要求当事方进行所谓的“透露”,但这并不能确保权利所有者得到所需证据。
根据版权法的规定,如果两个物品非常相似,那么法院可以反转举证责任:侵权人必须证明其作品是独立创作的。但是,这是法院针对特定事实分析的结果,权利所有者不应依赖于这一机制。
根据商业机密法的规定,权利所有者有时可以选择要求法院对证据保密,或者让独立的一方(例如公证人)将证据与机密信息进行比较,而不必使机密成为公开法院记录的一部分。
责任编辑:pj
-
数据库
+关注
关注
7文章
3769浏览量
64292 -
机器学习
+关注
关注
66文章
8382浏览量
132451 -
电脑系统
+关注
关注
0文章
21浏览量
9489
发布评论请先 登录
相关推荐
评论