欧盟版权法下的文本与数据挖掘研究

摘要: 近期通过的《数字化单一市场版权指令》第3、4条对TDM的版权例外作出规定。欧盟TDM例外的成因在于提高TDM技术应用率,充分发挥其对科学研究的作用,而欧盟现行法律对TDM缺乏明确的适用边界,未经许可实施TDM存在很大的法律风险。《数字化单一市场版权指令》区分
阅读技巧Ctrl+D 收藏本篇文章

  摘要:近期通过的《数字化单一市场版权指令》第3、4条对TDM的版权例外作出规定。欧盟TDM例外的成因在于提高TDM技术应用率,充分发挥其对科学研究的作用,而欧盟现行法律对TDM缺乏明确的适用边界,未经许可实施TDM存在很大的法律风险。《数字化单一市场版权指令》区分了“科研目的下的TDM例外”与“分析处理层面的TDM例外”。欧盟TDM例外的适用要件包括来源合法和安全保存措施。文章探析欧盟TDM例外的成因、适用分类和适用条件,分析其立法经验和借鉴意义。

  关键词:欧盟版权法,TDM例外,科学研究,数字化单一市场版权指令

版权法论文

  文本与数据挖掘(text and data mining,TDM)是通过分析数字化形式的文本和数据来获取新知识的自动分析技术。随着数字经济推进,TDM技术对科学创新的作用日益受到重视,但法律定性的不明确使TDM技术的发展受到一定阻碍,因此亟需立法改革。欧洲议会和欧盟理事会分别于2019年3月26日与4月15日批准了《数字化单一市场版权指令》[1](以下简称《2019版权指令》),该指令的目标之一在于使版权法的例外与限制迎合于数字市场的发展,其中第3、4条对TDM的版权例外作出了规定,欧盟各成员国的国内法将在两年的时间内建立符合《2019版权指令》要求的TDM例外。本文探析欧盟版权立法下TDM例外的成因、适用分类和适用条件,汲取其中的立法经验和借鉴意义,并对我国关于TDM例外的立法构建提出建议。

  1 欧盟TDM例外的成因

  1.1 现实成因

  TDM对自然科学、社会科学和人文科学研究具有重要作用。第一,TDM可以提高研究的效率,帮助研究者节约时间成本,从而更快地获取相关信息。第二,TDM可以解锁隐藏的信息,即在大量文献中发现不同主题之间的潜在联系。例如,疾病和具有其他治疗功效的药物之间存在联系,沙利度胺(thalidomide)具有新的治疗功能则是通过TDM被发现的[2]。第三,TDM可以改进研究方法和质量,特别是人文社会科学中采用实证研究的方法。

  欧盟TDM例外的引入是为了提高TDM技术的应用率,充分发挥其对于科学研究的作用。当前,欧盟的TDM技术仍处于起步阶段,其普及率总体偏低并且发展较为缓慢。有调查显示,欧盟关于TDM的期刊出版物在全球的占比仅28.2%,而亚洲占比达32.4%,北美占比20.9%[3]。欧洲仅有不足20%的研究者曾使用TDM技术进行研究,而全球占比24%。然而,TDM的应用率没有紧密跟上数字技术进步的步伐,TDM被应用于科学研究的技术条件日臻成熟。网络上已经提供将近所有的科技期刊,每年出版约250万篇科技文章[4]。全球的科技期刊总量以每年8%~9%的速度增长[5]。欧盟科研机构图书馆收藏的刊物中,90%以上是数字内容构成的。例如,伦敦大学收藏的94%的期刊和24%的报纸是数字版的,斯德哥尔摩大学的79%预算用于数字内容的建设[6]107。

  在缺乏TDM例外的情况下,科研机构实施TDM可能需要版权人的许可,这便带来高昂的交易成本。英国在引入TDM例外前曾进行的案例调研显示:一个科研项目需要挖掘出版于187个期刊(来自75个出版者)的3,000篇文章,其许可成本在3,399英镑到18,630英镑之间,一个大型的科研机构每年需花费约50万英镑的许可成本[6]114。

  1.2 制度成因

  虽然TDM的现实需求不断扩大,但欧盟的现行版权法对TDM缺乏明确的适用边界,未经许可实施TDM存在很大的版权侵权风险。这种不确定性使TDM实施者承担较大的交易成本,导致TDM技术在欧盟的应用难以快速发展,进而影响科学研究的效率和质量。TDM例外的引入旨在消除欧盟长期对于TDM法律定性的“模糊地带”,使各成员国不同程度地扩张并统一版权例外制度对于TDM的适用空间。

  当所挖掘的文本与数据包含具有版权的作品时,TDM技术的应用过程中必然存在作品的复制,其符合版权法所控制的复制行为,从而可能涉嫌侵犯复制权。欧盟《2001年版权指令》(Directive 2001/29/EC)第2条规定了复制权,其对于复制权所控制的行为给予广泛全面的内涵:“以任何方式或形式,整体或部分地实施直接或间接的、临时或永久的复制行为”。《2001年版权指令》第5条规定了版权的例外与限制,但TDM过程中的作品复制行为在许多情况下似乎难以符合例外与限制的条件。TDM可能涉及第5条第1款规定的临时复制例外,该规定属于强制性版权例外条款,即欧盟成员国必须在其国内版权法中规定该版权例外。该临时复制例外的条件:(1)短暂或附带的;(2)技术过程所必要且不可分割的组成部分;(3)唯一目的在于网络中中间服务商在第三方之间传输或合法使用;(4)没有独立的经济价值。但TDM过程中的临时复制行为大多难以符合上述要求[7]。TDM还可能涉及《2001年版权指令》第5条第2款(b)项和第3款(a)项规定的私人使用例外和科学研究例外。该两项版权例外的规定均以“非商业性目的”作为适用条件,但TDM的实施大多数难以符合该要求。而且,这两项版权例外属于自愿性版权例外条款的范畴,各欧盟成员国的国内法可能对此存在较大的差异,其对于TDM的适用更加具有很大的不确定性。

  当所挖掘的文本与数据不存在具有版权的作品,其仍可能受到数据库权(sui generis right)的保护,TDM的实施则面临侵犯撷取权(extraction right)的风险。欧盟《1996年数据库保护指令》(Directive 1996/9/EC)第7条第2款(a)项规定了撷取权控制的行为,即“以任何方式或形式,永久或临时地将数据库内容的全部或实质性部分转移至另一载体”。与《2001年版权指令》类似,《1996年数据库保护指令》第9条规定了数据库权的例外,其(a)项和(b)项规定的私人使用例外和科学研究例外属于自愿性权利例外条款,存在“非商业性目的”要件,因此也难以明确为大多数的TDM提供“庇护”。

  近年来,欧洲一些国家纷纷在国内立法中增加TDM例外,但各国TDM例外的适用条件和范围参差不齐,该分裂化(fragmentation)问题促使欧盟层面引入统一的TDM例外以完善数字化单一市场的和谐。2014年5月19日,英国首先采纳了TDM例外,《1988年版权、设计和专利法》第29A条规定,有合法接触权的人仅仅为了非商业性的研究而制作文本与数据的复制件不侵犯版权。2016年10月7日,法国也采纳了限于合法来源且非商业性研究目的下的TDM例外,《法国知识产权法典》第L122-5条和第L342-3条分别加入了针对作品着作权和数据库权的TDM例外,其所适用的文本与数据仅限于科学相关的文献。2017年1月1日,爱沙尼亚的TDM例外开始生效,《爱沙尼亚着作权法》第19条第3款规定的TDM例外并不以来源合法为条件,但要求使用人尽可能注明作品的作者和来源。德国的TDM例外在2017年6月30日获得通过,并于2018年3月1日生效,《德国着作权与邻接权法》第60d条规定的TDM例外也不存在来源合法要件,且其所针对的数据使用行为不限于复制,还包括两种特定的传播行为:(1)为了合作进行科学研究而传播至特定群体;(2)为了监督科学研究的质量而传播至单独第三方。

  2 欧盟TDM例外的适用分类

  2.1 从《提案》到《2019版权指令》的变化:新的TDM例外

  欧盟委员会在2016年发布的《数字化单一市场版权指令(提案)》(以下简称《提案》)第3条规定了“科研目的下的TDM例外”,即对作品或其他客体享有合法接触权的科研机构在科学研究的目的下为了执行TDM而实施复制和撷取行为不侵犯版权或数据库权。最终生效的《2019版权指令》大体上保留了第3条的规定,但增加了新的TDM例外(第4条),即对作品或其他客体享有合法接触权的人在TDM目的下实施复制和撷取行为不侵犯版权或数据库权,笔者称之为“分析处理层面的TDM例外”。两种TDM例外都属于强制性权利例外条款。

  “科研目的下的TDM例外”与“分析处理层面的TDM例外”所适用的行为范围是不同的,否则《2019版权指令》第4条显然会架空第3条的规定。“科研目的下的TDM例外”主要针对实施TDM之前的复制行为,而“分析处理层面的TDM例外”仅针对实施TDM过程中的临时复制行为。TDM过程通常存在3个步骤:步骤一是内容的接触,包括纸质复制件或数字化内容的获取;步骤二是撷取内容而形成可挖掘的复制件(将内容调整到适当的数字化格式并存入数据库);步骤三是数据挖掘本身,即对数据进行分析处理,该过程主要存在内容的临时复制行为。“科研目的下的TDM例外”针对以上过程中所有复制行为,特别是步骤二中的复制行为;而“分析处理层面的TDM例外”仅针对步骤三的行为,主要是指不符合《2001年版权指令》第5条第1款例外条件的临时复制行为。这是因为符合《2001年版权指令》第5条第1款例外条件的临时复制行为已经受到该指令的保护;而步骤三中没有符合《2001年版权指令》例外条件的临时复制行为存在很大的版权侵权风险。《2019版权指令》序言第18段第3句明确了规定“分析处理层面的TDM例外”的原因,并对其适用于步骤三的行为予以印证:在TDM目的下对于合法获得的作品或其他客体实施复制和撷取,TDM的使用者面临法律上的不确定性,尤其是为了技术处理而实施的复制或撷取没有符合《2001年版权指令》第5条第1款规定的临时复制例外的所有条件。

  可见,“科研目的下的TDM例外”与“分析处理层面的TDM例外”是并行独立的关系。前者适用于科研目的下实施TDM过程中的所有行为,而后者适用于科研目的以外的TDM过程中分析处理数据的行为(临时复制的行为)。

  此外,权利人原则上不能通过合同条款来规避TDM例外。任何规避“科研目的下的TDM例外”的合同条款均是无效的,《2019版权指令》第7条第1款对此予以规定。然而,“分析处理层面的TDM例外”有所不同,《2019版权指令》第4条第3款允许权利人通过合适的方式予以明确保留,如在网上公开提供内容的情况下采取机器可读手段(machine readable means)。

  2.2《2019版权指令》对TDM例外采取适用分类的原因

  《2019版权指令》第3条规定的“科研目的下的TDM例外”具有目的和主体的限制,其适用主体仅限于作为公共主体的科研机构和文化遗产机构,而非以盈利为主要目的的私营主体。《2019版权指令》第2条对于“科研机构”和“文化遗产机构”作出专门的定义。《2019版权指令》中的“科研机构”是指大学(包括其图书馆)、研究院或其他主体,其目的主要在于实施科学研究或实施涉及科学研究的教学性活动。“科研机构”的目的需符合两种情形之一:其一是非盈利性质或所有的盈利会再次投入到科学研究,其二是遵守成员国所认可的公共利益使命。并且,科学研究所获得的成果不能被对该科研机构具有决定性影响的企业加以偏向性的享用。《2019版权指令》中的“文化遗产机构”是指公众可以接触到的图书馆、博物馆、档案馆或影音遗产机构。

  需要指出的是,“科研目的下的TDM例外”并不完全排斥私营主体的参与,其可以一定程度上包容商业性的动机或主体。科研机构和文化遗产机构可以与私营主体合作,基于公私合作关系(public-private partnerships,PPP)实施科研活动,其仍然可以适用“科研目的下的TDM例外”。欧盟委员会在2016年与《提案》同时发布的《影响报告》中,“科研目的下的TDM例外”存在两种替代方案,其中一个替代方案是将TDM例外严格地限制于非商业性的科研目的,该方案会导致PPP框架下的TDM具有很大的法律不确定性,而该模式下的TDM应用在实践中占较大的比例,导致很多公众资金支持的科研项目陷入法律的“灰色地带”,因此该方案未被采纳[6]115。

  《影响报告》还对“科研目的下的TDM例外”提出另一种替代方案,即允许任何人(包括私营企业)基于非商业或商业性的科研目的实施TDM。这种不限制主体的做法没有被欧盟层面所采纳,其原因主要有两点:第一,作为商业性企业的研究使用人本来就愿意为TDM的增值服务支付费用,而采取该做法会导致版权人向商业性企业提高合法接触到数据库的订阅费,以弥补TDM相关收入的损失;第二,范围过宽的例外会对版权人产生负面影响,商业性使用TDM已存在很大的市场。在2019年前该市场在欧洲的价值估计超过5.6千万欧元。国际科学、技术和医学出版商协会(STM)的两家主要出版商已经与生命科学公司达成302项TDM许可[6]118。

  可见,《2019版权指令》中的“科研目的下的TDM例外”受到较多限制,难以广泛适用于民事领域的TDM应用。但是,TDM技术存在多种目的的应用,并非限于科学研究的目的,过于限制的TDM例外并不利于版权法宗旨的实现。基于此,《2019版权指令》增加了“分析处理层面的TDM例外”,基本上不存在目的或主体的限制。对此,《2019版权指令》序言第18段第1句指出:“除了科学研究领域的意义,民事主体和公共主体还可在生活中不同领域将TDM技术广泛地应用于不同目的下的大数据分析,包括政府服务、复杂的商业决定和新应用或科技的发展。”[1]

  实质上,“分析处理层面的TDM例外”是为了贯彻“阅读权应当是挖掘权”(right to read should be the right to mine)的理念,即单纯实施TDM的权利实质上等同于人类通过阅读来获得知识或信息的基本权利。版权法自古以来从未设置“阅读权”这项专有权利,即便是翻看盗版图书,该行为本身也不受到版权法的控制。基于技术进步,人类利用机器“阅读”作品过程中不可避免地存在作品临时复制件的产生,这也应当豁免于版权法的规制,从而防止版权侵蚀公众获得知识的基本权利。赋予版权人“机器阅读权”是过分地扩张版权保护范围,破坏版权人与公众之间原有的利益平衡,有悖于促进人类知识发展的版权法立法目的。

  3 欧盟TDM例外的适用要件

  3.1 来源合法

  欧盟TDM例外的一个适用前提在于来源合法,即TDM使用人必须是合法接触到所挖掘的文本或数据。非法或违法取得文本或数据的使用人不能享受欧盟TDM例外。来源合法的内容可以存在两种形式:印刷形式和电子形式。

  其一,TDM使用人可以合法地获得作品或其他内容的纸质版。例如,使用人从书店购买图书或从图书馆租借图书。通过合法渠道获得印刷形式的内容,对其进行扫描和数字化后实施TDM则符合来源合法的要求。不过,使用人若从违法渠道获得纸质版的作品,则难以享受欧盟TDM例外,如购买盗版的图书。

  其二,TDM使用人也可以合法地获取电子版的作品或其他内容,这是TDM使用人获取内容的主要情形。例如,使用人订阅权利人的数据库后进行下载(权利人与使用人之间存在合同关系),或者所接触的内容本身是权利人在网络上免费提供的(权利人采取开放接触的政策)。而违法获得电子内容的TDM使用人无权享受TDM例外,如采取黑客技术盗取权利人的内容。

  需要指出的是,合法接触内容的TDM使用人在某些情况下并不一定需要取得权利人的授权。例如,TDM使用人可以基于权利用尽原则、法定许可或合理使用等原则接触到内容,这些情形都不构成违法行为或侵权行为,从而符合来源合法的要求。

  3.2 安全保存措施

  TDM使用人对所挖掘的文本和数据采取适当的安全保存措施是欧盟TDM例外的适用条件之一。缺乏安全保护措施会引发被挖掘内容的侵权风险,此时仍适用TDM例外会导致权利人利益受到损失。安全保存措施这一要求可以防止TDM例外的滥用,保障权利人的合法利益。

  安全保存措施必须持续于文本或数据复制件的存续期间,所挖掘的内容不一定在获得科学研究的结果之后失去利用价值,所留存的文本或数据往往还存在科学研究的附属作用,如查证科学研究的结果、同行评审或合作研究的需要。对此,《2019版权指令》第3条第2款规定:作品和其他客体的复制件应当以适当安全标准予以保存,并且可以为了科学研究的目的(包括查证研究结果)而继续保留。《2019版权指令》第3条第3款还进一步规定:权利人应当有权采取措施以确保作品或其他客体所在网络和数据库的安全性和完整性。

  安全保存措施的严格程序需要取决于TDM目的实现的必要性。如何确定符合比例原则的安全保存措施,需要由产业界的利害相关人共同决定。《2019版权指令》第3条第4款规定:成员国应当鼓励权利人、科研机构和文化遗产机构共同定义第2、3款所指义务及其措施相关的最佳实践。

  4 启示

  鉴于TDM对于科学研究和相关产业的重要作用,我国法律也有必要为TDM的应用提供制度保障。TDM例外的建立在我国也具有与欧盟相类似的现实动因和制度价值,现行着作权制度可能会影响TDM技术的应用,进而阻碍我国科学研究以及相关产业的发展。我国现行着作权法难以为TDM的实施提供足够的权利例外。《着作权法》第22条规定了“为个人学习、研究或者欣赏”的合理使用,该规定的适用主体仅限于个人。而TDM的实施者主要是科研机构等组织,难以适用该权利例外规定。同时,我国着作权例外制度采取大陆法系国家的“封闭式”列举规定,而非类似于美国的“开放式”合理使用规则,我国法院无权根据现行立法对于TDM创建新的着作权例外。基于此,我国着作权法可以一定程度上借鉴欧盟立法,在着作权法修改之际引入TDM例外制度。笔者建议,我国TDM例外可以在欧盟的基础上进行一定的扬弃,具体需要在以下3方面予以改造。

  4.1 TDM例外的目的和主体

  我国引入TDM例外,不应仅限于科学研究的目的和特定的公共主体,而应拓宽至更广泛的合理使用目的。TDM可以应用于科学研究以外有利于公共利益的许多领域,其很多情况下不会影响作品的正常使用,也不会不合理地损害着作权人的合法利益。例如,TDM可以应用于智能披露系统(smart disclosure systems),即通过标准化机器可读格式披露复杂的信息或数据,以使消费者作出信息对称的决定[8]。谷歌数字图书服务则是一种智能披露系统,美国联邦第二巡回上诉法庭在2015年判决的“美国作家协会诉谷歌公司案”中,认定谷歌数字图书属于合理使用[9]。

  因此,我国TDM例外可以限定为“科学研究和其他合理使用目的”。一方面,将“科研目的下的TDM例外”明确为我国着作权法下权利例外,体现法律的确定性和可预期性;另一方面,增加“其他合理使用目的”可以使我国TDM例外具有一定的弹性,《伯尔尼公约》和《TRIPS协定》所确立的“三步检验法”可以为该例外予以限制解释,防止着作权人的利益遭受损失。某些为了实施TDM而使用作品的行为,不会与作品的正常使用相冲突,也不会不合理地损害着作权人的合法权益,我国法院可以依据该弹性条款对该行为予以保护。例如,具有“智能披露”功能的谷歌数字图书服务可以依据“其他合理使用目的”条款免于着作权侵权的责任。由于我国现行着作权例外制度的僵性规定,北京市高级人民法院2013年判决的“王莘诉谷歌公司案”中认定谷歌数字图书服务侵犯着作权,并不构成合理使用。

  需注意的是,《2019版权指令》中的TDM例外规定作为强制性条款,反映的是欧盟成员国共同意志下的TDM例外范围,而超出《2019版权指令》第3、4条适用范围以外的TDM例外难以在欧盟各国达成共识,这并不否定成员国可以规定超出科学研究目的的TDM例外,只要其不违反“三步检验法”的要求,一国立法完全有权规定其他合理使用目的的TDM例外。

  4.2 TDM例外的行为和客体

  从应然的角度,TDM例外中的使用行为不应限制于复制行为,还应当包括特定的传播行为。例如,谷歌数字图书服务不仅实施了图书数字化的复制行为,还向公众提供了“片段浏览”服务,其是对图书的信息网络传播行为。因此,我国TDM例外应当不仅针对着作权法中的复制权,还应包括信息网络传播权,适用于特定的网络传播行为。德国着作权法明确规定,TDM例外适用于特定的传播行为。

  不同于欧盟的数据库权制度,我国立法没有引入专门的数据库权制度,没有独创性的数据汇编不能根据着作权法受到保护。而司法实践中我国法院主要适用《反不正当竞争法》第2条对数据库的权益给予保护。因此,我国TDM例外的客体仅针对着作权,无需增加关于数据库权的客体规定。在我国司法实践中,对于符合TDM例外的数据库使用行为,法院应拒绝为数据库权利人提供基于反不正当竞争法的保护。如果我国着作权法将来对于无独创性的数据汇编进行邻接权立法,此时我国TDM例外则需要增加数据库权作为客体。

  另外,我国立法不具有纳入“分析处理层面的TDM例外”的必要性,因为该例外仅针对临时复制的行为,而临时复制行为没有被纳入我国着作权法中复制权的范畴。对此,我国与欧盟截然不同,《着作权法》第10条对于“复制权”的定义没有加入临时复制的行为,而《2001年版权指令》第2条定义的“复制权”明确包含了临时复制。我国实施TDM过程中的临时复制行为本身不受到着作权法规制。当然,如果我国着作权法将来基于技术变革的需要而纳入临时复制,我国TDM例外则应当相应地加入“分析处理层面的TDM例外”。

  4.3 TDM例外的适用要件

  我国TDM例外应当加入“安全保存措施”与“来源合法”作为适用要件。不过,本文认为,对于“来源合法”要件应采取限制解释,不宜将其“一刀切”地作为排除TDM例外的硬性条件。首先,合法接触内容与实施TDM之间存在一定的独立性。接触内容的使用者通常只需要向权利人支付一定的许可费,违反协议约定或未经许可接触到内容则可能属于违约、侵权或破坏技术措施的违法行为。TDM使用人没有获得许可而接触到内容并实施TDM,理应承担支付许可费的法律后果,而不应该过分牵连至实施TDM的合法性。其次,来源合法要件可能会导致权利人通过增加接触内容的许可费,达到变相规避TDM例外的效果,甚至权利人与使用人之间的协议中加入禁止实施TDM的条款,导致使用人是否符合来源合法要件存在法律的不确定性。权利人滥用来源合法要件可能致使TDM例外形同虚设。最后,目前一些国家关于TDM例外的立法也没有采纳来源合法要件,如德国和爱沙尼亚。马克思·普朗克创新和竞争研究所也主张科研机构在没有合法接触权的情况下应当有权实施TDM,而权利人对此可以要求使用人支付合理的许可费[10]。因此,适用“来源合法”要件时应考虑使用人的主观状态,该要件应当限制适用于恶意的TDM使用人,而不应以此完全剥夺善意使用人享受TDM例外。该限制解释的做法有利于TDM例外的价值功能得到最大实现,同时保障了版权人的合法利益并防止版权侵权的肆意泛滥。

  参考文献
  [1]Official Journal of the European Union.Directive(EU)2019/790 of the European Parliament and of the Council of 17 Ap ril 2019 on Copyright and Related Rights in the Digital Single Market and Amending Directives 96/9/EC and 2001/29/EC[EB/OL].(2019-05-17)[2019-09-11].
  [2]Joint Information Systems Committee.Value and Benefits of Text Mining[EB/OL].(2012-03-14)[2019-05-01].
  [3]Pilippov S,Hofheinz P.Text and Data Mining for Research and Innovation[EB/OL].(2016-05-30)[2019-05-01].
  [4]The International Association of Scientific,Technical and Medical Publishers.The STM Report 2015[EB/OL].(2015-02-20)[2019-05-02].
  [5]Bornmann L,Mütz R.Growth rate of modern science:A bibliometric analysis based on the number of publications and cited references[EB/OL].[2019-05-02].

    阮开欣.欧盟版权法下的文本与数据挖掘例外[J].图书馆论坛,2019,39(12):102-108. 转载请注明来源。原文地址:http://www.lw54.com/html/faxuelilun/20200314/8281928.html   

    欧盟版权法下的文本与数据挖掘研究相关推荐


    联系方式
    微信号 Lw54_com
    热点论文
    14705193098 工作日:8:00-24:00
    周 日:9:00-24:00