您现在的位置:首页 > > 业务专长 > 企业法律顾问

大数据以及大数据的法律保护有哪些

来源:未知 作者:未知 时间:2017-05-11

  如果说IBM的主机拉开了信息化革命的大幕,那么‘大数据’则是第三次浪潮的华彩乐章。

  一、大数据潮起

  (一)大数据的意义

  古希腊思想家毕达哥拉斯认为数是世界的本源,也许这是人类初次领悟到数的伟大。著名未来学家阿温.托夫勒在1980年出版的《第三次浪潮》中预言:“如果说IBM的主机拉开了信息化革命的大幕,那么‘大数据’则是第三次浪潮的华彩乐章”。

  从出现文明到2003年,人类总共才创造5EB(百亿亿字节)的数据,但现在仅两天就造出相同数据的数量。互联网每天收发着3000亿电子邮件;百度每天响应超过60亿次搜索请求;每天上传到Facebook的照片甚至达到2.5亿张的天文数字。信息是由数据构成的,大数据无疑是信息经济的制高点,也是经济和社会赖以运行的基础。掌握大数据意味着对内容的控制、用户偏好的了解和市场趋势的洞悉。数据既是企业的核心资产,也是核心的竞争优势。技术和大数据始终是百度的战略基石,马云为阿里规划的平台、金融、大数据三个发展阶段更能揭示数据对互联网企业的终极意义。

  大数据的运用范围极其广泛,几乎无所不包。百度利用从互联网搜索等多个应用获得的数据推出针对具体用户的精准网络广告;沃尔玛超市在海量的购物统计结果中发现众多男性用户购买婴儿尿布时会附带购买啤酒,并利用这个发现安排商品摆放位置,从而增加了相关商品的销售;视频网站Netflix通过研究网站数据分析出观众对影视内容、风格、导演、演员的偏好,成功推出红遍全球的《纸牌屋》;谷歌利用搜索数据推出流感预测,把大数据应用到社会公益领域;微软纽约研究院经济学家David Rothschild利用大数据连续在2012年和2013年成功预测24个奖项中的19个和21个。Rothschild利用大数据预测的最高准确率是在2012年成功预报处美国总统选举51个选区结果中的50个结果,准确率高达98%。大数据的神奇可见一斑。

  (二)什么是大数据

  技术、经济和产业界在实践中对大数据有不同的理解和定义。其中IBM对大数据给出的4V特征受到学者和产业界众多认可。IBM的4V特征即大数据量(Volume)、快速变化(Velocity),庞杂内容(Variety)和(不)精确性(Veracity)。著名产业调研机构Gartner认为大数据是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。Gartner给出的大数据的3V特性和 IBM相当接近,分别是巨大的数据量(Volume)、数据的快速处理(Velocity)、多变的数据结构和类型(Variety)。

  大数据并不是固有的法律词汇,法律中也找不到与技术或产业意义上的大数据完全对等的概念。中国《著作权法》第十四条所规定的汇编作品,即“汇编若干作品、作品的片段或者不构成作品的数据或者其他材料,对其内容的选择或者编排体现独创性的作品”;欧盟数据库指令第一条规定了可受特殊权利保护的数据库是指经系统或有序的安排,并可通过电子或其他手段单独加以访问的独立的作品、数据或其他材料的集合。汇编作品可以看成有独创性的数据集合,欧盟规定的数据库可以是不含独创性的数据集合。汇编作品和数据库是最接近大数据的保护客体,因此,符合条件的大数据可以主张著作权或特殊权利保护。区别在于法律不关注汇编作品或数据库的体量有多大,也不会区分数据是否类型多样、是否准确以及是否在变动。

  二、大数据法律保护现状

  (一)版权外的数据保护

  大数据是很多IT企业的核心资产。据不完全统计,仅国内A股上市公司中主营大数据相关业务的企业就有数据技术提供商超图软件、科大讯飞、拓尔思,数据服务提供商上海钢联电子、广联达、大智慧、四维图新等20多家。上市公司卷入的新类型数据权利侵权纠纷不断涌现,包括同花顺集团两家子公司在2012年底被万得信息技术公司在上海市第一中级人民法院索赔9,920万元人民币,以及上海钢联电子最近在上海、江苏、北京、广东等全国各地法院起诉多家网站未经许可使用原告网站的钢材交易数据。数据集合根据不同情况可能受到多项法定权利的保护,数据保护并不是单项选择题。根据中国法律,在版权法(著作权法)之外就有商业秘密权、隐私权、人身权、合同债权以及不正当竞争保护可能被主张。

  1.商业秘密保护

  《反不正当竞争法》第十条第三款规定:“本条所称的商业秘密,是指不为公众所知悉、能为权利人带来经济利益、具有实用性并经权利人采取保密措施的技术信息和经营信息。”根据该项规定,满足秘密性、保密性、实用性的技术信息和经营信息即可以作为商业秘密保护。随着司法实践对商业秘密认定不断倾向做宽泛解释,通过主张商业秘密权保护数据的案例呈增多趋势。在衢州万联网络技术有限公司与周慧民等侵害商业秘密纠纷上诉案中,一审被告周慧民等是一审原告万联公司的前员工,在2004年5月底至6月初从万联公司离职后创办与其相竞争的网站,利用从万联公司擅自截取的50多万个注册用户信息,通过在互联网公告和通过QQ群通知等方式引导原告注册用户到被告网站。两审法院均认为虽然单个用户的注册用户名、注册密码和注册时间等信息是较容易获取的,但是(原告)网站数据库中的?、注册密码和注册时间等信息形成的综合的海量用户信息却不容易为相关领域的人员普遍知悉和容易获得,此外,上述用户信息又具有实用性,万联公司也对上述用户信息采取了保密措施。法院由此认定万联公司的网站用户注册信息属于商业秘密,判决五被告共同赔偿原告经济损失100万元。

  2.合同法保护

  上证所信息网络有限公司(下称上证信息)诉新华富时(新华富时)指数有限公司违约案缘由是上证所信息公司曾通过合同授权新华富时使用上海证券交易所实时股票行情编制指数,授权明确禁止使用上证指数开发衍生产品。法院审理后认为,原被告之间签订的合同依法有效,新华富时利用上证指数开发指数期货的行为违反合同约定,应承担违约责任。

  3.反不正当竞争法保护

  《反不正当竞争法》第二条规定:“经营者在市场交易中,应当遵循自愿、平等、公平、诚实信用的原则,遵守公认的商业道德。本法所称的不正当竞争,是指经营者违反本法规定,损害其他经营者的合法权益,扰乱社会经济秩序的行为。”反不正当竞争法具有高度抽象性和个案中宽泛解释的弹性,能够对成文法静态保护的权利形成兜底的动态保护。援引郑成思老师的著名比喻,就是如果把专利法、商标法、版权法这类知识产权单行法比作冰山,那么反不正当竞争法就如冰山下使其赖以漂浮的海洋。

  尤其在对不满足版权法对独创性要求的数据集合进行保护的案件中,禁止不正当竞争往往是原告和法院的标准选项。上海霸才数据信息有限公司与北京阳光数据公司技术合同纠纷案二审中,北京市高级人民法院认为一审原告霸才公司的SIC实时金融信息作为一种新型的电子信息产品应属电子数据库,在本质上是特定金融数据的汇编,这种汇编在数据的编排和选择上并无著作权法所要求的独创性,不构成著作权法意义上的作品,不能受到著作权法的保护。但霸才公司作为特定金融数据的汇编者,对数据的收集、编排,即SIC实时金融信息电子数据库的开发制作付出了投资,承担了投资风险。该电子数据库的经济价值在于其数据信息的即时性,阳光公司正是通过向公众实时传输该电子数据库的全部或部分而获取收益,阳光公司对于该电子数据库的投资及由此而产生的正当利益应当受到法律保护。

  4.人身权

  个人信息受隐私权保护,2013年引起不小风波的大规模开房记录泄露事件属于对当事人人身权中隐私权的侵害。以DNA基因序列为代表的个人信息同样是典型的隐私权保护客体。

  (二)数据库的版权保护

  1.汇编作品模式的数据库保护

  根据《著作权法》第十四条的规定,汇编作品是在选择或者编排中体现独创性的作品集合或其它信息集合。《著作权法》对汇编作品的该条与《世界知识产权组织版权条约》(WCT)第五条规定及《与贸易有关的知识产权协议》(TRIPS协议)第十条二款的规定实质相同。从以上著作权法规定和中国加入的知识产权国际条约规定可知,著作权所保护的汇编作品可以由电话号码、交易行情、股票走势等不能单独构成作品的信息、数据或其它材料组成,这一点使著作权保护在理论上延及数据。但汇编作品并不能覆盖很多极具利用价值的数据库,以汇编作品版权模式保护大数据有先天不足,致使立法本意与法律实践可能产生南辕北辙的效果。

  2.版权保护中的独创性难题

  具有独创性是作品受著作权保护的前提,也恰是数据库版权保护取舍两难的症结。《著作权法》将数据库划为汇编作品的类型,规定其内容的选择或者编排体现独创性。要求数据库满足作品的构成要求就必然要求数据库具有独创性,接踵而来的难题是能独立构成作品的数据库并不需要法律专门规定就可以直接受到著作权保护,而很多具有高度商业价值迫切需要法律保护的事实信息类数据库如号码簿、通讯录、地图或交易行情却不具有独创性。精选类汇编作品如《唐诗三百首》、《古文观止》、《新概念作文选》贵在选择得当,不同汇编者对内容选择和编排可能差异巨大,独创性显而易见。而大全类数据库如《永乐大典》、《四库全书》、《唐诗大全》、《吉尼斯世界纪录大全》或《法规大全》则正好相反,其价值在于数据材料的全面而不在于选择,所以汇编人的个性和偏好都会降低而不是有助于数据库的价值。大全类数据库的编篡可能需要巨大投入,《永乐大典》和《四库全书》分别是明清两代以举国之力完成的浩大工程,这与个人或独立团队就能完成的精选类汇编作品有重大不同。按独创性标准衡量汇编作品的保护,可能使具有重大意义和实用价值的大全型数据库成为弃子。

  3.结构保护的边界

  从另一个方面看,汇编作品的结构和编排体例虽然可能体现作者在选择或者编排上的独创性,却未必具有保护价值。数据库结构与数据相比如同仓库与存货,真正价值往往在数据本身而不是结构。航班信息按时间早晚、价格高低、打折多少、航空公司名称排列都可以,实质都是同一个信息集合。而很多行业类数据库结构在逐步标准化和统一化,例如财务报表,也使对数据结构的保护失去意义。而在检索技术对所有数据库都普遍运用的情况下,数据库的结构随时可以变化,也表明保护数据库结构很多情况下如同鸡肋。进一步来看即使对数据结构进行保护,也可以在使用他人数据库实质性内容时改变编排来轻易规避侵权责任,这又是汇编作品模式对数据库保护力所不能及的。

  4.案例解读

  如前所述,以汇编作品版权模式保护数据库的重大缺陷之一在于无法保护众多有很高商业价值却没有著作权法所要求的独创性的数据库。第一中级人民法院 2016二审的大众点评网诉爱帮网民事裁定书中指出:“大众点评网对于网友点评文字系按照时间顺序排列,排列方式是常见的排列方式,并不具有独创性。同时,本案现有证据亦无法看出被上诉人对于用户点评的内容进行了选择”。二审法院据此认为大众点评网中网友点评字的集合不构成汇编作品,推翻了一审法院对原告点评数据库受版权保护的判决。

  通过认定数据库具有独创性从而适用版权保护的也有以下典型却仍有争议的案例。在上海市高级人民法院二审的上海易图通信息技术有限公司诉上海城市通网络信息技术有限公司地图作品侵权纠纷案中,法院认为,“根据我国著作权法规定,具有独创性的地图作品,受到法律保护。因此,无论被上诉人制作的上海1:2000数字化地图是否为底图,只要其具备独创性,即应受到我国著作权法保护。本案中,被上诉人制作的上海1:2000数字化地图,是其根据对上海地区的道路、河流和铁路信息的测量数据,根据自己独特的判断和取舍方法,绘制出的具有与其他地图不同表达方式的地图作品,具有独创性,属于我国著作权法规定的地图类图形作品,受到法律保护。”

  在该案判决书中法院并没有提到地图的测量数据受保护,而是指出根据测量数据绘制地图时的独特判断和取舍方法具有独创性,所以地图可受保护。按此思路,未经人工处理的测绘原图以及卫星云图等图形类数据集合由于没有经过独创性的判断和取舍,其是否受版权保护必然富有争议。

免责声明:本网部分文章和信息来源于国际互联网,本网转载出于传递更多信息和学习之目的。如转载稿涉及版权等问题,请立即联系网站所有人,我们会予以更改或删除相关文章,保证您的权利。

  • 上一篇:大数据金融有哪些风险
  • 下一篇:大数据金融风险有哪些
  • 延展阅读

    Extended reading
    更多>>