
原创曲子龙网络尖刀
大数据终于到了稳定期,发展过程中的各种隐私和合规问题终于开始暴露。昨天,网络尖刀刑事情报团队监测到一个很有代表性的民事判决案例,深圳市腾讯科技有限公司诉杭州快易科技有限公司,通过为微信微信官方账号开发爬虫工具,干扰微信公众平台的正常运营,涉嫌构成不正当竞争。
近日,杭州铁路运输法院对腾讯公司的申请作出判决,认为杭州快易科技有限公司违反微信公众平台服务协议,开发多种用于抓取微信公众平台各类数据的产品进行盈利,可能构成不正当竞争。杭州快意需要立即停止涉嫌侵权行为。目前,网站涉及的相关产品和服务已经下架。
以整体案情为例,收集了一系列相关内容,做了完整的事件分析,在腾讯这边“还原”案情。
弓箭手触犯了哪些法律?
腾讯的诉讼虽然是不正当竞争的民事诉讼,但实际上弓箭手通过爬虫大规模抓取的内容,实际上是侵犯了“微信微信官方账号平台作者”的著作权,属于知识产权范畴;
设置规则模拟人们通过爬虫请求微信微信官方账号数据的方式,其实是一种“消耗资源的攻击”。如果有足够多的线路有足够多的请求,按理说它对腾讯发起了CC流量攻击,所以属于网络法的范畴;
阿彻在其平台上提供“微信微信官方账号文章信息API”、“微信订阅号及最新文章API”、“微信热搜榜”、“订阅热词API”等服务,属于反不正当竞争范畴;
为什么选择起诉他不正当竞争?
说实话,微信微信官方账号平台的内容抓取的人应该不少,包括一些提供了抓取微信微信官方账号内容并同步到自己平台的工具的媒体平台。当然市面上也有一些图文同步的工具,也可以分发很多内容,但是这种性质和现在的archer完全不一样。
这些之前的“同步工具”其实是媒体作者的工具。虽然抓取方式严格来说是违法的,但其实从知识产权的角度来说,这些工具都是在原作者同意的情况下,为内容创业者提供的便利工具,并不存在严重侵犯商业权益的情况。而且从抓取请求来看,只有部分作者使用这个工具,并不是一个集中的任务。其实并没有对微信微信官方账号造成任何伤害。
阿彻不一样。Archer是一个商业爬虫平台,提供抓取微信微信官方账号的规则,通过出售节点实现商业化。事实上,Archer平台的所有用户基本上都没有获得原作者的授权。他们只是在Archer平台上定制爬虫规则和节点进行数据抓取,而且是持续高频。
增加一个爬虫节点,会对这里多一个服务器进行非法的“攻击请求”,确实会对微信微信官方账号平台造成实际的资源损失和数据压力。
如果你不懂法律法规,就不要上来告腾讯。腾讯对不正当竞争的指责其实相当保守。
爬行动物相关的法律问题有哪些?
目前,我国还没有针对爬虫技术的真正的法律或相关规范。从技术角度来说,爬虫是为了高效收集信息而存在的,本身并没有违反法律法规。定义违规其实在于爬虫的使用。普通爬虫遵守中国互联网协会《互联网搜索引擎服务自律公约》中的robots协议,但这一内容并不具备实际的法律约束,但属于商业伦理范畴。
目前大部分不顾robots协议抓取网站内容的行为,都会因涉嫌构成《反不正当竞争法》第二条,即违反诚实信用原则和商业道德的不正当竞争行为原则而被起诉。
当然也要看爬虫爬的是什么。比如抓取一篇文章,可能侵犯原作者的“版权”;抓取他人公司的业务数据,侵犯商业秘密;抓取微博、微信、脸书、Twitter甚至其他平台的用户(姓名、手机、邮箱)等敏感信息,侵犯个人用户隐私;
为了维护民营企业的市场竞争秩序,这类民事诉讼一般会依据《民法通则》、《反不正当竞争法》、《民事诉讼法》进行延伸。
但侵犯公民用户隐私,可以依据《网络安全法》第四十四条,从非法获取个人信息的角度处理。如果这些数据被查获,不仅自己使用,还对外出售,那么可以参照刑法修正案第253条处理侵犯公民个人信息罪。
仔细考虑使用爬行动物的风险。
并不是所有的爬虫都是一棒子打死的,它们的存在是有损他人利益的。比如百度、谷歌、360、搜狗等搜索引擎其实都在使用爬虫技术,但索引和抓取网页内容的方式其实是有利于被爬虫一方的,所以我们不仅不想封杀他们的爬虫,还期望更欢迎他们的爬虫。当然,如果我们不希望爬虫抓取我的内容,我也可以直接通过搜索引擎爬虫机器人协议设置抓取禁止,这样搜索引擎就抓不到你了,自然就没有风险了。
但恰恰相反,我明确写了许可协议,告诉你即使不想爬也要爬。我采取“防爬措施”的时候,你用非法手段绕过了。高频请求对我操作平台的服务器造成了很高的技术压力,影响了我的正常操作,把我抓取的数据卖了????
家里有矿吗?如果你敢这么做,不做你会做谁?
写在最后
很多不好的机构都是打着大数据Python工程师培训的名号来培训的。其实他们是在引导很多不懂行业的无知白人学习爬虫技术。这些人没有专业的法律法规,很容易在不明情况下走上犯罪的道路。并不是所有的公开数据都是随意抓取的。你一定要有这样的认知。
你还打算训练Python写爬虫吗,从入门到入狱的那种?
站外转载请注明来自微信官方账号:网络尖刀,作者:曲子龙,微信官方账号内容转载,可以直接在微信官方账号ID下方留言,我在后台打开白名单。