码农编写“爬虫”程序是犯罪?

导读

最近微信朋友朋友圈有条“只因写了一段爬虫,公司200多人被抓!”的文章十分火爆,内容大概是某数据公司的一位程序员编写一段爬虫代码用以收集数据,后被公安刑事立案,公司职员几乎全部被抓,公司被查封。

一时间,风声鹤唳,不少码农电话咨询律师,问自己从事的工作是不是离监狱不远了。

回答类似这种咨询,首先要肯定一点就是,单纯的编写代码的行为,在现代文明国度中是不可能构成犯罪,一定是有其他因素或行为导致码农涉嫌刑事犯罪。

让我们先从爬虫代码是用来干嘛的说起。2何谓“爬虫”随着互联网发展,信息数据大爆发。这些信息数据价值需要被分类收集。
如果依靠人工分类收集的话,低效和高成本,让其变成一项不可能完成的任务。
于是一种按照一定规则,自动收集互联网信息数据的程序就出现了,这种程序被称为网络爬虫。

几乎所有的搜索引擎都需要使用到“爬虫”技术,常见的百度蜘蛛,搜狗蜘蛛等。
现在大数据时代,利用爬虫收集的数据来分析决策的公司越来越多,例如:企业产生的数据:百度搜索指数、腾讯公司业绩数据、阿里巴巴集团财务及运营数据、新浪微博微指数等。
数据平台数据:数据堂、国云数据市场、贵阳大数据交易所等等。
但是为什么新闻报道会对“爬虫”获刑大量报道呢?我们先看几个案例。
3 从判决看入刑考量因素①(2013)海刑初字第2725号郑×等侵犯著作权罪一审刑事判决书
法院审理查明:
(涉案网站)内容是他人网站上的内容,都是其网站通过框架显示其他网站内容。其网站上收录的是其利用“爬虫”软件自动搜索的网络小说,其对网站上收录小说的数量不清楚。其觉得网站收录的小说应该都有著作权,因为都让加盟网站给其发声明,注明他们收录的都是正版作品。其没有见过著作权人的授权。评议:这个案件是被告人建设网站,使用“爬虫”软件,直接复制他人的著作权作品并出售获利。“爬虫”软件相当于犯罪工具。 ②(2014)杭余刑初字第1231号黄后荣、翁秀豪非法获取计算机信息系统数据、非法控制计算机信息系统罪一审刑事判决书

法院审理查明:被告人黄后荣利用被告人翁秀豪事先编写的网络爬虫程序读取虚拟队列中的cookie并获取淘宝用户的交易订单数据(内容包含用户昵称、姓名、商品价格、交易创建时间、收货人姓名、收货人电话、收货地址等)达1亿余条。
评议:这个案件是被告人通过发放电子购物券的形式,将具有“爬虫”功能的脚本植入淘宝店,通过抓取cookie中的用户数据,目的就是获取大量淘宝买家的信息,并将这些信息出售获利。 ③(2017)沪0104刑初325号段某某侵犯著作权一审刑事判决书
法院审理查明:
“窝窝电影网”(运营前期网址为www.wowody.net,后期变更为www.wowo123.com)的视频网站,未经著作权人许可,利用视频“搜索爬虫”技术,针对乐视、土豆等各大知名视频网站的影视作品设置加框链接,为提高网站的知名度和被链影视作品的点击量,在网页内设置目录、索引、内容简介、排行榜等方式推荐影视作品,吸引用户点击播放,并为提高用户粘度,利用技术措施屏蔽权利人设置在部分影视作品上的片头广告。“窝窝电影网”运营期间,段某某主要以在网页内发布广告,从网络“广告联盟”处收取费用等方式牟利,至2016年5月案发,收取广告费用共计人民币74万余元(以下币种均同)。评议:这个案件被告人利用“爬虫”软件抓取几个著名视频网站的url并分析,然后利用套框技术直接播放具有著作权的视频,并获取74万广告费。 ④(2018)川0191刑初94号彭中正、吕雷、周敏侵犯公民个人信息罪一审刑事判决书
法院审理查明:
公司的爬虫组负责爬取互联网上公开的数据,负责人是郭某;数据组负责对爬取的数据进行分析挖掘,爬虫组会爬取电商的评论、商品价格、商品详细情况、销量,爬取微博的内容、关注关系、注册基本信息,爬取招聘网站的公司招聘信息、注册信息,也爬过淘宝网上的数据,包括一些淘宝网页上的买家用户名,购物后的评价,淘宝买家购买的商品价格。公司客户主要是一些金融机构,如银行、消费金融公司、小贷公司。他们购买或售卖的数据中不包括公民个人信息,全是他们爬取的公开数据,或是其他数据公司爬取的公开数据。评议:这个案件是技术人员最容易犯的案件之一,我国审理侵犯公民信息犯罪的精神也在于此:“无论是从公司窃取还是自己加工获取,未征得他人同意收集信息,均系非法手段,不影响本罪的构成。” 4结语
综上所述,有些利用“爬虫”技术直接侵犯他人著作权、破解他人软件和入侵他人计算机系统等行为,是具有比较明显犯罪外观,比较容易防范。
另外,对于利用公开信息数据加工的行为,如果没有法律防控岗进行风险防控的话,很有可能构成侵犯公民信息犯罪。

(本文作者:盈科何豪华律师)