你的爬虫会送老板进监狱么

各互金公司CTO们请看好你们家的爬虫,要不然一不小心就会把老板(法人代表)送进监狱,不是闹着玩的,按2017年6月1日,《网络安全法》以及最新刑事司法解释:

- 未经授权爬取用户手机通讯录超过50条记录,老板进去最高可达3年

- 未经授权抓取用户淘宝交易记录超过500条的,老板进去最高可达3年

- 未经授权读取用户运营商网站通话记录超过500条以上的,老板进去最高可达7年

- 未经授权读取用户公积金社保记录的超过50000条的,老板进去最高可达7年

更多的违规情况就不一一举例了。 就以上几种数据,作为有效的信用基础数据,有几家互金公司不在用的?各位的爬虫完全合法地取得用户授权了么?有多少爬虫完全忽略robots.txt内容肆意横行的?有多少爬虫甚至暴力破解人家网站密码的……

如果是以销售数据为主营业务的大数据公司,更加要注意,因为一不小心你卖了点数据给犯罪分子,造成了恶劣的社会影响,要从重从严的判决。到目前为止,实务中由于审判人员对个人信息犯罪的危害性并不确定,大部分法院是作出法定刑三年以下的判决,但是最新的法条对重刑情节予以明确,量刑本身起点低,如依违法所得标准,违法所得在5万以上的,即可构成重刑。因此有学者预测,《解释》正式实施后,侵害个人信息犯罪适用重刑可能会出现激增现象。

大数据行业近日风声鹤唳,据一本财经报道,“数据堂”多人被警方调查,导致部分数据业务线停摆。至于被调查原因,知情人称,数据堂曾给一家理财营销公司提供了大量涉及用户隐私的数据。数据堂的主要商业模式是通过网络爬虫、公共领域共享等方式获取数据,而后对数据进行处理,而后向客户提供服务获取收益。 在没有得到任何授权的情况下,数据堂为理财营销公司提供用户数据有数据倒卖的嫌疑。除此之外,另有15家公司进入了调查名单,都是一些明目张胆,做得颇为过分的公司,其中几家大数据公司,估值已几十亿。

一些技术能力溢出的互金公司,已经在做类似数据公司的业务,对外以各种形式输出自身积累的数据,高管层的法律风险也逐渐显现。

司法解释里面提到以下集中类型的数据,无论是“非法提供”和“非法获取”都可以入刑:

  1. 第一类:高度敏感信息,包括四种信息:行踪轨迹信息、通信内容、征信信息、财产信息。涉及高度敏感信息的违法活动,由于定罪门槛最低,因此严格限制在此四类,不做任何扩展;
  2. 第二类:敏感信息,即住宿信息、通信记录、健康生理信息、交易信息等其他可能影响人身、财产安全的公民个人信息。与第一类相比较,《解释》对第二类信息的界定仍留有空间,意味着在司法实践中,仍有可能会出现目前所列举之外的第二类信息类型;
  3. 第三类:其他个人信息。即上述第二、三类以外的个人信息。个人信息的类型是定罪量刑的重要依据。越敏感信息,达到定罪门槛的信息数量越少。

只要违反国家规定获取个人信息,信息获取者无法主张其获取信息的正当理由的,无论是以“窃取”等本身非法的手段来获取,还是以“购买、收受、交换”等其他手段,都可被认为“非法获取”。

就互联网数据而言,目前主要的取得方式是利用爬虫自动搜索并抓取数据,爬虫协议要求所有网站在其站点的根目录下放置一个“robots.txt”文件,该文件告诉搜索者本站点哪些数据可以被“抓取”。这就意味着如果有人突破“robots.txt”范围抓取网站数据就要承担“侵犯数据”的法律责任。

在用户手机App端,如果未经用户明确授权,提取用户姓名、通信通讯联系方式、账号密码、行踪轨迹等信息,也必须承担法律责任。至于用户授权的形式,法律虽未明确,但如果存在恶意诱导和欺骗的行为要求用户授权,则很有可能招致刑罚。法律的导向是,任何个人身份信息,以电子或者其他方式记录的能够单独或者与其他信息结合识别特定自然人身份或者反映特定自然人活动情况的各种信息,未来都将受到严格的隐私权保护。

社会对个人隐私的保护越来越到位,是一件好事,互金数据乱象已久,大家可能都离风险比较近,无论是内部采集还是外购,总之一句话,爬虫有风险,抓数需谨慎,干活之前先跟自家法务勾兑清楚。

END.

来源:Fintech技术圈

原文发布于微信公众号 - PPV课数据科学社区(ppvke123)

原文发表时间:2017-06-09

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏木子昭的博客

坚持在简书写博客的好处

781
来自专栏极乐技术社区

小程序一周报 | 第三方小游戏可正式发布 / 跳一跳小游戏皮肤上线

1262
来自专栏老九学堂

8个程序猿必看冷门小知识

想要成为一名成功的程序员 我们除了了解不同编程语言的设计思路 也应当了解编程的发展历史 从而判断未来的编程技术将走向何方 下面就为大家普及下 计算机发展历程中的...

3635
来自专栏VRPinea

Exelus推出Nomadeec,或可利用Holoens实现远程医疗

3068
来自专栏知晓程序

微信朋友圈屏蔽今日头条 / 小程序「功能直达」新能力上线 / 腾讯传播「儿童邪典视频」被严处

最近,有网友发现转到朋友圈「今日头条」内容有时仅自己可见,而好友无法看到自己的分享。

1301
来自专栏顶级程序员

体验了150个小程序以及我的思考

【高频使用】 美团外卖+ 纯点餐没有叽叽歪歪的各种活动让你不知道吃什么,自动定位功能比较准,第一次登陆要绑定下手机号,大多数人的好评小程序。 滴滴公交查询 基...

6479
来自专栏云计算D1net

工信部电信研究院:云无信不立

主持人: 非常感谢朱总的演讲和演示,之前我们所做的云计算市场调研中发现,客户对于云安全的信任和认可将直接决定客户的接受度。接下来工信部电信研究院主任何宝宏将和我...

3294
来自专栏FreeBuf

物理Hacking之通过摄影收集情报

*免责声明:本文提供的工具和方法仅供安全研究用途,禁止非法用途 介绍 在渗透过程中的第一阶段就是尽可能的多收集关于目标的信息。实际上这是进行渗透时最关键的步骤之...

1865
来自专栏知晓程序

香港血拼之旅,又劳心又烧钱?不存在的,这款小程序帮你包办!

走在被誉为「购物天堂」的香港,随时都有可能被销售衣服、化妆品或是电子产品的店铺吸引,让人忍不住就大喊「买买买」。

1032
来自专栏腾讯大讲堂的专栏

奔走相告!登机忘记带身份证 刷个“二维码”就能行

你有过起了个大早赶到机场,却忘带身份证的”悲惨”经历吗? 当时的你有以下几种选择: A.时间允许的情况下,请家人快马加鞭送到机场。(p.s.这条不适合单身狗...

7431

扫码关注云+社区