2019年数据泄露全年盘点,让人“触目惊心”

在网络安全领域,数据泄露堪称2019年最引人关注的话题之一。 小到公民个人,大到企业、政府乃至国家,都陷入了数据泄露事件。

2019年,数据泄露事件层出不穷,影响深远,涉及金融保险、教育、医疗、科技和政府等行业。并且,受数据泄露影响的用户范围广泛,类型多样,既有网站注册用户、大学员工、医疗患者,也有艾滋病感染者、警察、孕妇等。

最近一两年,数据泄露事件愈加频繁,受影响用户不断扩大,少则数千万,多达数亿乃至十几亿。当笔者撰写此文时,一个Elasticsearch数据库泄露,包括27亿个电子邮件地址,其中10亿个密码是以简单的明文存储,涉及国内多家互联网公司。

根据IBM的数据泄露年度研究,如果将通知成本、调查、损失控制和修复的相关费用,以及监管部门罚款和诉讼考虑在内,那么数据泄露的平均成本高达392万美元。比如,2018年闹得沸沸扬扬的Facebook数据泄露一事,Facebook2019年以50亿美元与美国FTC和解。对于上市公司,数据泄露一旦公开,可能导致涉事公司平均股价应声下跌7.27%,而股价低迷在随后几年将成为现实。据FireEye估计,面对网络攻击或数据泄露,只有不到一半的组织已经做好了准备。

因此,我们盘点2019年最大的10起数据泄露事件,试图得到一些更深的认识。

TOP1:Elasticsearch 27亿数据泄露

报道时间:12月4日

大致情况:

12月4日,国外网络安全研究人员发现一个Elasticsearch数据库泄露,包括27亿个电子邮件地址,其中10亿个密码都是以简单的明文存储。据悉,大多数被盗邮件域名来自中国邮件提供商,涵盖腾讯、新浪、搜狐和网易等。另外,雅虎、Gmail以及一些俄罗斯的邮件域名也受到影响。

数据类型:电子邮件地址、密码等

泄露原因:未知

后续:12月9日,该数据库被禁止访问

TOP2:Verifications.io 9.8亿数据泄露

报道时间:3月7日

大致情况:3月7日,Security Discovery 安全研究人员 Bob Diachenko披露一个可公开访问的MongoDB 数据库,包含982864972条记录。据悉,这些记录包含7.98 亿的电子邮件记录、超过 400 万备注了电话号码的 E-mail 地址、以及超过 600 万条被识别为‘商业线索’的信息。

数据类型:姓名、地址、电子邮件地址、出生日期、电话号码、传真号码、性别、IP地址、邮政编码

泄露原因:数据库配置错误而暴露于网上

后续:网站脱机,公司称已对数据库做好保护

TOP3:First American Financial Corporation 8.85亿数据泄露

报道时间:5月24日

大致情况:

5月24日,独立安全记者Brian Krebs透露,美国房地产和产权保险巨头First American 8.85亿份敏感客户财务记录被泄露。据悉,这些记录可以追溯到2003年,而且任何人都可以进行访问。Krebs称攻击者如果知道该公司文档的url格式,就可以通过输入以 “000000075” 开头的任何记录号,调出相关客户材料。

数据类型:姓名、社会安全号码、电话号码、电子邮件、地址、驾照、银行账号和对账单、抵押贷款和税务文件,以及电汇收据

泄露原因:IDOR漏洞

后续:公司关闭网站,禁止外部对该应用程序的访问,内部进行审查

TOP4:16家国外网站6.2亿用户数据泄露

报道时间:2月13日

大致情况:

2月13日,据国外媒体The Register独家披露,一个名为Dream Market的暗网市场正在出售6.2亿用户信息,交易通过比特币转账,打包售价不高于2万美元。该卖家宣称这些数据来自16个被攻击的网站:

Dubsmash(1.62亿)、MyFitnessPal(1.51亿)、MyHeritage(9200万)、ShareThis(4100万)、HauteLook(2800万)、Animoto(2500万)、EyeEm(2200万),8fit(2000万)、Whitepages(1800万)、Fotolog(1600万)、500px(1500万)、Armor Games(1100万)、BookMate(800万)、CoffeeMeetsBagel(600万)、Artsy(100万)和DataCamp(70万)。

数据类型:账户持有人姓名、电子邮件地址、位置、密码、社交媒体身份验证信息等

泄露原因:黑客攻击

后续:在暗网被贩卖

TOP5:Cultura Colectiva 5.4亿数据泄露

报道时间:4月3日

大致情况:

4月3日,有安全人员发现两个 Facebook 集成应用的数据集,这些应用不受保护地在 Amazon S3 服务器上存储。其中一个应用来自名为 Cultura Colectiva 的墨西哥公司,该公司存储了 146 GB 大小的用户数据,总计超过 5.4 亿条记录。研究人员通知了 Cultura Colectiva 和亚马逊网络服务部门,让他们知道数据公开曝光这件事。第一封电子邮件通知在今年 1 月 10 日发出,然而直到4月份,数据库才得到保障。

数据类型:Facebook用户ID、账户名、评论和喜欢的内容

泄露原因:数据库配置错误

后续:数据库得到很快保护

TOP6:2.75亿印度公民个人信息泄露

报道时间:5月1日

大致情况:

5月1日,据外媒Security Discovery报道,他们发现一个未经保护和公开索引的MongoDB数据库,其中包括275265298条印度公民个人信息记录。这个数据库本身托管在亚马逊AWS上,没有泄露源或从属关系的标签,反向DNS也没有显示任何结果。

数据类型:印度公民姓名、电子邮件地址、性别、出生日期、电话号码、教育详细信息、就业详细信息(工资、专业技能、雇主历史记录等)

泄露原因:黑客窃取

后续:外媒反馈给印度CERT团队

TOP7:Zynga2.18亿游戏玩家数据泄露

报道时间:10月1日

大致情况:

一名巴基斯坦黑客声称声称入侵移动社交游戏公司Zynga。这位黑客设法突破由Zynga开发的流行字谜游戏“Words with Friends”,并未经授权访问超过2.18亿用户的庞大数据库。数据泄露影响所有今年9月2日及之前注册游戏的安卓和iOS游戏玩家。此事被披露后,Zynga承认数据泄露。

据悉,Zynga市值超过50亿美元,是全球最成功的社交游戏开发商之一,拥有超过10亿美元的热门在线游戏集合,包括FarmVille、Words With Friends、Zynga Poker、Mafia Wars和CaféWorld等。

数据类型:姓名、电子邮件地址、登录ID、密码、密码重置令牌(如果有)、电话号码(如果有)、Facebook ID(如果已连接)、Zynga帐户ID

泄露原因:黑客入侵

后续:该公司与执法部门联系,并采取措施保护用户账户

TOP8:2.02亿中国求职者个人信息泄露

报道时间:1月10日

大致情况:

1月10日,HackenProof安全研究员Bob Diachenko发现,MongoDB数据库中有超过2.02亿中国求职者的详细简历信息已在网上被公布,疑似第三方应用泄露。经一位Twitter用户查证,已被删除的应用主要来源之一是bj.58.com。据悉,这份数据库存储的2.02亿简历中包含202730434 条记录,信息非常详细,总计854GB。

数据类型:求职者姓名、身高、体重、地址、出生日期、电话号码、电子邮件地址、政治倾向、技能、工作经历、工资预期、婚姻状况、驾驶执照号码、专业经验和职业期望

泄露原因:数据库配置错误

后续:事件披露后不久,该数据库被加入保护机制

TOP9:Dubsmash 1.62亿用户数据泄露

报道时间:2月12日

大致情况:

2月13日,据Register报道,有近6.17亿个在线账户的详细信息在暗网上出售,这些账户是黑客从16个网站上窃取的。其中,数据泄露最多的是Dubsmash,有1.62亿账户信息被泄露。

据悉,Dubsmash 公司创立于 2014 年,在其应用程序上,用户可以进行对嘴型表演,题材覆盖了卡通动画以及电影和广告短片等,短片录制完成后,可以分享给他人。

数据类型:用户姓名、ID、电子邮件地址、用户名、密码等

泄露原因:黑客窃取

后续:数据被黑客出售

TOP10:Canva 1.39亿用户数据泄露

报道时间:5月24日

大致情况:

5月24日,一名自称GnosticPlayers 的黑客声称窃取了澳大利亚网站 Canva 的 1.39 亿用户数据。据悉,黑客窃取的数据包括用户姓名、用户名、电子邮件地址、城市国家信息,其中 6100 万用户的哈希密码,其他用户的信息还有用于登陆的 Google 令牌。有 7800 万用户使用了 Gmail 地址。Canva 证实它的数据库遭到非法访问,表示尚未发现账号被入侵,出于谨慎考虑它已经鼓励用户更改密码。

Canva 是一个非常受欢迎的平面设计服务,在Alexa 排名200 以内。

数据类型:姓名、用户名、电子邮件地址、位置信息等

泄露原因:黑客窃取

后续:公司通知用户更改密码

截至笔者撰写此文,上述是2019年TOP 10数据泄露事件。它们有两大特点:一是泄露数据惊人,动辄亿级,且受影响用户数巨大。更夸张的是,甚至有几十亿的数据泄露。

二是泄露数据内容详细,维度多,颗粒度细。以2.02亿中国求职者个人信息泄露为例,泄露数据维度有15种,几乎包含了其他人想知道的“所有信息”。如果这些信息被不法分子所利用,可以生出“无穷祸患”。

当然,这10起数据泄露虽然被视为“TOP 10”,但是过少的数据泄露事件无法揭示更多信息。因此,笔者进一步统计了2019年媒体公开报道的数据泄露事件(注:因个人收集渠道有限,难免有遗漏,欢迎读者补充

2019年,笔者从公开渠道统计出数据泄露事件一共有43件,如下表:

数据泄露统计

数据泄露原因

(注:在这里为方便统计,将黑客入侵和黑客窃取统一归为黑客行为)

这43起数据泄露事件,泄露原因多种多样,既有黑客行为造成,比如黑客入侵,又有数据库配置错误、网站漏洞、非授权访问以及“内鬼”等诸多原因。

泄露原因占比

从统计的泄露原因中,我们发现:42起数据泄露,黑客入侵和窃取有14起,占比超过三分之一;其次是公开数据库,这往往是一些数据库,未加保护而暴露于互联网上。因公开数据库造成数据泄露的事件有7起,达到16%。第三则是非授权访问和数据库配置错误。

以数据库配置错误为例,根据《2019 年云安全报告》显示,大约有 40% 的组织表示,云平台配置不当是他们最担心的网络安全问题。一位名叫Ericka Chickowski的人写道,“对互联网服务(Internet-as-a-service,IaaS)的依赖和对云数据存储的错误配置,是导致当下一些最具破坏性的云入侵和数据泄露的主要原因。无论是错误地关闭云提供商标准化的默认安全设置,还是使用默认密码,或者对某些服务允许不受限制的访问,以及其他种种原因,错误配置问题都会带来大量隐藏风险。“

值得注意的是,我们发现“内鬼”所为同样是某些数据泄露的原因。为利益驱使,组织内部人员会私自盗窃数据,造成数据泄露,智联招聘、趋势科技、加拿大Desjardins信用合作社和俄罗斯Sberbank就是例子。

因此,我们尤其需要注意这六大数据泄露原因:黑客、公开数据库、非授权访问、数据库配置错误、“内鬼”和网站漏洞。

其次,我们试图观察哪些行业更容易发生数据泄露。

在所有的数据泄露事件中,科技行业数据泄露事件最多,占比为37%,相当惊人。众所周知,科技行业是信息化、数字化程度最高的行业,善于利用数据,发挥数据价值,因此其拥有的数据更完善、颗粒度更细、价值更大。

其次是政府机构,数据泄露占比排名第二,为16%。作为管理机构,政府会收集大量的社会经济和公民各种信息。因此,其数据价值巨大。

然后是金融和医疗,占比分别是14%和9%。金融业是钱之汇集地和流通地,其手中的数据自然价值极大。并且与普通行业相比,金融业的数据“更值钱”。可以说,金融业一直是数据泄露的“常客”。在全部6起与金融相关的数据泄露事件中,黑客窃取和“内鬼”所为是主要原因,此外还有安全漏洞。

医疗行业与每个人息息相关。医疗机构往往会建立病人信息档案,比如病历等,这些信息不仅包括基本的个人信息,而且还有关于病人身体状况的详情,这些数据价值意义重大。据悉,黑市对健康数据的需求已经使医院成为攻击者的首选目标。这些攻击者或内部人员可能利用医院信息系统中的内部漏洞。

如果从时间上看,2019年,数据泄露有两个高峰期,一是4月,有6起媒体报道的数据泄露事件;二是9月和10月,同样有6起。(不过,需要说明的是,有大量的数据泄露事件未知或者没有被媒体报道。)

此外,数据泄露不分国家,43起数据泄露涉及全球16个国家,包括美国、英国、中国、澳大利亚、印度、厄瓜多尔等等。

然而,需要说明的是,互联网上有大量的数据泄露事件“未知”或没有被媒体报道。笔者统计出的43起数据泄露,仅仅是冰山一角。

数据泄露冰山理论

对于数据泄露,启明星辰一位数据安全专家表示,“数据丢失和个人信息泄露事件频发,黑灰产造成的内部恶意数据泄露事件不断出现,社会热点事件层出不穷。这些都与数据的属性从内部资产向价值资源的转变有关。

如今,数据的高价值资源属性让数据泄露带来的损失不断升级,同时也带来非常不好的社会影响,甚至危害国家安全。

知道创宇CTO兼COO杨冀龙在笔者的一次采访中,谈到数据泄露时说,“数据泄露是个20年的老话题了,还是很难(防止数据泄露)。现在,国家出台相关法律法规,(情况)好多了,比如等级保护法有要求,而有公民隐私数据的企业必须过等保安检。“

并且,现在“两高”司法已经有解释: 泄露用户通信内容五百条即可入罪。

无疑,法律法规的颁布施行有利于遏制数据泄露的频频发生。

对企业或组织机构而言,数据泄露采取积极主动的态度,避免数据泄露事件发生。那企业和组织机构可以采取哪些措施防止数据泄露?

启明星辰数据安全专家给出了3条建议:

1.完善数据安全防护手段

当前,企业对数据安全主要采取防范计算机病毒、网络攻击、网络侵入的网络边界防护和终端管控手段,缺少对内容的深度识别或感知技术,并且缺少对敏感数据的全方位治理和安全管理手段。

敏感数据是什么、存放在什么位置、流转经过哪些节点、数据泄露后如何溯源追责,企业都应该采取相应的数据安全产品和技术手段来解决这些问题。

2.建立可落地的行业性数据安全规范和企业数据安全管理制度

最近几年,数据安全已经被逐步纳入国家法规和行业规范中,包括《网络安全法》、《网络安全等级保护基本要求2.0》、《个人信息安全规范》、欧盟《GDPR》等。数据安全已经成为新一代信息安全标准的基本内容。

虽然这些已颁布的法律法规对数据安全和个人信息保护进行了明确立法规定,对各类组织承担的数据安全保障义务与责任进行明确要求,并保障个人对其个人信息的安全可控。

这位专家表示,“如果上述法规要指导企业落实具体的数据安全保护手段,仍然需要结合具体行业特点,对数据安全防护的技术手段进行明确要求,增强可落实性和可执行性。”

3.提高安全意识,增加对内部数据泄露风险的防护

目前,企业对数据安全的投入,主要是针对外部攻击的防护,如防火墙、IDS、防病毒软件等,而这些技术手段很难对内部人员有意或无意的泄露行为进行识别和防护。

调查结果表明,绝大部分的泄露风险来自企业内部,其中邮件外发和互联网上传是两个最方便的数据外传手段,也是泄露事件发生概率最高的两个渠道。

因此,企业应加强对内部员工或运维人员的安全意识管理,增加对数据防泄漏产品的投入,实行对内部人员泄露行为的检测和管控,降低内部人员有意无意的拷贝、外发和上传等操作带来的数据泄露风险。

本文是InfoQ“解读2019”年终技术盘点系列文章之一

  • 发表于:
  • 本文为 InfoQ 中文站特供稿件
  • 首发地址https://www.infoq.cn/article/tMIgjgmagamm6prutRiF

扫码关注云+社区

领取腾讯云代金券