首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

又被大量收集数据,Kindle“监控”你读书

作为书迷,我购买过很多版本的Kindle设备,从最初版本到Paperwhite都有,并对每一版都很喜欢。但我对这个全新文本格式的潜在滥用情况心怀警惕。

从技术上来讲,亚马逊持有读者们阅读内容的所有权,他们随时可以删除这些内容。之前就曾经出现过亚马逊从客户账户及他们的Kindle删除特定书目的情况。这还不是最糟的,亚马逊甚至可以删除用户账户并撤销用户对已购买书籍的访问权限

Kindle利用用户阅读数据来提供一些传统书籍无法提供的功能:管理设备间书签和笔记,同步所有设备中最后阅读位置等等,Kindle同样可以显示广告或相关阅读推荐。

我想知道Kindle是否只会上传这些服务需要的数据,还是会将用户相关数据一同上传给亚马逊。

事实证明,Kindle收集了海量的数据

Kindle不仅会发送设备信息,使用大量元数据,甚至是用户在使用设备或app进行的所有操作都会被发送,这些数据都与用户账户直接连接。

打开app、读书、翻页、关闭书籍,这些简单的操作会向亚马逊服务器上传上百条请求数据。

Kindle数据请求

侵犯隐私的行为信息

总的来说,用户在读书时手指的每一次点击或互动都会被Kindle追踪。

读者阅读的每一页书籍都会发送下列信息:

  • 每页打开时间:每当读者翻页,都会生成一个时间戳
  • 每页的首个单词/文字:会以诸如“书中第7705个字”的形式记录其具体位置
  • 每页最后一个单词/文字
  • 该页是文字还是图片

以下是读者在阅读每页时会被发送的简单记录:

代码语言:javascript
复制
{
    "created_timestamp": 1597743233808,
    "payload": {
        "context": "Reading",
        "continuous_scroll_state": "disabled",
        "end_position": 4708,
        "is_scrolled_over_span": false,
        "span_type": "Text",
        "start_position": 4193
    },
    "schema_name": "kindle_positions_consumed_v2",
    "schema_version": 0,
    "sent_timestamp": 1597743233855,
    "sequence_number": 26
}

每个阅读区间都会生成一个阅读页数与浏览模式的总结。

代码语言:javascript
复制
{
    "created_timestamp": 1597743255324,
    "payload": {
        "action_type": "PageTurn",
        "book_length": 2003478,
        "context": "Reading",
        "count": 10,
        "navigation_end_location": 7884,
        "navigation_mode": "Horizontal",
        "navigation_start_location": 3599
    },
    "schema_name": "reader_in_book_navigation_v2",
    "schema_version": 0,
    "sent_timestamp": 1597743265854,
    "sequence_number": 36
}

打开app时同样会上传类似数据,包括应用是否在后台开启、书籍是打开或关闭、诸如字号等设置是否有变动等。高亮或双击单词/词语,会在将其发送到bing翻译或维基百科的同时发送回亚马逊。

这些请求都不是像上次阅读位置这类的数据一样用于客户功能的。高亮、上次阅读位置,以及其他一些信息都会在一定周期内被再次发送向不同目的地,区别在于第二次发送所包含的信息量会大幅减少。

每条请求都不会在生成的同时上传。很多记录生成后会先保存在本地,然后才会被上传(注意前面的sequence_number字段)。即使用户在离线情况下阅读,一旦联网,这些存储在本地的数据都会被上传。

设备信息

Kindle同样会上传一些私人信息,诸如:

  • 用户所在国家
  • 试图获取本地网络IP地址(Kindle获取到作者的地址为10.,并不准确)
  • 设备和版本信息(屏幕大小、品牌、设备型号),iPhone/安卓/Kindle软件版本
  • Good Reads账户信息
  • 设备方向(横屏/竖屏)

部分数据可能会帮助亚马逊了解用户对app的使用情况,方便他们后续调整。但本地IP是唯一一个困扰作者的数据,虽然除了IP作者并没有发现什么其他被上传的本地网络信息有问题。

结论

Kindle可以说是我见过对用户隐私最不手下留情的app了,它记录了很多令我感到不适的阅读行为数据。在过去的几年中,我一直在尝试避免使用Kindle生态系统,目前在用Marvin在iPhone上阅读。虽然已经不再用Kindle设备了,但还是难免会怀念e-Ink。

不幸的是,如果使用非Kindle应用,就需要买DRM-Free的书。这类书并不是很好找,但Kobo书店以及一小部分利基供应商经常会提供这类书,有些甚至还能在亚马逊上找到。

相关阅读:

Kindle Collects a Surprisingly Large Amount of Data

  • 发表于:
  • 本文为 InfoQ 中文站特供稿件
  • 首发地址https://www.infoq.cn/article/R4RyYqYCtf8Cs7oRPHl2
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券