专栏首页arxiv.org翻译专栏差异性私人文本表征(CS LG)
原创

差异性私人文本表征(CS LG)

大多数深度学习框架要求用户将其本地数据或模型更新汇总到受信任的服务器,以训练或维护全局模型。在许多应用程序中,假设一个可信的服务器可以访问用户信息是不合适的。为解决此问题,本文在不受信任的服务器设置下开发了一个新的深度学习框架,其中包括三个模块:(1)嵌入模块,(2)随机化模块和(3)分类器模块。 对于随机模块,本文提出了一种新的局部差分私有(LDP)协议,以减少隐私参数ϵ对准确性的影响,并为选择LDP的随机概率提供了更大的灵活性。实验表明,本文的框架与非私有框架和现有LDP协议相比,具有可比甚至更好的性能,这证明了LDP协议的优势。

原文题目:Towards Differentially Private Text Representations

原文:Most deep learning frameworks require users to pool their local data or model updates to a trusted server to train or maintain a global model. The assumption of a trusted server who has access to user information is ill-suited in many applications. To tackle this problem, we develop a new deep learning framework under an untrusted server setting, which includes three modules: (1) embedding module, (2) randomization module, and (3) classifier module. For the randomization module, we propose a novel local differentially private (LDP) protocol to reduce the impact of privacy parameter ϵ on accuracy, and provide enhanced flexibility in choosing randomization probabilities for LDP. Analysis and experiments show that our framework delivers comparable or even better performance than the non-private framework and existing LDP protocols, demonstrating the advantages of our LDP protocol.

原文作者:Lingjuan Lyu, Yitong Li, Xuanli He, Tong Xiao

原文地址:https://arxiv.org/abs/2006.14170

原创声明,本文系作者授权云+社区发表,未经许可,不得转载。

如有侵权,请联系 yunjia_community@tencent.com 删除。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • 一种发音模式:使用变形金刚合奏的多语种字形音素转换(CS CL)

    字形到音素(G2P)的转换对于语音识别和合成都具有重要意义。与其他语音和语言处理任务类似,在只有小规模训练数据的情况下,学习G2P模型是一项挑战。本文描述了一种...

    用户7454091
  • 使用凝视对指称和非指称进行分类(CS CL)

    在处理文本时,人和机器必须消除代词it的不同用法,包括非指称、名词性回指或从句回指。在本文中,使用眼动数据来了解人类如何消除歧义。本文利用这些知识来改进它的自动...

    用户7454091
  • 在不确定的情况下,转向数据驱动的平权行动政策(cs)

    本文研究的是在一个集中式系统下的大学招生,该系统使用等级和标准化考试分数来匹配申请者的大学项目。本文考虑的是平权行动政策,旨在增加来自弱势群体的录取人数。由于这...

    用户7454091
  • 解决网络安全数据的共享悖论,通过数据共享的共同生产方式扩大网络安全规模(cs.CR)

    随着网络犯罪分子扩大行动规模以增加利润或造成更大的危害,我们认为,同样需要通过扩大网络安全规模来应对其威胁。为了实现这一目标,我们必须通过克服网络安全数据共享悖...

    用户8078797
  • What is agile software development?

    Agile software development is a set of management framework and practices to dev...

    用户4822892
  • 个性化语法纠错:根据能力水平和 L1 进行调整(CS CL)

    语法纠错 (GEC) 系统在各种软件应用中已变得无处不在,并已开始在某些数据集上接近人类水平的性能。然而,对于如何根据用户的特点(如用户的熟练程度和第一语言)或...

    刘持诚
  • 也许你并不需要 REST

    Nearly 10 years ago, Leonard Richardson and Sam Ruby publishedRESTful Web Servic...

    李海彬
  • 什么是python/django web程序员在三个月内应该学习的知识

    This is a collection of things I think any beginner web developer working on the...

    小小科
  • 提高系统开发过程安全性的软件、攻击者及以资产为中心的方法[cs.SE]

    安全开发过程是开发人员采取的一种程序,以确保开发的程序符合一般的安全标准,并始终是最新的,以确保结果是安全的和服从的。作为软件开发人员,为客户和用户实现和开发一...

    用户8078797
  • 患者的个人健康知识图(CS.AI)

    现有的患者数据分析平台无法整合具有上下文,个性化和主题性的信息。为了使推荐系统对查询做出适当的响应或从患者数据中得出有意义的见解,推荐系统应考虑有关患者健康史的...

    蔡小雪7100294

扫码关注云+社区

领取腾讯云代金券