专栏首页arxiv.org翻译专栏通过顺序依赖关系发现域顺序(CS D)
原创

通过顺序依赖关系发现域顺序(CS D)

许多真实世界的数据都带有明确定义的域顺序;例如,字符串的字典顺序、整数的数字顺序和时间的时间顺序。我们的目标是发现我们还不知道的隐含域顺序;例如,农历中的月顺序是\emph{Corner}\emph{Apricot}\emph{Peach},等等。为此,我们通过顺序依赖(ODs)发现数据中的隐式域顺序来增强数据分析方法。我们首先识别出可处理的特殊情况,然后再进行最一般的情况,证明它是NP完全的。尽管如此,我们仍然可以用SAT解算器来处理一般情况。我们还提出了一个有趣度度量来对发现的隐域阶进行排序。最后,我们在一个属性格发现框架中实现我们的解决方案,并使用真实世界的数据集进行实验评估。

原文标题:Discovering Domain Orders through Order Dependencies

原文:Much real-world data come with explicitly defined domain orders; e.g., lexicographic order for strings, numeric for integers, and chronological for time. Our goal is to discover implicit domain orders that we do not already know; for instance, that the order of months in the Lunar calendar is \emph{Corner} ≺ \emph{Apricot} ≺ \emph{Peach}, and so on. To do so, we enhance data profiling methods by discovering implicit domain orders in data through order dependencies (ODs). We first identify tractable special cases and then proceed towards the most general case, which we prove is NP-complete. Nevertheless, we show that the general case can be still handled by a SAT solver. We also propose an interestingness measure to rank the discovered implicit domain orders. Finally, we implement our solutions in an attribute-lattice discovery framework, and we perform an experimental evaluation using real-world datasets.

原文作者:Reza Karegar, Melicaalsadat Mirsafian, Parke Godfrey, Lukasz Golab, Mehdi Kargar, Divesh Srivastava, Jaroslaw Szlichta

原文地址:https://arxiv.org/abs/2005.14068

原创声明,本文系作者授权云+社区发表,未经许可,不得转载。

如有侵权,请联系 yunjia_community@tencent.com 删除。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • 环境反向散射通信中断性能研究(CS)

    环境反向散射通信(AmBackComs)被认为是物联网的一种频谱和节能技术,因为它允许被动反向散射设备(BDs)将其信息调制成传统信号,例如蜂窝信号,并将它们反...

    蔡秋纯
  • 形式化方法在工业中的应用:25年的轨迹(CS)

    涉及形式化方法的工业应用仍然是一般规则的例外。缺乏理解、员工没有接受适当的教育、难以整合现有的开发周期、没有来自市场的明确要求等等,这些都是人们经常听到的不太正...

    蔡秋纯
  • 私有双终端假设检验(CS IT)

    我们研究带有简单假设的私有两终端假设测试,其中的隐私目标是确保在告知用户正确的假设时,参与测试协议的用户不会透露有关其他用户观察的其他信息。结果显示,通常,如果...

    蔡秋纯
  • GSM Hacking Part ②:使用SDR捕获GSM网络数据并解密

    本文作者:雪碧0xroot@漏洞盒子安全团队 0×00 在文章第一部分 GSM Hacking Part ① :使用SDR扫描嗅探GSM网络搭建了嗅探GSM流量...

    FB客服
  • hdu---(4310)Hero(贪心算法)

    Hero Time Limit: 6000/3000 MS (Java/Others)    Memory Limit: 65536/65536 K (Java...

    Gxjun
  • 又是GAN!这个AI让周杰伦、罗永浩“变脸”古典画像

    最近,一款俄罗斯 AI 换脸“神器” FaceApp 爆红,它能让你上传的照片瞬间变老或者变年轻。

    CDA数据分析师
  • 郑杜涛:从真实世界到CTF

    TCTF是由中国网络空间安全协会竞评演练工作委员会指导,腾讯安全发起,腾讯安全学院、腾讯安全联合实验室主办、腾讯安全科恩实验室承办,0ops安全团队协办的专业C...

    云加社区
  • Itext根据模板生成pdf

    https://cloud.tencent.com/developer/support-plan?invite_code=2nviihzlpmgwg

    故久
  • 聊聊artemis的ConnectionLoadBalancingPolicy

    本文主要研究一下artemis的ConnectionLoadBalancingPolicy

    codecraft
  • 聊聊artemis的ConnectionLoadBalancingPolicy

    本文主要研究一下artemis的ConnectionLoadBalancingPolicy

    codecraft

扫码关注云+社区

领取腾讯云代金券