专栏首页arxiv.org翻译专栏使用Paninian语法自动提取孟加拉根动词(CS.CL)
原创

使用Paninian语法自动提取孟加拉根动词(CS.CL)

当针对一系列学习问题进行优化时,卷积神经网络会遭受灾难性的遗忘:当它们满足当前训练示例的目标时,它们在先前任务上的表现将急剧下降。在这项工作中,我们引入了一个新颖的框架来通过条件计算解决这个问题。我们为 每个卷积层配备特定于任务的选通模块,选择要应用于给定输入的过滤器。这样,我们实现了两个吸引人的特性。首先,门的执行模式允许识别和保护重要的过滤器,从而确保先前学习的任务的模型性能不会损失。其次,通过使用稀疏性目标,我们可以促进选择有限的内核集,从而保留足够的模型能力来消化新任务。现有的解决方案在测试时需要了解每个示例所属的任务。但是,在许多实际情况下可能无法获得此知识。因此,我们另外引入了一个任务分类器,该分类器预测每个示例的任务标签,以处理其中无法使用任务预告片的设置。我们在四个持续学习数据集上验证了我们的建议。结果表明,无论是否存在任务预言,我们的模型始终优于现有方法。值得注意的是,在Split SVHN和Imagenet-50数据集上,我们的模型的w.r.t.精度提高了23.98%和17.42%。竞争方法。

原文标题:Automatic Extraction of Bengali Root Verbs using Paninian Grammar

原文:In this research work, we have proposed an algorithm based on supervised learning methodology to extract the root forms of the Bengali verbs using the grammatical rules proposed by Panini [1] in Ashtadhyayi. This methodology can be applied for the languages which are derived from Sanskrit. The proposed system has been developed based on tense, person and morphological inflections of the verbs to find their root forms. The work has been executed in two phases: first, the surface level forms or inflected forms of the verbs have been classified into a certain number of groups of similar tense and person. For this task, a standard pattern, available in Bengali language has been used. Next, a set of rules have been applied to extract the root form from the surface level forms of a verb. The system has been tested on 10000 verbs collected from the Bengali text corpus developed in the TDIL project of the Govt. of India. The accuracy of the output has been achieved 98% which is verified by a linguistic expert. Root verb identification is a key step in semantic searching, multi-sentence search query processing, understanding the meaning of a language, disambiguation of word sense, classification of the sentences etc.

原文作者:Arijit Das, Tapas Halder, Diganta Saha

原文地址:https://arxiv.org/abs/2004.00089

原创声明,本文系作者授权云+社区发表,未经许可,不得转载。

如有侵权,请联系 yunjia_community@tencent.com 删除。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • 无需探索实时出价的最佳出价策略(CS.LG)

    在预算约束下使效用最大化是广告商在实时出价(RTB)系统中的主要目标。使效用最大化的策略称为最佳出价策略。较早的最优竞标策略研究采用了基于模型的批量强化学习方法...

    蔡小雪7100294
  • 由人的密集姿势识别转移到邻近动物类识别(CS.CV)

    最新的研究表明,给定详细注释的大型姿势数据集,可以密集而准确地识别人的姿势。原则上,相同的方法可以扩展到任何动物类别,但是尽管在自然保护,科学和商业中有重要应用...

    蔡小雪7100294
  • 多语言姿态检测:加泰罗尼亚独立语料库(CS.CL)

    姿态检测旨在确定给定文本相对于特定主题或主张的态度。尽管最近几年对姿势检测进行了很好的研究,但大多数工作都集中在英语上。这主要是由于其他语言中相对缺少带注释的数...

    蔡小雪7100294
  • MCC:用PNML格式展开彩色培养网的工具(CS)

    在本文中,我们介绍了MCC,MCC是为一项非常具体的任务设计的工具:将PNML语法中给出的高级Petri网模型转换为等效的Place/Transition网。 ...

    时代在召唤
  • 计算机如何理解我们的语言?NLP is fun!

    【导读】我们从日常每天都会用到的推荐系统到现在研究火热的开放性聊天、对话机器人,越来越多的产品与应用的背后都需要自然语言处理(NLP)和知识图谱的技术。也有越来...

    AI科技大本营
  • 用Python构建NLP Pipeline,从思路到具体代码,这篇文章一次性都讲到了

    授人以鱼不如授人以渔,今天的文章由作者Adam Geitgey授权在人工智能头条翻译发布。不仅给出了具体代码,还一步步详细解析了实现原理和思路。正所谓有了思路,...

    用户1737318
  • SAP CRM附件在应用服务器上的存储原理解析

    Content Management(CM) was introduced in basis release 6.10 and implemented in C...

    Jerry Wang
  • 用Python构建NLP Pipeline,从思路到具体代码,这篇文章一次性都讲到了

    授人以鱼不如授人以渔,今天的文章由作者Adam Geitgey授权在人工智能头条翻译发布。不仅给出了具体代码,还一步步详细解析了实现原理和思路。正所谓有了思路,...

    用户1737318
  • leetcode554. Brick Wall

    There is a brick wall in front of you. The wall is rectangular and has several r...

    眯眯眼的猫头鹰
  • 机器学习实战 | 第三章:集成学习

    集成学习肯定是在实战中最不可或缺的思想了.毕竟都想把错误率低一点,再低一点,再低一点.看看kaggle大量的集成学习就知道这节肯定绕不过去了. 在这里,仅仅说...

    用户1332428

扫码关注云+社区

领取腾讯云代金券