专栏首页arxiv.org翻译专栏复杂作业中的无监督关键字短语关系分类(CS CAS)
原创

复杂作业中的无监督关键字短语关系分类(CS CAS)

复杂作业是一个开放式的问题,其内容各不相同,而与课程和交流方式的多样性无关。规模庞大而来的是评论不完整,缺少细节的问题,从而导致高等级的要求。因此,为了自动将分配的内容与评分的评分相关联,在这项工作中,我们提出了关于关键字短语-评分关系分类的第一个工作,即,我们将通过解决分类问题来尝试将内容与评分相关联。在这项研究中,我们分析了有监督方法和无监督方法,发现有监督方法比无监督方法和主题建模方法要好,尽管数据受限,有监督方法的最大结果为0.48 F1-Score,无监督方法的最佳结果为0.31 F1-Score。我们进一步介绍了使用多种指标进行详尽的实验和聚类分析,以确定在哪些情况下可以使用无监督和受监督的方法。

原文题目:Unsupervised Keyphrase Rubric Relationship Classification in Complex Assignments

原文:Complex assignments are open-ended question with varying content irrespective of diversity of course and mode of communication. With sheer scale comes issue of reviews that are incomplete and lack details leading to high regrading requests. As such to automatically relate the contents of assignments to scoring rubric, in this work we present a very first work on keyphrase-rubric relationship classification i.e. we will try to relate the contents to rubrics by solving it as classification problem. In this study, we analyze both supervised and unsupervised methods to find that supervised approaches outperform unsupervised approaches and topic modelling approaches, despite data limitation with supervised approaches producing maximum results of 0.48 F1-Score and unsupervised approach producing best result of 0.31 F1-Score. We further present exhaustive experimentation and cluster analysis using multiple metrics identifying cases where the unsupervised and supervised methods are usable.

原文作者:Manikandan Ravikiran

原文地址:https://arxiv.org/abs/2004.01549

原创声明,本文系作者授权云+社区发表,未经许可,不得转载。

如有侵权,请联系 yunjia_community@tencent.com 删除。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • 利用可微物理模拟学习滑动中的未知物体(CS RO)

    提出了一种将未知目标从初始配置推送到具有稳定性约束的目标配置的新方法。该方法利用可微物理模型的最新进展来学习被推物体的未知力学性质,如其质量分布和摩擦系数。所提...

    时代在召唤
  • 不动点方程组的抽象、技巧与对策

    在本文中,我们介绍了不动点方程组的抽象、技巧与对策,由(混合的)最小和最大的固定点方程组成的完整晶格上的固定点方程系统允许一个人表达一些验证任务,例如各种规格逻...

    时代在召唤
  • 基于UAV的高效人工智能实时视觉任务框架(CS RO)

    配备有最先进的人工智能(AI)技术的现代无人机正在向众多新颖有趣的应用开放。尽管该领域受到AI的最新突破的强烈影响,但大多数提供的解决方案要么完全依赖于商业软件...

    时代在召唤
  • 特征匹配--GMS: Grid-based Motion Statistics for Fast, Ultra-robust Feature Correspondence

    GMS: Grid-based Motion Statistics for Fast, Ultra-robust Feature Correspondence ...

    用户1148525
  • 关于遗留系统怎么办?

    前段时间经常聊到Legacy System(遗留系统)的一些话题,特别是在IT信息化比较早的行业中,如运营商和金融行业。

    用户5927304
  • [Matlab]Simulink串口接收详解2用S-Function解析数据包

    原文链接:https://blog.csdn.net/humanking7/article/details/80856505

    祥知道
  • 对X射线图像COVID-19自动检测方法的评价(CS CV)

    本文对X射线图像中用于COVID-19自动诊断的不同检测方案进行了比较和评价。我们发现,使用不显示大部分肺的X射线图像也可以得到类似的结果。我们可以通过将扫描中...

    Elva
  • pylint在pycharm的使用及pylint的配置

    pylint作为python代码风格检查工具,接近 PEP8风格,在使用此方法的过程中,发现不仅能让代码更加规范,优雅,更能 发现 隐藏的bug。

    用户1558882
  • Top reasons why you should learn Node.js

    Top 10 reasons you should learn Node.js. Open source programming and JavaScript ...

    用户4822892
  • Python基本类型

         Python是一门动态语言,解释执行,所有错误都是运行时产生的,即使有错误和异常,只要没有被执行到也不会有错,比如调用不存在的方法;类型是隐式的,也即...

    py3study

扫码关注云+社区

领取腾讯云代金券