首页
学习
活动
专区
工具
TVP
发布

文本分类

专栏成员
4
文章
10020
阅读量
4
订阅数
文本太长,Transformer用不了怎么办
基于Transformer的模型已经引领NLP领域,然而基于Transformer的方法随着输入文本长度的增加,计算量剧增,并且Transformer能处理的句子长度受限,已有的方法大多使用截断的方式,这会导致信息损失,因此如何实现长文本的预训练是目前的一大难题。
Earnest lee
2020-09-27
1.7K0
域适应方法:解决目标任务数据不足
域适应是对于存在一些有少量或者没有标注数据的领域完成针对性任务的一个有效手段,目前对于很多任务只要有大量标注数据都能达到比较好的效果,然而标注数据的成本是高昂的,尤其是对某些专业性强的术语多的领域,标注就更困难。因此如何将已经在别的领域训练过得模型用到其他领域非常值得研究。
Earnest lee
2020-09-25
2.3K0
2019年Philip S. Yu团队的图神经网络综述
使用graph来表示对象之间的复杂关系和依赖关系,然而graph数据的复杂已有的机器学习算法很难处理,所以使用深度学习方法来处理。A Comprehensive Survey on Graph Neural Networks论文回顾图神经网络(GNN)在文本挖掘和机器学习领域的发展,将GNN划分为递归图神经网络、卷积图神经网络、图自编码和时空图神经网络四类。此外还讨论图神经网络跨各种领域的应用、总结开源代码、数据集和图神经网络评价指标。最后给出可能的研究方向。
Earnest lee
2020-09-20
1K0
A Survey on Text Classification: From Shallow to Deep Learning-文本分类大综述
摘要。文本分类是自然语言处理中最基本的任务。由于深度学习的空前成功,过去十年中该领域的研究激增。已有的文献提出了许多方法,数据集和评估指标,从而需要对这些内容进行全面的总结。本文回顾1961年至2020年的文本分类方法,重点是从浅层学习到深度学习的模型。根据所涉及的文本以及用于特征提取和分类的模型创建用于文本分类的分类法。然后,详细讨论这些类别中的每一个类别,涉及支持预测测试的技术发展和基准数据集。并提供了不同技术之间的全面比较,确定了各种评估指标的优缺点。最后,通过总结关键含义,未来的研究方向以及研究领域面临的挑战进行总结。
Earnest lee
2020-08-13
5K0
没有更多了
社区活动
【纪录片】中国数据库前世今生
穿越半个世纪,探寻中国数据库50年的发展历程
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档