首页
学习
活动
专区
工具
TVP
发布

深度学习自然语言处理

专栏作者
1009
文章
1174634
阅读量
161
订阅数
惊呆了!这篇论文全文都是脏话,可编辑部居然对它评价极佳并发表了!
一教授为了抗议三流科学杂志发送垃圾邮件,回复了一篇全文只重复七个脏话字眼的论文,可没想到的是,它竟然还被 出!版!了!
zenRRan
2023-01-07
4720
笑死!导师:致谢别矫情,没屁在那硬编!
每天给你送来NLP技术干货! ---- 本文来源:鲍海飞科学网博客及网络 最近看到一则毕业论文致谢的截图,差点把我笑傻~ 全文如下: 在论文付梓之际,我要万分感谢我的指导老师——**老师。她严谨细致、一丝不苟的作风将会是我往后工作、学习中的榜样;她天使的脸蛋,魔鬼的身材,循循善诱的教导,不拘一格的思路给予了我无尽的启迪。未遇到她之前,我犹如轻尘栖弱草;遇到她之后,我犹如贱妾逢良人。 每思老师对于我的恩情,如山高如海深,我生当衔珠,死当结草,老师若病,我侍药;老师若崩,我当扶棺。来世必作生作马作狗作猪,以报
zenRRan
2022-10-11
5240
基于深度主动学习的命名实体识别的代码实现及实验
每天给你送来NLP技术干货! ---- 写在前面 在很多问题中,获取标注准确的大量数据需要很高的成本,这也往往限制了深度学习的应用。主动学习通过对未标注的数据进行筛选,可以利用少量的标注数据取得较高的学习准确度。本文将提供代码实现,展示实验效果及一些思考。 代码地址: https://github.com/hgliyuhao/ActiveLearing4NER 参考论文: 《Deep Active Learning for Named Entity Recognition》 2018 《Subsequen
zenRRan
2022-09-22
5070
招聘 | 百度NLP部 - 对话算法实习生
每天给你送来NLP技术干货! ---- 百度自然语言处理部-对话算法实习生 【岗位职责】 - 研发领先的开放域对话技术,包括但不限于预训练技术、长期记忆对话、主动对话、知识对话等。 - 探索对话相关的技术,发表顶会论文(组内已发表多篇ACL、EMNLP、AAAI等顶会论文); 【职责要求】 - 熟练使用Python/C++任意一门语言。 - 对NLP相关技术如预训练技术、文本生成等有了解,有对话生成经验者优先。 - 具有较好的团队沟通和合作能力,有责任心和自驱力。 - 每周至少工作4个工作日,实习期至少3个
zenRRan
2022-09-20
2860
20岁,他到武大读AI方向博士!
每天给你送来NLP技术干货! ---- 本文来源:武汉大学 别人的20岁:本科在读、考研、实习、工作…… 他的20岁:读博、科研、玩得“野”,他就是武汉大学2022级最小博士生,来自计算机学院的苗雨春。 20岁的“野”博士 20岁,当大部分人还在读本科的时候,2001年10月份出生的苗雨春却已收拾行装,即将以博士新生的身份来到武汉大学报道,在武汉大学计算机学院开启研究生生涯,还有自己21岁的生日。 提到年龄小的问题,苗雨春笑谈:“可能是因为幼儿园的时候上学早,又少上了一年吧,后面并没有跳级。”本科从电子科
zenRRan
2022-09-14
2890
2022ACL | 多视角的事实核查相关研究解读
每天给你送来NLP技术干货! ---- 来自:复旦DISC 引言 事实核查任务(Fact-Cheking)是指对给定论断(claim),基于其文本本身、检索出的判据或用户在社交网络上的讨论,对其真实性(veracity)进行判断。 本次 Fudan DISC 实验室将分享 ACL 2022 中关于事实核查的 3 篇论文,从交互关系增强、宏观新闻环境构建、判据来源重构的视角推进事实核查任务的进行。 文章概览 使用图神经网络框对社交网络表示增强的假新闻检测(Tackling
zenRRan
2022-09-14
8860
一个1024的MLP,击败了几乎所有的GNN模型
每天给你送来NLP技术干货! ---- 整理:图神经网络与推荐系统 近些年,一些NLP研究者尝试利用GNN来做一些NLP相关的任务。但是,ACL2022一篇论文的实验结果:一个1024的MLP,击败了几乎所有的GNN模型。 上述结论来自"Bag-of-Words vs. Graph vs. Sequence in Text Classification: Questioning the Necessity of Text-Graphs and the Surprising Strength of a Wid
zenRRan
2022-09-06
4230
COLING2022 | 少样本NER:分散分布原型增强的实体级原型网络
每天给你送来NLP技术干货! ---- 来自:AI Station 论文标题: Few-shot Named Entity Recognition with Entity-level Prototypical Network Enhanced by Dispersedly Distributed Prototypes 作者单位:国防科技大学 论文链接:https://arxiv.org/abs/2208.08023 01 — 方法介绍 Few-shot NER的三阶段:Train、Adapt、Recog
zenRRan
2022-08-26
2930
如何把自己的导师培养成杰青?
编辑:Giant Xu 来源:知乎 排版:深度学习自然语言处理 公众号 周末逛知乎的时候,系统推了一个很有意思的问题,如何把你的导师培养成院士? 我特意去搜了一下,中国现有两院院士仅1816人,着实珍贵无比!不过要想成为院士,可不能像导师push学生一样一步到位,必须要先成为杰青。 所以问题转换为如何把自己的导师培养成杰青。 马云说过,帮商家赚到钱了,我们也挣钱。 帮导师成功评上杰青了,你也飞黄腾达了。 下面和大家分享一篇文章,看看网友是如何“培养”导师的。 来源: https://www.zhihu.
zenRRan
2022-08-26
6200
如何看待如今AI顶会审稿(如,某群明码标价审稿bid)?
每天给你送来NLP技术干货! ---- 编辑:深度学习自然语言处理 公众号 最近突然在知乎中引起不小关注的一件事情,具体内容如下: 如下图,某群近期在AAAI bid 阶段明码标价,操纵审稿。这种风气在如今顶会论文审稿中是否普遍存在,是否已经帮助了某一些人因此获名、获利。 知乎链接: https://www.zhihu.com/question/548211913 背景知识:AAAI是人工智能国际顶会,国内CCF A级别,在NLP领域中,CCF A:ACL、NIPS、AAAI和IJCAI等,CCF B:E
zenRRan
2022-08-26
1.6K0
清华NLP博士生在读期间狂发100多篇论文,这啥情况...
每天给你送来NLP技术干货! ----  本文募格学术撰写。参考资料:兰大就业、中国新闻周刊、知乎、武同学学术主页。 博士生在读期间发表100多篇论文,其中以第一作者发表了67篇。平均每年发30多篇?! 近日,知乎上一则话题「如何看待清华大学博士生武某某在读期间发表100多篇论文?」引起热议。 毕竟这发文的速度,也太恐怖了.... 没有感情的发文机器? 根据知乎提供的博士生武某某的学术主页显示。 目前读博士三年级的武同学,已经发表了108篇论文。 包括arXiv的一作论文,武同学就读清华大学期间,
zenRRan
2022-08-26
1K0
西湖大学张岳老师实验室招收NLP方向PhD、RA、博后和实习生啦~
每天给你送来NLP技术干货! ---- 排版:王晋东不在家 西湖大学NLP实验室由「张岳」老师带领,现有博士后、博士生和科研助理十余名,以及访问学生数名。实验室研究方向包括自然语言处理、背后的机器学习算法以及相关的应用。现招收PhD、博后、全职科研助理和实习生若干名。 关于张岳老师 张岳老师现为西湖大学长聘副教授。他于2003年本科毕业于清华大学,2009年博士毕业于牛津大学,2011年完成博后于剑桥大学,2012-2018年于SUTD任教,2018年加入西湖大学。 张岳老师学术水平出众,是近几年全球NLP
zenRRan
2022-07-27
1.2K0
浅聊对比学习 (一)
每天给你送来NLP技术干货! ---- ©作者 | 吴桐 研究方向 | 推荐系统 来自 | PaperWeekly 什么是对比学习? Metrics learning + self-supervised learning 对比学习在解决什么问题? ● 如何学习 representation ● 解决数据稀疏的问题 ● 如何更好的利用没有label的数据 未打标的数据远远多于打标的数据,不用简直太浪费了,但是要打标又是一个耗时耗力耗钱的事儿 ● 有监督学习的缺点: 泛化能力 spurious c
zenRRan
2022-07-21
5110
ACL2022 | 融合标签语义的双塔BERT模型
每天给你送来NLP技术干货! ---- 来源:炼丹笔记 作者:SinGaln 这是一篇来自于 ACL 2022 的文章,总体思想就是在 meta-learning 的基础上,采用双塔 BERT 模型分别来对文本字符和对应的label进行编码,并且将二者进行 Dot Product(点乘)得到的输出做一个分类的事情。文章总体也不复杂,涉及到的公式也很少,比较容易理解作者的思路。对于采用序列标注的方式做 NER 是个不错的思路。 论文标题: Label Semantics for Few Shot Named
zenRRan
2022-07-21
4730
ACL2022 | 序列标注的小样本NER:融合标签语义的双塔BERT模型
每天给你送来NLP技术干货! ---- 作者 | SinGaln 来自 | PaperWeekly 这是一篇来自于 ACL 2022 的文章,总体思想就是在 meta-learning 的基础上,采用双塔 BERT 模型分别来对文本字符和对应的label进行编码,并且将二者进行 Dot Product(点乘)得到的输出做一个分类的事情。文章总体也不复杂,涉及到的公式也很少,比较容易理解作者的思路。对于采用序列标注的方式做 NER 是个不错的思路。 论文标题: Label Semantics for Few
zenRRan
2022-07-12
7300
未婚夫捐5亿美元给女PI,让她不用申请项目,招150位科学家,安心做科研!
每天给你送来NLP技术干货! ---- 内容来源:学之策(仅转载,不代表本号任何观点) 昨日,杜克大学电子与计算机工程系教授、ACM/IEEE Fellow 陈怡然在社交媒体上发布了一则消息,在各大科研微信群中广泛传播: 他表示,刚才听了一个八卦:某名校女PI的Billionaire未婚夫给她捐了五亿美元,让她可以以后再也不必担心申请项目,招150个科学家专心搞科研! 看到这则消息,正在对国基会评两眼一抹黑,焦急难耐等待8月开奖的我,先是震惊,然后不争气地流下了贫穷的泪水。 消息一出,引发了科研人(吃瓜
zenRRan
2022-07-06
4900
深度学习刷SOTA有哪些trick?
每天给你送来NLP技术干货! ---- 作者:Gordon Lee (转载请联系作者) 链接:https://www.zhihu.com/people/gordon-lee 1. R-Drop:两次前向+KL loss约束 2. Post Training: 在领域语料上用mlm进一步预训练 3. EFL: 少样本下,把分类问题转为匹配问题,把输入构造为NSP任务形式. 4. 混合精度fp16: 加快训练速度,提高训练精度 5. 多卡ddp训练的时候,用到梯度累积时,可以使用no_sync减少不必要的梯度
zenRRan
2022-06-29
5930
围观群众吐槽,作者忙着分锅,如何看待CVPR Oral被指大量抄袭?
每天给你送来NLP技术干货! ---- 来自:机器之心 围观群众吐槽,作者忙着分锅。 人工智能顶会 CVPR 2022 的最后一天,一篇重点论文意外火了,但不是以正经的方式。 这天,YouTube 上出现了一个新的账号,它的目的非常单纯,就是为了指证一篇 CVPR 2022 Oral 论文涉嫌抄袭。 2022 年的 CVPR 大会的投稿量达到 8161 份,共有 2064 篇论文被接收,接收率为 25.28%,在被接收的论文中,有 342 份被选为 Oral(口头报告)论文。 这篇被指抄袭的 Oral
zenRRan
2022-06-29
7600
博士第六年还没有发Paper是一种什么样的体验?
每天给你送来NLP技术干货! ---- ---- 新智元报道   作者:邵帅    编辑:LRS 好困 【导读】五年没发论文也别放弃!科大博导在知乎上发表万字自述,曾连收13封拒稿信,最后半年才把文章发出去,最重要的是:相信自己,厚积薄发! 最近知乎上一个问题又掀起热浪,「六年没发文章是什么体验」? 我猜,除了「焦虑」以外可能只剩「绝望」了吧,面临生活、学业的双重压力,而自己也不再年轻,像发起了一场冲锋,却没找到敌人,但已没有力气发起二次冲锋。 在问题下,威斯康星大学麦迪逊分校博士生邵帅曾写了一
zenRRan
2022-06-09
1.1K0
导师“防秃”指南:审了200篇「中式英语」论文,你应该这样写......
每天给你送来NLP技术干货! ---- 作者丨维克多 编辑丨陈彩娴 来自 | AI科技评论 近日,一篇题为“我看了200篇中国学生的论文后,发现了这些惊人的现象......”文章冲上B站热门视频榜首。 根据领英资料显示,该论文的作者Felicia Brittman是一名专利审核员,于2002~2003年期间在上海交通大学担任客座讲师,并通晓汉语。总之,是一个外国人看了中国学生的英文文章后,忍不住想写点东西指导指导。 论文地址:https://www.chrisyttang.org/assets/m
zenRRan
2022-05-16
6470
点击加载更多
社区活动
腾讯技术创作狂欢月
“码”上创作 21 天,分 10000 元奖品池!
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档