中文自然语言处理实现突破,京东智能广告实验室论文被ACL收录

日前,国际自然语言处理与计算语言学领域最高级别的学术会议ACL(Annual Meeting of the Association for Computational linguistics)录取了京东智能广告实验室(JD Intelligent Advertising Lab简称JD IAL)和 Rensselaer Polytechnic Institute‎(伦斯勒理工学院)联合发表的题为“基于多语言多任务的低资源序列标注架构”的学术论文。论文首次提出了一种多语言多任务的监督学习架构,该架构对中文自然语言处理以及低资源语言的学习效果提升具有积极意义。

众所周知,由于语言的多样性和复杂性,自然语言处理(NLP)在学术和工业应用上一直是非常具有挑战的领域。同时由于中文语言的独特性和高灵活特点,基于中文的自然语言处理任务会更加复杂。

京东在服务数以亿计的用户同时,积累了大量的文本信息,如商品的名称,属性,用户评论和问答等。有效利用好这些文本信息,就能大幅提升京东的服务质量和用户满意度。然而,由于文本形式口语化,文本内容丰富,用以训练模型的标注数据少等问题,工程师在实际NLP技术开发中遇到了很大的挑战。

针对以上挑战,京东智能广告实验室提出了一种多语言多任务的监督学习架构。该架构结合了多种迁移学习模型,通过利用多任务训练的方式,极大地提升了低资源语言的学习效果。例如,在标准测试数据上,相比于传统的单语言、单任务的学习方法,利用新方法在实体标注任务上取得了 4.5% 到 50% 的性能提升(F值)。

据京东集团副总裁、商业提升事业部总裁,同时也是京东智能广告实验室负责人颜伟鹏博士介绍,针对复杂和较少标注的中文数据,通过引入大量的英文标注数据,能够有效提升中文序列标注(Sequence Labeling)的效果。目前该技术已经应用到京东的商品推荐,排序和文本生成等实际应用中。

京东智能广告实验室隶属京东商城商业提升事业部,主要从事智能广告相关的基础研究和应用研究,研究范畴涵盖视频图像、NLP、大规模机器学习、深度学习、推荐技术、广告机制等多个领域。实验室成员包括有学术能力的硕士、博士研究生以及经由实验室招募的优秀学者、在行业内和学术圈内有技术影响力的科学家。目前京东智能广告实验室已累计研究成果数十项,其中多个项目荣获京东集团技术创新奖项,多篇论文被国内外知名学术机构收录。

原文发布于微信公众号 - 人工智能头条(AI_Thinker)

原文发表时间:2018-06-07

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏数据派THU

【干货】刘伦:大数据时代的城市模型研究

本文共3400字,建议阅读时间7分钟 本讲座选自刘伦博士于2015年4月16日在 RONG 系列论坛之三——大数据与未来人居研讨会上所做的题为《大数据时代的城市...

274100
来自专栏IT派

2017年机器学习几大主要进展汇总!

摘要: 2017年注定是机器学习快速发展的一年,特别是机器学习商业化的成功是的更多的人积极的投入到机器学习的学习当中。机器学习一定会成为未来的技术,让我们看看这...

46290
来自专栏CDA数据分析师

吴恩达再次刷屏,推出深度学习课程deeplearning.ai

? 吴恩达离职百度后的动向一直受到各方关注。在他 3 月的一篇博客文章中,这位斯坦福大学教授宣布他将离开中国搜索引擎百度,这一举动给百度造成了超过 10 亿美...

22650
来自专栏新智元

【独家】依图科技朱珑:如何颠覆谷歌优势,技术公司三层次VIE

作者:朱珑,依图科技联合创始人 【新智元导读】人工智能浪潮大起,如何判断技术和产业发展?依图科技联合创始人朱珑认为:团队的技术实力由最强的领军人物决定,AI新时...

432150
来自专栏机器学习算法与Python学习

干货 | 深度学习应用案例简述

关键字全网搜索最新排名 【机器学习算法】:排名第一 【机器学习】:排名第二 【Python】:排名第三 【算法】:排名第四 前言 深度学习擅长识别非结构化数据中...

39860
来自专栏全栈数据化营销

详解RFM客户价值模型,送你20个企业战略和竞争分析模型

不会模型,做不了分析! 最近在做一个比较大型公司的案子,涉及到营销、销售、架构、财务等各方面的分析和研究,不得不说,在信息量很大、分析维度很多的时候,有准确的分...

486130
来自专栏AI科技大本营的专栏

AI领域真正最最最最最稀缺的人才是……会庖丁解牛的那个人

图片来源:Wired 【AI科技大本营导读】这里,就不卖关子了。AI领域最最最最最稀缺的人才应该为人工智能架构师。有过4次技术创业经历,如今做AI投资的星瀚资本...

332100
来自专栏新智元

【2018将成为AGI元年】13名专家盘点2017最重要AI事件,预测AGI将取代AI

来源:kdnuggets.com 作者:Matthew Mayo 编译:刘小芹 常佩琦 闻菲 【新智元导读】2017年人工智能最重要的发展是什么,2018年...

34350
来自专栏企鹅号快讯

为什么神经网络会把乌龟识别成步枪?现在的 AI 值得信任吗?

概要:人工智能的快速发展的确值得欣喜,但快速发展的背后还有各种不完善的地方。 人工智能的快速发展的确值得欣喜,但快速发展的背后还有各种不完善的地方。比如,前不久...

19160
来自专栏ThoughtWorks

洗白“黑科技”深度学习|商业洞见

[摘要] 最近几年,深度学习备受关注。在2016年的每一项人工智能成就背后,几乎都能看到深度学习的影子。数据的获取、存储、计算能力的增强,以及算法的进步等因素合...

37660

扫码关注云+社区

领取腾讯云代金券