前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >中文自然语言处理实现突破,京东智能广告实验室论文被ACL收录

中文自然语言处理实现突破,京东智能广告实验室论文被ACL收录

作者头像
用户1737318
发布2018-07-20 17:08:03
5010
发布2018-07-20 17:08:03
举报
文章被收录于专栏:人工智能头条人工智能头条
日前,国际自然语言处理与计算语言学领域最高级别的学术会议ACL(Annual Meeting of the Association for Computational linguistics)录取了京东智能广告实验室(JD Intelligent Advertising Lab简称JD IAL)和 Rensselaer Polytechnic Institute‎(伦斯勒理工学院)联合发表的题为“基于多语言多任务的低资源序列标注架构”的学术论文。论文首次提出了一种多语言多任务的监督学习架构,该架构对中文自然语言处理以及低资源语言的学习效果提升具有积极意义。

众所周知,由于语言的多样性和复杂性,自然语言处理(NLP)在学术和工业应用上一直是非常具有挑战的领域。同时由于中文语言的独特性和高灵活特点,基于中文的自然语言处理任务会更加复杂。

京东在服务数以亿计的用户同时,积累了大量的文本信息,如商品的名称,属性,用户评论和问答等。有效利用好这些文本信息,就能大幅提升京东的服务质量和用户满意度。然而,由于文本形式口语化,文本内容丰富,用以训练模型的标注数据少等问题,工程师在实际NLP技术开发中遇到了很大的挑战。

针对以上挑战,京东智能广告实验室提出了一种多语言多任务的监督学习架构。该架构结合了多种迁移学习模型,通过利用多任务训练的方式,极大地提升了低资源语言的学习效果。例如,在标准测试数据上,相比于传统的单语言、单任务的学习方法,利用新方法在实体标注任务上取得了 4.5% 到 50% 的性能提升(F值)。

据京东集团副总裁、商业提升事业部总裁,同时也是京东智能广告实验室负责人颜伟鹏博士介绍,针对复杂和较少标注的中文数据,通过引入大量的英文标注数据,能够有效提升中文序列标注(Sequence Labeling)的效果。目前该技术已经应用到京东的商品推荐,排序和文本生成等实际应用中。

京东智能广告实验室隶属京东商城商业提升事业部,主要从事智能广告相关的基础研究和应用研究,研究范畴涵盖视频图像、NLP、大规模机器学习、深度学习、推荐技术、广告机制等多个领域。实验室成员包括有学术能力的硕士、博士研究生以及经由实验室招募的优秀学者、在行业内和学术圈内有技术影响力的科学家。目前京东智能广告实验室已累计研究成果数十项,其中多个项目荣获京东集团技术创新奖项,多篇论文被国内外知名学术机构收录。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2018-06-07,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 人工智能头条 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
NLP 服务
NLP 服务(Natural Language Process,NLP)深度整合了腾讯内部的 NLP 技术,提供多项智能文本处理和文本生成能力,包括词法分析、相似词召回、词相似度、句子相似度、文本润色、句子纠错、文本补全、句子生成等。满足各行业的文本智能需求。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档