前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >犀牛鸟基金获奖者中科院自动化所刘康博士获COLING2014最佳论文奖

犀牛鸟基金获奖者中科院自动化所刘康博士获COLING2014最佳论文奖

作者头像
腾讯高校合作
发布2018-03-19 15:55:12
1K0
发布2018-03-19 15:55:12
举报
文章被收录于专栏:腾讯高校合作腾讯高校合作

<图为在中国计算机大会上吕建院士、王巨宏女士为刘康博士(中)颁奖>

在刚刚结束的第25届计算语言学国际会议COLING2014颁奖仪式上,CCF-腾讯犀牛鸟基金获奖者刘康博士及其所在团队——中科院自动化研究所模式识别实验室自然语言处理团队曾道建、来斯惟、周光友、赵军联合发表的论文“Relation Classification via Convolutional Deep Neural Network”获得大会“Best Paper Award”。

COLING会议是计算语言学领域的重要国际会议,由国际计算语言学学会(the International Committee onComputational Linguistics,ICCL)举办,每两年一届。本届会议在爱尔兰的都柏林召开,来自世界近700人参会。会议共收到691篇论文,其中oral论文录用139篇,录用率为20.1%,而最佳论文只有两篇。

当前,互联网上存在大量的非结构化电子文本,如新闻、博客、电子邮件通信、政府文件、聊天记录等。如何帮助人们理解这些数据?普遍的观点是通过注释语义信息,把非结构化文本变成结构化文本,其关键问题是对实体间的语义关系分类。传统的关系分类主要采用有监督的方法,研究重点集中于如何设计具有区分性的特征。在特征提取方面,传统方法完全凭借专家或者开发者经验进行,依赖于现有的NLP工具(POS, NER, Syntactic Parsing等),如实体特征、句法特征等。然而,对于一些语言(low resourcelanguage)来说,如果缺少相对应的NLP处理工具以及所需的资源,特征提取则很难完成。同时,传统特征提取时所需的NLP工具也是具有误差的,运用多个NLP工具进行特征提取时很容易造成误差累积。

模式识别国家重点实验室刘康博士、曾道建博士等,利用卷积深层神经网络(Convolutional Deep Neural Network)自动学习表征实体关系的词汇特征、上下文特征以及实体所在的句子特征等对特征进行抽取,相对于以往关系分类方法,该方法不需要利用NLP处理工具(POS、NER、Parsing等)抽取特征,极大的改善了特征抽取过程中多个处理环节所带来的误差累积问题。实验结果表明,该方法相对于已有state-of-the-art方法在关系分类任务上性能有显著的提升。该成果得到了国内外同行的广泛关注,认为是该领域一个开创性的工作,将对关系分类这一任务产生重要影响。

在理论研究的同时,该研究小组与腾讯微信事业群技术架构部模式识别中心团队等深入合作,申请专利获得腾讯公司级专利奖。对于该项成果的未来,刘康博士认为开放域文本中实体关系的挖掘、分类与预测,是文本语义理解的关键环节;将在用户意图理解、网络结构化文本知识挖掘、海量知识图谱构建等方面发挥重要作用。

个人简介:

刘康,博士,中科院自动化所模式识别国家重点实验室助理研究员,中国中文信息学会青年工作委员会执行委员,中国计算机学会会员,中国人工智能学会青年工作委员会委员,2013年度CCF-腾讯犀牛鸟基金获得者。先后于2002年、2005年获得西安电子科技大学学士、硕士学位。2010年于中科院自动化所获得博士学位后留所工作。研究领域包括信息抽取、网络挖掘、问答系统等。在自然语言处理、知识工程等领域国际重要会议和期刊发表论文二十余篇(如TKDE、ACL、IJCAI、EMNLP、COLING、CIKM等),获得COLING 2014最佳论文奖。同时,作为项目技术负责人,主持了中文百科知识问答、百科知识抽取平台等多个系统的研发,这些系统已经在中国大百科全书出版社、华为等多个企事业单位得到应用。

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2014-09-12,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 腾讯高校合作 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
NLP 服务
NLP 服务(Natural Language Process,NLP)深度整合了腾讯内部的 NLP 技术,提供多项智能文本处理和文本生成能力,包括词法分析、相似词召回、词相似度、句子相似度、文本润色、句子纠错、文本补全、句子生成等。满足各行业的文本智能需求。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档