前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >2018年度腾讯犀牛鸟精英人才培养计划优秀学生成果分享(一)

2018年度腾讯犀牛鸟精英人才培养计划优秀学生成果分享(一)

作者头像
腾讯高校合作
发布2019-10-17 11:10:28
1.5K0
发布2019-10-17 11:10:28
举报
文章被收录于专栏:腾讯高校合作

随着互联网的发展逐渐进入 “深水区”,基础研究与应用研究融通创新发展已引发业界广泛关注,协调产学各方资源,加速培养更多创新型研究人才变得尤为重要。腾讯自2017年开启“犀牛鸟精英人才培养计划”,借助其独特的数据资源和平台优势,联动高校共同培养新时期创新型研究人才,助力科技创新及应用成果落地。

目前2018年度精英人才培养计划已进入收尾阶段,并将在2019年10月18日CNCC大会期间完成奖学金评选,届时,14位优秀学生将对他们的学习成果进行公开答辩,竞选本年度一至三等奖学金个人风采奖勤奋好学奖

在为期一年的培养周期中,学生不仅在企业导师及学校导师联合指导下开展科研工作,基于海量数据及真实业务场景验证学术理论。同时,还通过“智学&智享”活动,与海内外学术大咖面对面交流;学习专属培训课程;与精英学生交流,拓展人脉圈子,助力自己全面提升。截止目前2018年度入选学生累计发表CCF A类及B类学术论文近30篇发明专利20余项,多个创新算法已在真实场景及数据中验证、转化。

小编将分两期为大家分享参与奖学金答辩的14位学生的研究课题及成果情况。本期将介绍其中7位学生的研究课题及成果情况。

中国科学院计算技术研究所 李泽康

课题名称:基于生成模型的对话机器人

课题简介:研究基于生成模型的 Chatbot,包括多轮交互机制、领域知识融合、对话风格迁移与多样化、基于交互的在线学习等。

课题成果:1. 国内申请,发明专利,2019060236CN,一种使用模板增强和课程优化的开放域对话生成技术,官方受理;

2. 国内申请,发明专利,2019060836CN,一种基于Transformer 的文档知识驱动的多轮对话解决方案,官方受理;

3. 国际会议一作长文,口头报告,Incremental Transformer with Deliberation Decoder for Document Grounded Conversations,ACL 2019,2019-05;

4. 国际会议workshop论文,Answer-Supervised Question Reformulation for Enhancing Conversational Machine Comprehension,EMNLP 2019 workshop,2019-09;

5.一篇一作长文已投稿至国际会议 AAAI 2020。

华东师范大学  王露

课题名称:用户行为时间序列分析及建模

课题简介:利用深度学习、强化学习算法和大规模计算集群对万亿级数据进行分析,探索有效的控制决策。具体包括两个课题:千万级合约广告流量的分配,农作物生长的控制。在千万级合约广告流量的分配课题中,存在的主要挑战有实时流量的难预测性,广告的定向爆炸,以及广告流量之间的竞争关系。为了解决以上挑战,我们使用多智能体强化学习算法,实现根据实时流量动态调整流量分配策略,将广告的定向转化为静态的状态特征并按照广告流量之间的不同竞争关系学习不同的流量分配策略。该课题使用的是腾讯真实合约广告业务数据,在大量真实的数据上实验,验证了算法的有效性。农作物生长控制课题的主要任务是通过控制温室的气候来提高农作物的产量。其主要的挑战是物理鸿沟,以及采样的高代价和高风险性。为了解决以上挑战,我们提出可适应性强化学习,来根据真实环境的状态变化规律改进策略。为了减少和环境交互的次数,我们提出带约束的off-policy强化学习算法。利用专家种植的历史数据学习出策略,从而避免和环境交互。该课题是腾讯与WUR合作开展的AI+农业项目。在该项目中,首次尝试用强化学习控制农户作物生长环境,并取得理想的效果。该算法正在投入到真实的环境中进行农作物的种植。

课题成果:撰写论文共4篇,包括“Hierarchical Multi-Agent Reinforcement Learning for Allocation of Delivering Guaranteed Display Ads”,“Reinforcement Learning for Allocation of Guaranteed Display Advertising”,“AAMA: Towards Allocating Cold-Start Guaranteed Display Ads Through Agent-Agnostic Multi-Agent Reinforcement Learning ”,”Towards off-policy reinforcement learning without interacting with environment”, “Reinforcement learning for cucumber climate control ”。

发表专利3项:“基于可适应性强化学习的黄瓜种植策略”,” 时序注意力机制模型在部分可观测农作物环境中的应用”,”基于强化型学习的合约广告流量分配”。

清华大学  宋凌雪

课题名称:人脸检测/识别关键技术研究

课题简介:人脸是最重要的视觉信息之一,自动人脸检测与识别研究向来是人工智能和计算机视觉领域的一个热点和难点问题,在工业界和学术界都受到广泛的重视。我所申报的人脸识别关键技术研究课题面向人脸技术在金融、移动互联网、视频监控等相关领域的重大需求,以深度学习为主要技术手段,重点突破部分遮挡条件下的人脸识别难点问题,旨在提高深度人脸模型在部分遮挡场景下的识别性能。遮挡人脸识别的问题在深度学习背景下的研究尚未成熟,学术界和工业界已有成果较少,因此本课题具有重要的探索性意义。

课题成果:科研访问期间主要负责遮挡条件下人脸识别算法的研究工作:收集并整理了遮挡人脸的相关数据;提出基于成对差分孪生卷积网络的学习算法,有效地提高了通用人脸识别模型在遮挡条件下的性能。相关研究成果被ICCV 2019接收,论文题目为 Occlusion Robust Face Recognition based on Mask Learning with Pairwise Differential Siamese Network;并形成专利文件,提交了带遮挡人脸识别算法的专利申请。

清华大学  韩旭

课题名称:复杂场景下的知识获取

课题简介:知识图谱使用结构化知识库系统来组织人类知识,并成为推动人工智能学科发展和支撑智能信息服务应用(如搜索系统、问答系统、推荐系统等)的重要基础技术。目前,诸多大型知识图谱逐渐形成体系,如开源社区的Freebase、DBpedia、YAGO、Wikidata。尽管现有的大型知识图谱已经富含海量的世界知识,但与现实世界中近乎于无穷无尽的知识量相比,其距离完善仍有很大空间。事实上,海量的人类知识蕴藏在无(半)结构的互联网信息中。因此如何在各类复杂场景下从无(半)结构的互联网信息中进行知识获取,并归纳总结知识,自动融合构建知识图谱,并最终形成一套完整的终身学习闭环,是目前人工智能与知识工程研究中的一大重点和难点。知识获取旨在对文本信息进行结构化处理,是完善知识图谱的重要一环。实际的文本环境十分复杂,我们采用神经网络技术挖掘文本的深度语义,在数据降噪、少次学习、多语言联合、复杂结构信息抽取等不同场景下进行知识获取,取得了较好的结果。

课题成果:形成相关论文7篇,5篇收录于国际相关领域一流会议ACL、EMNLP、NAACL上,2篇正投稿于国际相关领域一流会议AAAI。申请专利3项,其中一份已经初步审查合格。

清华大学  马坚鑫

课题名称:社交网络结构挖掘

课题简介:社交网络结构挖掘研究微信社交网络的结构与属性特征,包括用户在社交网络中的特征、用户之间的相似性以及用户影响力等方面。技术领域涉及机器学习、复杂网络、网络表达学习(network representation learning)、用户影响力建模、影响力最大化(influencemaximization)等。细分方向:网络表达学习(aka. 图表征学习),图神经网络。

课题成果:发表ICML'19(CCF A,机器学习最顶尖会议)一作论文一篇,相关专利进入实质审查阶段。论文标题:Disentangled Graph Convolutional Networks。

中国香港科技大学  张洪铭

课题名称:基于语义分析和知识推理的深度文本理解技术及其应用

课题简介:代词指代消解,作为自然语言理解最核心也是最具挑战的问题之一,受到学界和业界的广泛关注。传统的代词指代消解模型或是基于专家定义的规则、特征,或是完全依赖于深度学习模型。这两种方法都有其局限性,专家定义的规则和特征虽然准确,但是能够覆盖的情况非常有限。完全依赖于深度模型又非常需要大量高质量的训练数据,而这又是很难获得的。深度模型还有另一个问题就是容易过拟合训练数据。为了创造一个在真实环境中能用的代词指代消解系统,我们想要尝试将外部知识(既包括专家定义的知识,又包括其他常识知识)来和深度模型相结合,取两者的优势。实验效果证明这种尝试非常有效,尤其在跨领域的设定下(训练数据和测试数据不完全相似)有20%到100%的效果提升。

课题成果:

1. 已发表论文3篇:(1) Hongming Zhang, Yan Song, and Yangqiu Song. Incorporating Context and External Knowledge for Pronoun Coreference Resolution. North American Chapter of the Association for Computational Linguistics (NAACL-HLT). 2019.(2) Hongming Zhang, Yan Song, Yangqiu Song, and Dong Yu. Knowledge-aware Pronoun Coreference Resolution. Annual Meeting of the Association for Computational Linguistics (ACL). 2019.(3) Hongming Zhang, Jiaxin Bai, Yan Song, Kun Xu, Changlong Yu, Yangqiu Song, Wilfred Ng, and Dong Yu. Multiplex Word Embeddings for Selectional Preference Acquisition. Conference on Empirical Methods in Natural Language Processing (EMNLP). 2019;

2. 准备专利交底书一篇:一种融合局部语义信息与外部知识的代词指代消解方法。

清华大学  郭君

课题名称:多模态样本的低维编码

课题简介:实际生活中的数据通常是来自于不同模态的异构数据,而对异构数据进行低维度的哈希编码,然后进行跨模态信息检索是一种较为常见的应用。前人相关方法中的各个模态都是完整的,没有缺失任何样本。但是实际上每个模态都有缺失样本的可能性,因此,我们会经常遇到模态缺失的情况,进而影响异构数据学习过程,削弱跨模态编码的质量。攻克这一难题,会进一步打开异构数据研究的大门,有助于实现从“数据孤岛”到“数据联通”。不完整异构数据具有(1)互补性,即不同模态数据之间存在信息的互补;(2)统一性,即数据点尽管拥有不同的模态,但它们的属性关系是一致的。因此,我们充分利用这两个特性设计出了一种非监督算法。对每个模态分别构建二分图进行马尔科夫随机游走和概率转移计算,并估计出涉及到缺失样本的邻接信息;通过自适应迭代融合,利用所有模态的邻接信息获得统一的邻接信息,并通过锚图哈希技术得到检索结果。这种设计只需要利用已有的数据,不需要额外引入信息,从而减少了信息误导。此外,基于人类集体学习的机制,我们进一步设计了让前述两个模块互相指导、迭代修正所选近邻的策略,通过近邻信息的学习与更新,模拟出人类“听从志同道合好友意见”的现象。

课题成果:

结合在学校的科研工作,我在腾讯继续开展多模态数据的学习研究,设计了基于人类集体学习机制的非监督算法,结合具体的应用场景,以独立或合作的方式完成了多个工作,相继发表了CCF-A类论文3篇(第一作者2篇)、推荐系统方向顶级会议短文1篇(第一作者为部门另一位实习生,本人为第二作者)。具体如下:期刊:IEEE Transactions on Image Processing (TIP)长文1篇,第一作者,题目为Collective Affinity Learning for Partial Cross-Modal Hashing。国际会议:墙报展示,两篇AAAI 2019长文(第一作者1篇,即[1]),题目为[1] Anchors Bring Ease: An Embarrassingly Simple Approach to Partial Multi-view Clustering;[2] A Human-like Semantic Cognition Network for Aspect-level Sentiment Classification。国际会议:墙报展示,RecSys 2019短文(第二作者),题目为Personalized Fairness-aware Re-ranking for Microlending 。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2019-10-16,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 腾讯高校合作 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 中国科学院计算技术研究所 李泽康
  • 华东师范大学  王露
  • 清华大学  宋凌雪
  • 清华大学  韩旭
  • 清华大学  马坚鑫
  • 中国香港科技大学  张洪铭
  • 清华大学  郭君
相关产品与服务
人脸识别
腾讯云神图·人脸识别(Face Recognition)基于腾讯优图强大的面部分析技术,提供包括人脸检测与分析、比对、搜索、验证、五官定位、活体检测等多种功能,为开发者和企业提供高性能高可用的人脸识别服务。 可应用于在线娱乐、在线身份认证等多种应用场景,充分满足各行业客户的人脸属性识别及用户身份确认等需求。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档