前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >2020年CCF-腾讯犀牛鸟基金课题介绍(一)——机器学习

2020年CCF-腾讯犀牛鸟基金课题介绍(一)——机器学习

作者头像
腾讯高校合作
发布2020-06-04 10:40:20
8840
发布2020-06-04 10:40:20
举报
文章被收录于专栏:腾讯高校合作腾讯高校合作

腾讯公司和中国计算机学会于2013年共同发起的CCF-腾讯犀牛鸟基金(以下简称犀牛鸟基金),始终致力于支持海内外青年学者开展前沿学术研究与技术实践。犀牛鸟基金通过提供企业真实问题与业务实际需求,搭建产学研合作及学术交流的平台,推动合作双方学术影响力的提升及研究成果的应用落地,促进自主技术的创新与发展。

本年度犀牛鸟基金共设立8个技术方向,35项研究命题

申报截止时间为2020年6月15日24:00(北京时间)

申报链接:https://withzz.com/project/detail/73(请在PC端登录)

我们将分四期对研究命题进行详细介绍

本文将介绍机器学习主题

欢迎海内外优秀青年学者关注并申报

一、机器学习

1.1 受限条件下的机器学习

受限条件下机器学习是一个备受瞩目的研究方向。机器学习算法在实际应用过程中,经常遇到标注数据、训练资源有限,部分任务无显性负样本等问题。如何在这些受限条件下确保机器学习算法的效果,是一项实用价值凸显,挑战性极强的工作。建议聚焦图像分类问题,基于上述研究方向,解决目前存在的挑战。

建议研究方向:

  1. 单样本学习、半监督学习、小样本学习;
  2. 单类分类问题(PU learning)、开放集迁移学习(Open set learning);
  3. 有限GPU资源下的高效学习。

1.2 图神经网络算法研究与应用

近年来,图神经网络(GNN)可以自然地整合节点信息和拓扑结构,已经证明在图数据学习方面很强大的能力。GNN的这些优势说明其在社交推荐的应用方面可能存在巨大潜力。在社交推荐中的数据可以表示为用户-用户社交关系图和用户-item的行为交互图;学习用户和物品的潜在关系是关键。然而,基于GNN算法构建社交推荐系统还面临挑战。比如:多源异质图的GNN算法的设计、图采样算法、大规模图的GNN算法训练和推理等。

建议研究方向:

  1. GNN算法优化设计:考虑社交影响力、好友采样方式等条件;
  2. 异构图的GNN算法研究;
  3. 大规模GNN算法的训练和推理。

1.3 机器学习在材料信息学和新材料设计研发中的关键技术研究

人工智能技术已经在图像、自然语言处理、安全等领域取得了显著成果,并被应用于化学,生物学,制药等跟自然科学更加密切相关的领域。在材料科学中材料的模拟、功能材料的设计、以及材料性质的预测等问题一直都是材料研究领域的基本问题。近年来,科学家们已经开始尝试用人工智能技术中一些方法,比如深度学习等,来帮助降低材料研发的周期和成本。人工智能中的深度学习,神经网络等方法都具有帮助解决这些材料科学基本问题的巨大潜力。

建议研究方向:

  1. 通过机器学习的方法,利用已有的材料模拟或者实验数据(网上开源数据或者运用传统模拟软件进行模拟,合作团队可以提供协助),探索新的材料性质与性能的预测方法,或提升材料模拟效率的有效途径;
  2. 通过机器学习的方法,比如深度学习,结合传统的模拟工具产生的数据(数据需要运用传统模拟软件生成,合作团队可以提供协助),对材料在微观尺度建模,加速和改进传统的材料模拟方法;
  3. 在腾讯云端建设材料信息学数据库,并接入高通量并行计算的自动化作业流。

1.4 基于机器学习技术的能源行业研究

目前,能源行业不仅面临产能的问题,也面临着节能减排的问题。鉴于能源行业积累了大量的数据,机器学习是一个解决这些问题的潜在可行的技术。所以本项目旨在利用公开数据源(如UCI机器学习数据库等),推动机器学习技术在能源行业的创新应用,例如能源转化和利用,以期促进能源行业的可持续发展。

建议研究方向:

  1. 基于机器学习技术的电力负荷预测;
  2. 基于机器学习技术的锅炉燃烧控制;
  3. 基于机器学习技术的最大产能预测;
  4. 其他能源行业创新方向。

1.5 基于强化学习和博弈论的多智能体协作与对抗研究

多智能体协作与对抗问题作为人工智能领域的核心关键问题,广泛影响诸如量化投资、分布式集群控制、无人驾驶等多个领域。基于战术竞技、棋牌等游戏虚拟环境进行多智能体研究的前沿探索,已在国内外人工智能研究领域形成广泛共识。本课题以虚拟世界的多智能体协作和对抗为切入点,重点研究强化学习和博弈论在游戏领域的应用性问题。在研究过程中,由腾讯自主研发的人工智能开放平台将提供相应的程序框架和计算资源。

建议研究方向:

  1. 完美信息条件下,基于强化学习和博弈论的多智能体协作与对抗研究;
  2. 非完美信息条件下,基于强化学习和博弈论的多智能体协作与对抗研究。

1.6 广告转化率预估场景中的若干挑战

转化率预估是在线广告投放技术链条中的核心环节之一。转化目标的多样性,以及普遍存在的转化数据延迟等,给预估任务带来了诸多挑战。本课题旨在寻找高效的应对与解决方案,提升转化率预估准确性。

建议研究方向:

  1. 设计实用的多目标/多任务学习算法与模型结构;
  2. 对转化延迟建模,或者针对性改进预估模型,减少转化延迟带来的不利影响;
  3. 探索统一的用户转化兴趣构建方式,融合多样的用户转化行为;
  4. 小样本学习:在训练数据较稀疏的场景下,仍能保证相当的预估准确性。

1.7 基于机器学习方法的代码智能辅助技术研究

以深度学习为代表的机器学习理论在软件研发领域已有诸多成功实践,如自动代码补全和智能提示可以提高软件研发效率,软件缺陷检测和自动修复可以提高软件质量,克隆检测和和代码水印可以用来保障代码的合法高效复用。目前代码智能辅助技术仍然是一个热点研究领域,特别在海量代码库等大尺度数据规模条件下,如何更好辅助程序员的代码开发工作,具有非常重要的产业实践意义。

建议研究方向:

  1. 基于深度学习等机器学习理论的软件研发质量研究,如代码质量评估、缺陷预测及自动修复方法;
  2. 基于机器学习、知识推理及NLP方法的软件研发辅助研究,如代码自动补全、智能提示、注释自动生成机制;
  3. 软件产权保护和可追溯性研究,如代码克隆检测和传播跟踪。

1.8 深度学习在软件安全领域的应用研究

随着软件复杂度的不断提升,大规模源代码和二进制软件的漏洞挖掘工作面临新的机遇和挑战。本研究项目希望把深度学习相关技术(例如自然语言处理、图神经网络、深度强化学习等)应用于软件安全研究中,其成果可以对传统的逆向工程、模糊测试、漏洞挖掘等有较大促进。

建议研究方向:

  1. 计算机语言的表征和分类研究,例如识别二进制软件对应的编译器、编译优化选项、第三方库、开发作者等信息;
  2. 计算机语言的自动生成和翻译技术研究,例如自动生成用于编译器(解释器)模糊测试的符合语法结构的程序代码;利用机器翻译技术实现二进制和源代码之间的相互翻译工作;
  3. 面向复杂交互程序的智能分析方法研究,例如研究代码相似性分析、演化API的误用检测、基于程序内状态机的符号执行、用户界面和运行时事件等复杂输入驱动的软件测试方法。

1.9 给定模型和数据集下超大BS评估与收敛性研究

在机器学习训练场景中,经常通过使用多机多卡来加速训练从而提升迭代效率,但这随之产生了BS(batchsize)收敛的问题,导致收敛精度下降或不收敛。本课题将研究在给定数据集和模型的情况下,如何科学评估batchsize的合理范围,以及评估后,如何在单卡到多卡的扩展过程中,有效保持线性收敛。腾讯将为合作者提供加速机器学习的平台来验证实验效果,并有机会在现场环境中落地。

建议研究方向:

在常见的主流开源模型上,实现一套完整的大BS收敛性量化评估手段,通过可以适用于业务实践的科学评估手段,评估最为合理的batchsize值,并在多卡扩展中保持线性收敛。

下期将介绍数字图像处理与计算机视觉主题

敬请期待

申报截止时间为2020年6月15日24:00(北京时间)

请扫描下方二维码或点击阅读原文了解项目更多信息

申报链接:https://withzz.com/project/detail/73(请在PC端登录)

CCF-腾讯犀牛鸟基金

期待您的加入

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2020-06-03,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 腾讯高校合作 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
材料研究平台
材料研究平台(Materials Research Platform,MRP)基于腾讯云丰富的计算资源为科研用户提供一站式材料研究服务。它整合了材料计算、数据后处理、项目管理等多个模块,帮助用户减少材料研究流程中的繁杂工作,提高科研执行效率。材料研究平台目前支持公有云访问。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档