求实求新 | 2018年CCF-腾讯犀牛鸟基金成果分享（四）

腾讯高校合作

发布于 2019-10-16 10:10:25

1.6K0

发布于 2019-10-16 10:10:25

文章被收录于专栏：腾讯高校合作

在越发重视科技自主创新，新产业国际竞争逐渐激烈的时代，我们更加坚信，科研道路没有捷径可走，只有脚踏实地，一步一个脚印，不断积累方能实现创新。

7年来，犀牛鸟基金为全球范围内的青年学者提供了解产业真实问题、接触业务实际需求的机会，并通过连接青年学者与企业研发团队，开展基础扎实的产学科研合作，推动双方学术视野的拓展及原创应用成果的落地，为科技自主研发的探索和创新储备能量。

2018年CCF-腾讯犀牛鸟基金合作进入收官阶段，小编将分四期介绍全部25个科研基金项目，本期将最后介绍自然语言处理和区块链两个研究方向中的合作者及其合作项目。

点击查看以下系列文章

2018年CCF-腾讯犀牛鸟基金成果分享（一）

2018年CCF-腾讯犀牛鸟基金成果分享（二）

2018年CCF-腾讯犀牛鸟基金成果分享（三）

了解更多。

2018年CCF-腾讯犀牛鸟科研基金成果概述

2018年，CCF-腾讯犀牛鸟基金共计支持25项科研基金以及15项创意基金，在为期一年的项目周期中，科研基金获奖者与腾讯研发团队在共同关注的前沿科技领域开展深入合作，促进了高质量学术成果的产出，推动了研究成果的产业落地与应用。青年学者累积发表学术论文146篇，其中CCF A类论文60篇、B类论文39篇，联合撰写论文30篇，申请合作专利22项，部分技术储备将落地于相关业务。

10月17日，2018年度CCF-腾讯犀牛鸟基金项目结题评审会将在中国计算机大会（CNCC 2019）期间举行。届时，基金获奖者将集中展示他们一年来的合作成果。与此同时，由二十位内外部犀牛鸟专家组成的评审团，将现场评定并颁发本年度犀牛鸟基金的“卓越奖” 、“卓创奖”、“优秀奖”和“优秀专利奖”。

2018年CCF-腾讯犀牛鸟基金获奖者项目成果分享

自然语言处理

项目负责人介绍

中国科学院自动化研究所何世柱

博士，中科院自动化所模式识别国家重点实验室副研究员，2016年获得中国科学院大学工学博士学位。研究方向为问答系统、对话系统和自然语言处理。在ACL、AAAI、EMNLP、IJCAI、CIKM等顶级国际会议和重要学术期刊上发表论文30余篇。2018年获得中国中文信息学会钱伟长中文信息处理科学技术奖一等奖。

图问句自动生成模型示意图

项目介绍

面向智能客服的对话语义表示学习与应答生成

针对智能客服中的对话语义表示学习与应答生成问题，分别从多轮对话的离线处理和在线处理两个角度开展关键技术研究和项目研发。客服系统中，大量人人客服对话中蕴含了丰富的知识，一方面利用大规模未标注数据自动学习多轮客服中对话的语义表示，辅助后续任务；另一方面进行多轮对话结构学习，通过获取多轮对话之间的潜在结构，为客服质检、热点挖掘、问答语料采集服务。对于自动客服中的关键技术，本项目研发了意图理解任务，该任务面向领域知识库，理解用户意图，转换为机器可执行的命令；研发了回复生成，针对用户的查询，结合上下文，自动生成符合语境的回复；同时针对用户需求不明确时系统无法有效响应的问题，研发了问句生成任务，通过自动生成问句，获取更精准用户需求。

项目成果

论文发表：3篇CCF A 类国际顶会，1篇CCF B类国际顶会；

专利撰写：撰写1项联合技术专利，基于人工智能的回复消息生成方法、装置、服务器及介质. 2019年6月提交；

应用落地：开发一套多轮对话的话语表示学习项目（即对话表示预训练），能够充分利用大规模未标注对话数据。可能的应用包括：1、提高意图预测性能；2、减少人工标注数量。

项目负责人介绍

中国科学院深圳先进技术研究院杨敏

硕导，中国科学院深圳先进技术研究院助理研究员，中科院先进院-得理法律人工智能联合实验室主任。2017年博士毕业于中国香港大学计算机科学专业，主要研究方向包括自然语言处理、数据挖掘、推荐系统等。已发表国际高水平学术会议及期刊论文近60篇，主要发表在 AAAI, ACL, IJCAI, KDD, EMNLP, TKDE, TOC等。应邀担任多个国际会议和期刊的审稿人，包括AAAI, IJCAI，ACL, TMM, TOC, TNNLS等。

项目介绍

基于多任务学习的个性化智能聊天系统

近年来，随着人工智能相关研究的突破以及大量对话数据的产生，智能对话相关工作呈现出巨大发展，成为学术界和工业界关注的重要问题。开放域对话生成是目前人工智能领域最具挑战性的任务之一，其要求机器能够理解自然语言，具备世界知识，以及拥有语义推理的能力。本项目致力于研究基于知识迁移的对话系统，主要研究内容包括：提出一种基于常识知识库问答（KBQA）的知识迁移机制，将常识知识融入对话理解和对话生成过程中，改进现有对话生成方法中回复不流畅、内容单一、信息量低等问。采用双层解码机制，首先基于polishing机制生成一个草稿，然后根据基于检索的对话生成方法对生成的草稿进行不断改进；同时提出一种回复引导注意力机制，令生成的回复更加流畅且更富有信息量。

图基于常识知识的开放域对话生成模型

项目成果

本项目主要围绕基于常识知识的开放域对话生成和多轮任务型对话生成两个任务展开研究。对于开放域对话生成，评价指标为perplexity, Entity score, BLEU, 在Reddit数据上比之前最好的CCM方法高出5%左右；对于多轮任务型对话生成，评价指标指标为BLEU和entity F1 score，在In-Car Assistant和CamRest数据集上比之前最好的GLMP方法好10%左右。项目团队和腾讯技术团队联合撰写两篇论文投稿至AAAI-2020，并提交一篇中文发明专利。

区块链

项目负责人介绍

北京邮电大学黄勤龙

北京邮电大学网络空间安全学院副教授，博士生导师。2014年博士毕业于北京邮电大学信息安全专业，弗吉尼亚理工大学访问学者，研究方向包括密码学和云计算安全等。主持国家自然科学基金面上项目、国家重点研发计划子课题等科研项目，获得多项CCF科研基金，在IEEE TSC、IEEE TCC等发表论文20多篇，担任IEEE GLOBECOM等会议TPC。

项目介绍

抗量子攻击的后量子区块链理论研究

当前，区块链技术以其分布式、去中心化等特点，尤其是能在不可信的环境中实现可信的数据一致性，迅速得到广泛的关注和研究。然而，随着量子计算机的发展，量子计算攻击对基于传统公钥加密系统的区块链技术构成了严重的威胁。针对区块链安全性和隐私泄漏问题，本项目主要研究抗量子攻击的加密算法，进行抗量子攻击的后量子区块链理论研究，以提高区块链技术在抗量子攻击方面的性能。针对区块链的安全性，我们提出了一种基于区块链的物联网抗量子代理盲签名方案，通过采用基于格密码算法引入区块链技术，解决了目前区块链技术中加密算法不能抵抗量子攻击的问题，并进行了安全性分析。同时，在与物联网等应用的结合中，设计安全高效的密文区块链方案，实现云服务器承载区块链数据和提供交易检索任务，并且交易数据以密文形式存储和维护，保护数据隐私。另一方面，在区块链的隐私保护方面，我们通过研究基于贝叶斯网络的匿名评估模型AABN、环签名原理等，提出了具有隐私保护的后量子区块链方案等研究成果，解决区块链技术隐私泄漏的问题，并能以适当的开销抵抗量子计算攻击，提高区块链技术的安全性，保障区块链技术未来的应用发展。

（从左往右，AABN模型的结构化表示基于区块链的物联网抗量子方案密文许可区块链方案）

项目成果

本项目围绕区块链技术的安全性，从抗量子计算攻击、隐私保护、数据保护等方面开展相关的理论研究工作。针对区块链的安全性，我们提出了一种基于区块链的物联网抗量子代理盲签名方案，通过采用基于格密码算法引入区块链技术，解决了目前区块链技术中加密算法不能抵抗量子攻击的问题。在与物联网等应用的结合中，设计安全高效的密文区块链方案，实现云服务器承载区块链数据和提供交易检索任务。在区块链的隐私保护方面，我们通过研究基于贝叶斯网络的匿名评估模型AABN、环签名原理等，提出了具有隐私保护的后量子区块链方案等研究成果，解决区块链技术隐私泄漏的问题，保障区块链技术未来的应用发展。

项目负责人介绍

清华大学姜宇

清华大学软件学院助理教授，博士生导师。重点关注人工智能及工控等领域的软件安全，软件缺陷的自动挖掘与理解。相关成果发表论文60余篇，挖掘数百个软件漏洞CVE被收录到美国国家信息安全漏洞库中。曾获2015年中国计算机学会优秀博士论文奖、2017年全国软件测试大赛优秀指导教师、2018年中国科协青年托举人才计划等奖励。

项目介绍

区块链平台安全测试

项目主要围绕区块链平台的安全测试展开，由两部分组成，分别是针对区块链平台虚拟机的加固和缺陷检测技术。1、在虚拟机加固方面，我们设计了虚拟机加固框架，制定了六种安全风险的监测策略，并在微众银行的FISCO BCOS平台中加入了包含整数溢出检测策略的加固版本虚拟机，及时阻断包含整数溢出漏洞的合约的执行，阻断效率达到100%，可以有效规避在智能合约层次上引入的安全风险；2、在虚拟机缺陷检测方面，我们定义了智能合约变异模式以及基于执行序列差异性的用例评估指标，再使用差分模糊测试技术针对py-evm、aleth、geth、js-evm四大主流以太坊虚拟机代码进行了安全检测，发现了5个潜在的高危安全漏洞CVE被收录到美国国家信息安全漏洞库中。

图1：通用虚拟机加固框架

图2：通用虚拟机模糊测试框架

项目成果

在微众银行的FISCO BCOS平台虚拟机中加入了包含整数溢出检测策略的加固代码，针对整数溢出等7种安全攸关的危险交易阻断率达到100%，相关论文已被CCF B类会议SANER 2019录用。使用差分模糊测试技术对区块链平台虚拟机源码实现进行缺陷检测，发现了5个潜在安全漏洞，作为CVE被收入到美国国家信息安全漏洞库中，相关论文已被CCF A 类会议FSE/ESEC 2019录用。

项目负责人介绍

南京大学张瑾玉

研究兴趣和领域包括金融科技和智能、多智能体和区块链等，多年来在国内外会议和期刊发表论文20余篇，包括SCI收录5篇，SSCI收录3篇，EI收录12篇。主持国家自然科学基金面上和青年项目各一项，青年项目已结题并获“良好”；同时主持CCF-腾讯犀牛鸟项目，并参与多项国家/省部级项目；参与获得国家级教学成果奖二等奖等。

项目介绍

基于多Agent的共识节点选择研究

本项目着眼于区块链共识部分，在联盟链中部分节点参与共识的基础上，通过对目前区块链系统的共识节点进行系统分析，从实时节点身份、性能数据、可靠性等角度入手，对联盟链性能方向进行研究，提出更合理的共识节点选择策略来提高算法的共识性能，相对原区块链系统从交易确认到恶意节点筛选进行改善，同时申请发明专利三项，软件著作权一项，开发一套系统的区块链性能评价体系以及一套区块链共识算法性能测试工具(Caliper-FB)，从而提高性能，满足大规模应用场景。

我们希望完成一种联盟链中拜占庭容错共识算法环境下参与共识的节点共识强度预测方法，构建一个联盟链节点共识达成共识强度预测模型BP-Model，来有效解决目前存在的联盟链共识节点选择未知的难题，进而帮助联盟链搭建人员制订合理的共识节点选择策略，帮助测试人员在有限的时间内搭建具有最优效率的联盟链。基于华为区块链测试工具Caliper开发了一套面向FISCO-BCOS的性能测试工具(Caliper-FB)，主要功能：测试不同情况下的交易成功率，不同情况下的交易吞吐量，不同情况下的交易延迟，不同情况下的资源消耗(CPU，内存，网络，IO…)

项目成果

1、发表了一篇SCI/EI期刊论文，两篇EI会议论文；正在撰写一篇项目最终总结长文。

2、基于PBFT共识算法提出了支持可选节点参与共识的区块链共识流程，并且引入遗传算法来筛选参与节点，降低计算成本同时提高计算性能。并申请了相关的两项专利，其中联合申请一项：(1).一种基于因遗传的共识节点选择方法和装置；(2) 一种面向联盟链BFT算法的共识节点分类方法(联合申请)

3、基于华为区块链测试工具Caliper开发了一套面向FISCO-BCOS的性能测试工具(Caliper-FB)，允许用户使用预定义的用例测试不同的区块链解决方案，获得一组性能测试结果。并申请了相关的一项专利：一种面向以太坊区块链的性能测试方法。

4、搭建了一个统一的可视化展示平台，可以展示整个区块链系统的使用情况以及Caliper工具的性能测试结果，让使用者更方便更直观的进行观察。并申请了相关的一项软件著作权：区块链配置与交易信息可视化系统。

项目负责人介绍

北京理工大学沈蒙

北京理工大学计算机学院副教授，博士生导师。2014年获得清华大学计算机科学与技术博士学位。主要研究领域为数据安全与隐私保护、区块链技术与应用。已在ACM SIGCOMM等国际期刊和会议上发表学术论文40余篇，授权发明专利20余项。主持国家自然科学基金面上项目、北京市自然科学基金面上项目等。担任IEEE Network、IEEE IOT Journal等刊物的客座编辑。现为中国计算机学会互联网专委会委员、区块链专委会委员。

项目介绍

基于区块链的互联网征信数据安全共享机制

项目旨在结合区块链技术与安全多方计算模式的优点，设计基于区块链的互联网征信数据安全共享机制。该机制在保护数据安全与隐私的基础上，支持线性回归、逻辑回归、支持向量机等典型机器学习算法，将数据共享的方式从传统的复制型共享转变成计算型共享。如图1所示，在共享过程中，数据提供方无需将原始数据共享给数据请求方，而是协作数据请求方完成相应的计算，如训练机器学习模型。

基于微众FISCO BCOS平台，项目设计并实现了征信数据安全共享原型系统，其工作流程如图2所示。区块链为数据的安全可靠存储提供技术支撑，基于同态加密构造的安全多项式乘法和安全两方比较保证模型训练过程中的数据隐私安全。实验证明，训练得到的模型相较于常规条件下训练的模型，准确度没有损失，训练时间在可接受的范围内。

图 1 基于联盟链的数据共享方案图

图2 原型系统工作流程图

项目成果

提出了征信数据安全共享的系统模型，结合征信数据特点，设计了适用于FISCO BCOS平台的新型链上数据存储格式，支持数据隐私保护。基于区块链平台账本数据，设计了支持线性回归、逻辑回归、支持向量机等典型机器学习算法的安全多方计算模型。设计实现了基于FISCO BCOS平台的征信数据安全共享原型系统，利用真实数据集对安全多方计算模型的性能开展实验验证。发表学术论文13篇，其中SCI一区及CCF A类论文8篇，联合申请发明专利1项。

项目负责人介绍

西安交通大学王晨旭

近年来一直从事网络安全与数据挖掘等方面的研究工作，先后主持并参与了多个国家级项目，发表相关高水平学术20余篇。2016年在中国香港进修期间，申请人关注到对区块链技术在金融与物联网基础架构等领域的发展潜力，成立研究小组开始从事区块链相关技术的研究，目前已发表相关论文5篇，申请相关专利2项，软件著作权1项。

项目介绍

大规模区块链跨链技术研究

当前区块链平台有众多，基于不同的应用场景可以将区块链划分为公有链、私有链和联盟链。但由于所采用不同的底层共识协议、激励机制和数据模型，目前各个区块链系统相互独立，难以互连互通，极大地限制了支撑海量服务大规模区块链的构建。本项目从以下三个方面展开区块链跨链通信机制的研究。

1、单平台联盟链跨链通信协议研究

联盟链和私有链技术目前已广泛应用于商业机构特别是金融系统，联盟链跨链技术是实现商业机构内部价值网络相互连接的关键。据此，本项目研究设计适合单一联盟链跨链通信的解决方案，综合考虑跨链架构的安全性、一致性与可用性。

2、跨平台联盟链跨链资产交易模型研究

不同的商业机构根据自身业务的需求有不同的区块链设计架构、交易格式、数据模型等，本项目在联盟链跨链通信协议的基础上，针对法币现金、债券以及类似加密货币等资产以及交易所等市场基础设施，设计多平台联盟链跨链资产交易模型。

3、可扩展异构区块链跨链通信协议研究

在区块链领域，公有链与联盟链、私有链共同发展，但公有链与联盟链往往之间无法直接进行联合交易。据此，本项目研究联盟链与公有链之间可扩展的异构多链跨链通信协议。