2021 年 6 月 1 日,由北京智源人工智能研究院(以下简称“智源”)主办的 2021 北京智源大会在北京中关村国家自主创新示范区会议中心成功开幕。包括 Yoshua Bengio、David Patterson 等图灵奖获得者在内的两百余位国内外人工智能领域顶尖学术和产业领袖,齐聚一堂,共同见证 AI 大模型时代的启航,探索人工智能发展的美好明天。
在这次国际性的年度人工智能的盛会上,智源研究院、北京智谱华章科技有限公司(以下简称智谱AI)和小冰公司联合发布的原创虚拟学生“华智冰”上线,引发了广泛的关注。其中,智谱AI对大家来说还是比较陌生,这是一家怎么样的公司?
其实,这家公司源自清华大学知识工程实验室。从实验室源头算起,至今已有25年的研究积累。实验室多年来聚焦于网络环境下的知识工程,在知识获取、融合和挖掘上取得了很多创新成就。2006年,实验室推出了科技信息分析引擎AMiner,获得了KDD时间检验应用科学奖。2019年,为了把AMiner技术进一步推广,实验室通过技术转化成立了智谱AI,希望把基于知识和大数据的挖掘技术产生更广泛的应用。
在深度学习出现以后,人工智能迎来一波爆发。甚至在某些领域,人类的能力已经被机器赶上。但在数据驱动的感知人工智能框架中,计算机模型没法解决认知的问题,也没有办法做推理。所以,智谱AI提出了一个融合了知识和数据的双轮驱动人工智能框架,希望在人工智能领域取得一次突破式的创新。
在这个新的框架里,简单地把知识和数据叠加起来是不行的,因为数据与知识的融合任务面对着很多计算科学理论、算法和基础设施的挑战。只有克服了这些挑战,让机器把所有的数据和知识都真正的利用起来,才能实现真正的智能。
形象地说,通过双轮驱动中的数据轮部分,我们可以让模型“举十返一”,也就是说要具备归纳能力;而在双轮中的知识轮部分,则要做到“举一反三”,可以进行逻辑推理。这样我们结合了知识、数据、逻辑和推理,形成了新一代的人工智能。
具体来说,双轮驱动的数据部分,我们需要一个的是一个超大规模智能模型,而在知识轮部分,则需要一个规模巨大、性能稳定的知识图谱,这样才能把数据中的一些有深度的知识抽取出来。
基于双轮驱动人工智能框架,智谱AI开发了一系列工具和产品,并在智源大会上作了集中的展示。
在会议第一天上午的主会场上,智谱·AI 首席科学家、智源研究院学术副院长、清华大学教授唐杰正式发布最令行业期待的智源“悟道 2.0”巨模型。“悟道2.0”巨模型是中国首个,也是全球最大的超大规模智能模型,实现开创性的 1.75 万亿参数 + 突破 9项精准能力纪录 + 全链路高效易用。
据介绍,悟道模型的整体框架主要包括文源、文澜、文汇、文溯四个部分。其中,智谱AI重度参与了文汇和文溯的研发,也从整体上参与了对整个项目的协调工作。
除了自身可以完成大量任务外,“悟道2.0”还能为广大开发者、技术公司,以及传统企业提强大而通用的智能服务底层系统,仅通过模型微调实现领域模型的构建,避免不必要的重复模型训练。通过这种智能赋能的方式,“悟道2.0”之上将会出现一个超大规模的智能模型应用生态。
目前,国内首个预训练AI“悟道”平台已经上线。该平台主要通过智谱AI开发,面向公众免费开放(网址:https://pretrain.aminer.cn)。包括悟能作诗、作诗图灵测试、CogView、文汇小剧场、悟能人设问答、悟能看图说话、悟能图文问答、文汇虚拟助理等,还有多款应用陆续开放中。
“小科小科,你知道‘天问一号’吗?”
“天问一号是中国空间技术研究院所研制的探测器,负责执行中国第一次自主火星探测任务。”
耐心回答大家关于科技方面问题的并不是人类老师,而是一个叫“小科”的科普机器人。小科的亮相引起了智源大会现场观众的强烈兴趣,他们不断向小科提出各种各样的科学问题,而小科也不厌其烦地给出准确回答。
小科背后的技术非常复杂,项目团队的负责人之一,智谱AI合伙人和高级副总裁左家平表示,小科机器人的功能是基于智谱AI底层技术研发,目前,基于深度学习的人工智能创新已经逐渐触及天花板,开发团队提出了数据融合知识的双轮驱动人工智能框架。在这一框架下,人工智能模型兼具了感知和认知的能力,既有“举十返一”的归纳能力;也能“举一反三”地逻辑推理。
这些前沿技术赋予了小科独特的理解和表达知识的能力。项目团队成员、清华大学计算机系博士生于济凡表示,小科目前已经学习了百万级别的知识图谱,也接入了超大规模的中文预训练模型,相比很多其他智能问答类产品,进一步减少了人工规则,加强了智能学习和提升能力。
在工程实现上,团队也做了大量创新。项目团队成员,智谱AI的工程师谭棋洋表示,为了增加机器人对人工智能模型的兼容性,并为机器人定制合适的动作,让它能在不同的场景里能用更准确合理的姿势增加交流的亲密性和表达的准确性,团队重构了机器人底层的交互逻辑。
在此前的北京科技周上,“小科”首次亮相就引发了轰动,在闭幕上被被评为主会场最受欢迎的科技产品第一名,也被中央电视台等媒体报道。
继北京科技周活动中被评为最受欢迎科技产品之后,小科又来到了智源大会的现场,在这里,她不仅可以回答大家提出的和AI相关的专业问题,还可以指挥控制大屏幕切换到用户想玩的图灵游戏。
在未来,赋予小科智慧的科普数字脑不仅仅能搭载在实体机器人上,还可以在数字人、全息人、手机和电脑中发挥能力,从而更方便地进入人们的日常生活,为智能科普服务发挥作用。智谱·AI 已与多个科普场馆和其他科研、科普机构达成合作共识,共同研发、完善和部署科普机器人,让最前沿的人工智能技术在中国的科普事业中发挥更大的作用。
在会议现场,一块设计震撼、交互丰富的人才地图动态情报大屏也让很多人驻足围观。这块屏幕清晰地展示了全球各地人工智能领域的人才数、平均年龄、论文发布、产业和研究院所的人才分布情况。在通过触摸屏点击关键学者时,还会出现学者的姓名、照片、工作经历、高被引论文详解、合作圈等详细信息。
人才大屏背后的数据和技术基础来自领先的科技信息情报分析引擎AMiner。2006年,清华大学知识工程实验室推出了AMiner。2019年,为了把AMiner技术进一步推广,产生应用的生产力,实验室通过技术转化的方法成立了智谱AI,希望让基于知识和大数据挖掘的技术产生更广泛的应用。
智谱AI商业智能副总裁刘佳表示,此项技术与产品体系主要包括知识图谱、智能挖掘、预训练模型、智谱咨询、科技情报等,其中在此次智源大会上展示的智慧人才大屏,体现了人才和动态科技情报挖掘的强大能力。
在现场,大才态势大屏吸引了来自高校、企业、科研机构、媒体等的众多参会者的驻足观看咨询,并通过触屏进一步获取感兴趣的数据。智谱AI CEO 王绍兰表示,基于清华AMiner的海量科技知识图谱、全球最大的学者画像网络,正为政府、科研院所、企事业单位提供基于产业链、创新链的科技发展趋势分析、人才地图等服务,为人才引进、招商引资、创新创业提供智能支撑。
此外,在 2021 年北京智源大会现场,中国首个原创虚拟学生华智冰也正式亮相,并由智源、智谱·AI和小冰三方联合培养。
在会上,通过视频初次登台的华智冰形象亲切近人、言语自然,还在现场展示了作诗、绘画以及音乐的才艺,得到了现场观众的认可。来自智谱·AI的研究团队使用并融合了数据和知识的双轮驱动引擎技术,让华智冰有了逻辑推理的能力。
华智冰由智源、智谱·AI 与小冰公司三方共同开发。其中,底层以来智源的“悟道 2.0”模型和平台应用生态,同时,小冰公司也提供了全球领先的人工智能完备框架,同时负责声音、形象的开发应用。根据战略合作内容,三方将在超大规模预训练模型领域深化合作,并推进产品落地,加速构建国际领先的超大规模智能模型应用生态。
对于华智冰的诞生,唐杰教授表示:“小冰是‘悟道’超大规模人工智能模型上生态体系的重要成员,也是智源、智谱和小冰三方技术实力的联合体现。”依托小冰框架及智源“悟道 2.0”,华智冰不仅可以作诗作曲,生成图画,还将具有一定的推理和情感交互的能力,这使得她大大不同于一般的虚拟人物。
2021年6月2日,在北京智源大会认知智能论坛上,智谱AI联合清华大学计算机系知识工程实验室和搜狗公司联合发布了面向认知的全新AI+学术搜索产品。 这款三方联合发布的学术搜索产品以“AI正在帮你读懂科学”为理念,助力中国科研模式升级和优秀科研成果的影响力提升。产品以数据和知识的双轮驱动,融合了搜狗的搜索核心技术,以及清华大学知识工程研究室和智谱·AI在知识图谱、超大规模预训练模型方面的积累,能够提供AI驱动的文献检索、内容理解、专家画像等服务。
在发布上,智谱AI CEO王绍兰表示,智谱AI突破性地将数据和知识有机融合起来,形成了一个双轮驱动的认知智能框架。在此框架上,我们就能让人工智能理解科技进展,挖掘科技人才,预测科技发展趋势。王绍兰介绍,在搜索背后有两个大的图谱:科学技术图谱和全球科技人才图谱。融合了这两个知识图谱的搜索引擎不仅可以帮助学者做研究,也可以帮助政府、科研机构,甚至企事业单位一起做科技趋势的发现和人才评价等科技信息分析方面的工作,并最终助力我们分析产业链、创新链,能够为我们国家的科技决策、科技管理提供更深层次的支撑。
图注:智谱AI CEO 王绍兰致辞
作为悟道2.0巨模型、华智冰、小科和智慧人才大屏的技术支持团队,长期以来,智谱·AI 团队一直致力于推动人工智能理论、方法、工具、系统和应用取得变革性、颠覆性突破。在融合了知识和数据,形成双轮驱动的人工智能框架后,智谱AI在这个框架上搭建了一系列不同的智能应用,并在科技情报挖掘系统领域形成了学术搜索、智慧人才、知识图谱、咨询服务等多种产品。
未来,智谱AI还将向开发者、技术公司和传统企业开放人工智能模型接口,降低人工智能的使用门槛,将人工智能的最新结果普惠社会。