首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

百度全新开放4个基于真实场景的大规模开放数据集

在7月4日举行的百度AI开发者大会(百度创始2018)上,百度高级副总裁兼AI技术平台系统(AIG)负责人王海峰发布了百度脑3,并指出了百度大脑3的核心是“多模态深层语义理解”,包括数据的语义、知识的语义、以及图像、视频、声音、语音等方面的理解。

多模态深度语义理解是如何在技术上实现的?你有多少能量?它将如何应用于改变我们的生活?在百度脑论坛的午后,百度脑3核心技术逐一问世,这给开发者带来了技术的盛宴。

有1000人的座位。开发商甚至坐在地上,或者站在场地上听整个网站。一位开发商说:“太多的干货和太少的时间回去找视频消化。”

从“看与听”到“理解与理解”

王海峰说:“多模态深度语义理解可以使机器更清晰、更深入地理解、理解它背后的含义,深入理解真实世界,然后更好地支持各种应用。”

视觉语义使机器能够看到和理解视频,并提取结构语义知识。视觉技术部主任吴中沁,面向技术和增强现实技术部,吴中沁,视觉语义技术首先识别人、对象和场景,捕捉它们之间的行为和关系,形成语义知识。一种循序渐进、数字化和结构化的方式,最终结合领域和场景来实现智慧。推理、登陆行业应用。例如,在零售领域,它可以准确地判断每个人的行为和行为,并真正实现顾客对商品的占有。在未来,视觉语义技术可以进一步扩展,结合新的传感器和人工智能芯片,在感知水平和计算水平上都可以大大提高;手机的组合可以更好地利用用户体验。未来,百度视觉语义技术将在百度AI开放平台上向开发者开放。

语音技术的升级使机器更好地了解世界。百度语音技术部主任说,百度在基于远场的语音语义集成技术方面取得了重大突破,为业界提供了更为先进的语音技术。语音语义学的集成提高了10个点的远距离交互中的高频查询识别的准确率,保持了常见的查询识别率,多语言混合声学建模是基于深层PeaK2的,极大地提高了汉语的准确性。和英文混合查询识别,相对误差率比行业中最好的竞争产品低20%;新升级的TTS技术产业是第一个集成波谱和技术的产品,是保证合成产品质量和降低成本的一种途径。同时。此外,百度发布了一种低成本的远场语音技术解决方案,“度小云”。它是基于深峰V2语音识别技术、语音语义集成技术和LSTM VAD深度学习语音分割技术,实现了业界领先的五级唤醒技术,并具有基于WaveNET的精细声音库,支持远场优化。音频通信技术。未来的开发者可以在平等的基础上获得百度的远场语音能力。

如果机器想要像人类一样有智慧,那么把语言变成知识是必不可少的。百度AI技术平台系统执行总监吴甜说,经过多年的发展,百度自然语言处理技术已经形成了一个全面的、先进的模式。百度知识地图已经发展成为一个复杂、多而全面的多语义知识地图,包括实体阿特拉斯、工业阿特拉斯、事件阿特拉斯、焦点阿特拉斯、多媒体阿特拉斯,它们可以覆盖90%的实体及其属性在一般要求中。在阅读理解技术中,百度大脑已经阅读了数以千计的文章,相当于收集了6万个中国国家图书馆,从而积累了数亿个实体,数以千计的事实,并通过“学习”的实际应用。“每天生产的知识是不断优化的。在对话理解方面,百度理解和交互技术平台单元升级到2,进一步提高了冷启动能力,支持像人类一样的对话学习,并打开了第一个工业级对话系统的第一个开源框架跳过建筑门槛,让开发者无缝地对接云。百度将继续开拓新技术,提供更灵活便捷的解决方案,促进自然语言理解技术的创新和发展。

夯实基础:数据、算法、计算能力同步发展

数据、算法和计算能力是影响人工智能技术发展的重要因素。主论坛上,王海峰表示,百度脑3首次将芯片集成到技术系统中,推动百度脑计算能力爆炸式增长。百度自己的第一个云满功能AI芯片,昆仑,也在发布会上亮相。未来,AI芯片将与百度自主开发的PADLDLADLE深度学习框架相结合,促进AI产业生态的快速发展。

百度2016的开源PaddlePaddle是中国开发者最好的学习框架。在主论坛上,王海峰发布了PADDLADADLY3.0。下午,百度AI技术与生态系总经理于有平作了详细的解释。PADILADADLY3.0包括一个完整的核心框架,以及AI Studio、AutoDL、EasyDL和其他平台,这些平台允许开发人员同样容易地获得最好的AI能力。PADILADADLIE3.0核心框架已经完全优化了服务器的版本和移动终端的版本。PADLDLADLE流体提供了丰富的API以满足通用主流模型的要求,支持广泛的模型构建,训练运行时以满足各种类型的模型训练需求;PaddlePaddle服务可以灵活且适应多种需求。预测引擎;PADLIPADLE移动集成百度移动终端预测体验,提供多平台支持。

在PADLDLADLE 3.0中,AutoDL引起了人们的广泛关注。百度的主要数据(北京)实验室主任浣熊说,AutoDL可以更有效地和自动地搜索神经网络,并且开发者不需要特殊的硬件设备来快速获得高质量的模型。AutoDL提供各种能力来支持新的深度学习网络结构的设计,以及优化现有的深度学习网络结构和参数,并匹配特定的任务场景。

好的技术需要实时数据。去年百度推出了“宽敞”的百度AI开放数据集程序,首次打开户外场景理解、视频剪辑、阅读理解3个数据集,这次,有4个基于真实场景的大型开放数据集:信息提取、知识提取、流量预测、实体化。TY标签,将为人工智能技术的突破提供强大的动力。

海量数据的爆炸性增长和数据价值的挖掘已成为许多行业的共同需求。百度大数据部门的高级主管Guo Xie说,百度已经从数据到数据工程、数据科学、数据产品和工业项目形成了一个大的数据产品技术栈。基于大数据的特点,从生产数据和生产工具两个方面促进了工业的发展。为了最大程度地保证数据安全,百度正式发布了大数据开放平台“PooStand”。基于全球领先的百度AI技术,数据安全性得到了全方位的保障,工具能力逐渐开放,使行业数据安全。

在现场,百度开始了一些比赛。百度星开发者竞赛将如期归来,除了PADLIPADLE基于中国大学计算机竞赛的人工智能竞赛、KK-知识提取、交通预测、无人驾驶汽车系列、以及商业标志分类和测试,人工在智能加速器和设计等大数据竞争。百度表示,它欢迎所有专家的挑战,并通过竞争共同推动AI产业的发展。

业内人士认为,百度在技术升级领域一直是人工智能领域的佼佼者,同时推动了技术的落地。百度的大脑已经升级到3,这也标志着百度AI技术的跨越式升级。正如王海峰在开幕式上强调的,“百度的AI能力的核心是百度大脑,百度大脑3是百度AI能力的集合体。”基于百度持续的大脑突破的技术力量,百度有能力提供顶级AI技术。Y向中国的开发者和企业,使每个开发者和企业都等于AI的顶级能力,然后让AI在中国绽放。

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20180711A1KY5N00?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

相关快讯

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券