首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

海天瑞声成为深数所人工智能专区“语料数据商”

11月17日,2023中国 (深圳) 数据要素产业创新大会——数据要素赋能人工智能产业创新平行论坛在高交会期间开幕。据悉,这是数据要素相关主题首次参展高交会并举办系列重要活动。

海天瑞声数据亮相开放算料联盟首次发布的高质量垂直行业数据集,并作为“语料数据商” 成为深数所人工智能专区数据商。此外海天瑞声中国销售中心负责人甄庆伟受邀参加“AIGC 与数据要素的未来” 圆桌对话。

本次大会由深圳市发展和改革委员会、深圳市政务服务数据管理局、福田区人民政府指导,深圳数据交易所主办,主题为“数据赋能产业,科技智创未来”,采用多种形式展示数据创新应用成果,促进重点产业全链条数字化转型,推动数字经济与实体经济深度融合发展。

海天瑞声数据入选“开放算料联盟高质量数据集”

论坛上,开放算料联盟正式发布“开放算料联盟高质量数据集”。数据集涵盖金融、政务、科研、小语种、自动驾驶等不同领域,总规模超过1000T,涉及文本、图像、语音及多模态数据,有望打破训练数据瓶颈,为通用大模型和行业大模型训练提供有力保障。

海天瑞声“中文千万轮对话语料库DOTS-NLP-216”入选。该数据集符合中国人表达习惯,上亿级token,包含正式&非正式风格对话,使用偏口语化自然表达。覆盖工作、生活、校园等场景,及金融、教育、娱乐、体育、汽车、科技等领域。

深数所人工智能专区“语料数据商”

在人工智能专区数据商纪念证书颁发仪式中,包括海天瑞声在内共有10余家企业分别成为 “语料数据商”、“算力增值服务数据商”、“模型数据商”、“应用数据商”。海天瑞声作为“语料数据商” ,获深数所颁人工智能专区数据商纪念证书。

“AIGC与数据要素的未来”圆桌论坛,共话“以数据为中心的人工智能”

本次大会中还举办了“AIGC与数据要素的未来”圆桌论坛。在中国信息通信研究院云计算与大数据研究所人工智能部高级主管李荪的主持下,中国农业大学校外导师前Meta研究科学家薄晓、海天瑞声中国销售中心负责人甄庆伟、安硕征信大数据解决方案总监王强、文因互联售前总监&产品解决方案专家吴晓文等行业大咖展开了热烈交流与讨论,分享了他们对于“以数据为中心的人工智能”的见解与思考。

甄庆伟表示,海天瑞声作为国内行业首家上市的数据供应商,始终致力于提供高质量数据赋能企业算法的不断发展。高质量数据是对数据的准确性、全面性、时效性、以及安全与合规等维度的综合考量,从应用层来说则涉及数据产品、数据语料和数据库等方面。

对于人工智能数据产业的建设,甄庆伟提到要加强学界和企业之间的交流合作,让不同行业、不同企业之间的数据安全合规的流通,才能更好的推动整个人工智能数据建设的进展。此外,在数据交易环节,需要政府和行业共同协作制订相关标准,搭建可信的交易环境,助推产业健康发展。

  • 发表于:
  • 原文链接https://page.om.qq.com/page/O1MKBmfhZuNmNYD9EYAETSeQ0
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

相关快讯

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券