今日(18日)上午,位于四川成都新津经济开发区的成都市国家数据标注基地牧山园区举行开园仪式。现场,成都数据(标注)产业发展联盟正式成立,并对成都数据公园“数据要素服务站”、可信数据空间新津节点进行授牌。此外,活动还发布了四川方言高质量数据集、四川方言大模型、四川方言AI+政务服务热线应用。
▲成都市国家数据标注基地牧山园区开园
作为成都落实国家数据标注试点城市建设任务的重要载体,该园区规划载体面积28万平方米,自去年8月正式启动建设以来,已建成7万平方米,在建10万平方米将于6月竣工,将围绕“数据标注+”产业链,打造数据产业集群。
据介绍,数据标注产业是对数据进行筛选、清洗、分类、注释、标记和质量检验等加工处理的新兴产业。培育壮大数据标注产业对于提升数据供给质量,推动人工智能创新发展具有重要支撑作用。
你是否察觉,我们常用的即时通讯软件突然能高效地“听懂”四川话了,不仅能精准转译,还能响应方言指令操控智能家居,让我们“动口不动手”。其实,这得益于对四川方言的数据标注,使得AI能够通过深度学习,成功跨越理解方言的障碍。
已入驻新津的成都向己科技有限公司(以下简称“向己科技”),就为国内第一大语音商在内的多家知名公司提供了超过5000小时的数据集,包括为国内最大即时通讯商提供的超过10万条四川方言数据集,大幅提升了语音转文字的准确度。
红星新闻记者了解到,新津将以平台化理念运营,在天府数字科技联创中心打造孵化器,并在基地打造高品质产业承载空间,也同时在北京中关村打造城际合作飞地,构建“一中心一园区一飞地”的发展格局。
此外,还将积极整合产业和教育资源,引企入校的方式打造职业教育基地,引校入园的方式打造公共实训基地,提高标注行业人力资源供给与需求的精准度和稳定性。
新津区有关负责人称,新津将加快数据标注基地10万平方米在建载体竣工投运,推进数据标注行业可信数据空间、数据产业公共实训基地、高标准数据标注空间等项目建设,持续扩大数据标注产业规模。
红星新闻记者 雷浩然 摄影报道
编辑 欧鹏
领取专属 10元无门槛券
私享最新 技术干货