首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

AI落地,数据先行

数据是推动AI前进的燃料,这一在人工智能领域被广泛认可的观点,也得到了上海某医院教授詹维伟的肯定,在超声大数据与人工智能应用与推广大会上,他说,驱动AI落地临床应用,数据的可用性起着基础性的作用。

“顶级期刊刊发的关于医学影像AI的论文大多需要大样本(10万以上)数据库训练。”詹维伟说,海量的数据意味着数据可用、不被污染、且能实现标准化。而事实上,正因为存在被污染、信息不健全、难以标准化的三大“痛点”,中国的医学数据看似很多,但是可用性并不高。目前多中心的数据库建立过程中,经常出现对同一医学问题的不同说法。他认为需要经过几年的时间,完成行业标准的工作。

另一方面数据的不统一还存在一定的客观原因,例如不同品牌的仪器成像机理和标准不同,因此对于同一病灶输出的影像并不相同,这也大大提高了数据库标准化的难度。

为此专家呼吁相关机构进行数据的标准化工作。“整个医学人工智能的基础是大数据,大数据的基础是我们数据样本的标准库是否建立。”国家卫生健康委员会规划信息司信息处处长沈剑锋表示,标准的医学影像数据库不仅应该对数据进行标准化,还应该对病灶有清晰的标注,且兼顾年龄分布、疾病分类等其他维度的信息。

不止医疗领域,在AI+各行业发展的过程中,数据的可用性、准确性、标准化都将是发展过程中努力追求的方向。特别是数据的标准化,随着传统行业应用AI越来越广,行业内需要有结果经得起检验和准确度可预知的算法来解决实际问题,匹配行业内已经形成的标准和规范,这时候就需要经过筛选、标注的大量数据完成算法优化,实现AI落地。

样本量越大,误差就会越小,在没有标准数据库的情况下,就需要大量的数据来完成算法的优化。作为一家专业的AI数据服务公司,龙猫数据专注为AI及传统企业提供安全高效的综合数据解决方案。借助500万注册用户,为上百家AI明星企业提供专业定制化数据服务,并与众多国际知名企业开展长期业务合作。

龙猫数据在自动驾驶、计算机视觉、智能语音方面积累了大量多维度训练样本与数据集。依靠 “龙猫众包”APP和小程序,可满足语音、图像、视频、文本等多样化的采集任务;通过自主研发的智能标注平台,可为客户实现定制化的精准标注服务,标注数据涵盖人脸关键点标注、车辆拉框、3D点云标注、ASR语音转写等多层次内容。龙猫数据正在逐步优化建设的数据商城,则将数据精准度、标准化放在了首要位置,通过严格筛选,保障了算法训练的良好效果。

我们的服务

我们为他们服务

龙猫数据将在AI标准化数据建设过程中积极参与,为AI发展贡献出自己的力量,助力产业AI,铸梦美好未来。

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20190506A0GGC600?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

相关快讯

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券