传统的数据治理体系主要是面向结构化数据,服务于企业的决策运营(Business Intelligence),长期以来企业大量的非结构化数据并没有很好的治理和利用手段。随着通用人工智能的快速发展,文本、图片等非结构化数据成为了大模型训练的核心要素,数据集的规模和质量成为了推动AI技术进步的关键因素,据统计,最新大模型训练所用的数据集规模已经是5年前训练数据的近千倍,产业界也提出了以数据为中心(Data-Centric AI)人工智能发展的理念,数据和算法的边界更加模糊。然而,面向人工智能数据治理探索刚刚开始,其概念和内涵还在不断变化中,尚未形成较好的理论框架和实践方法,通用人工智能的数据治理,除了关注大模型训练中的数据质量问题,还需要应对安全与隐私保护的挑战,同时亟需要建立合成数据的治理能力,消除版权侵犯、歧视等风险。
本刊以“人工智能数据治理”为主题进行征文,集中展示人工智能数据治理方面的技术和理论研究成果,包括:高质量数据集建设、多模态数据管理、非结构化数据管理、人工智能数据工程、大模型数据安全与隐私安全、人工智能数据伦理等。
专题主题:人工智能数据治理
01
征稿范围
包括但不限于以下主题:
1) 面向人工智能数据治理问题与理论框架
2)人工智能数据集质量评价体系
3) 大模型数据安全与隐私保护实践
4) 人工智能数据治理技术与工程实践
5) 多模态数据治理
6) 智能化数据治理技术实践
7) 合成数据管理实践
02
征稿要求
1、文稿应属于作者的原创性科研成果,数据真实可靠,具有重要的学术价值与推广应用价值;应未在国内外公开发行的刊物或会议上发表或宣读过,也不在其他刊物或会议的审稿过程中,不存在一稿多投问题。
2、文稿应包括中英文题名、作者信息、摘要、关键词、基金项目名、参考文献,中文正文和作者简介(包括照片),文稿一律采用Word文档提交。
3、投稿时,请注明作者联系方式(电子邮件、电话、邮寄地址)及“‘人工智能数据治理’专题投稿”及所属方向。
03
重要日期
征稿截止日期:2024年4月30日
审稿完成日期:2024年6月30日
领取专属 10元无门槛券
私享最新 技术干货