前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >在人工智能的世界里,测试将是一场噩梦,衡量标准将是关键

在人工智能的世界里,测试将是一场噩梦,衡量标准将是关键

作者头像
企鹅号小编
发布2018-01-08 10:27:01
6130
发布2018-01-08 10:27:01
举报
文章被收录于专栏:企鹅号快讯企鹅号快讯

人工智能进入企业是由更多的数据的可用性推动。更多有趣的数据可用于更高的数据量,因为已经被测试的系统,应用程序,进程和接口的数量正在增加。数据的可用性使龙头企业进入了一个前所未有的企业自动化阶段。

在这个阶段,企业将在其流程中整合更多的预测性决策。这些决定将由一个或多个AI模型提供支持。概率决策将被证明是企业的巨大福音。然而,概率决策的引入将为企业带来质量和测试挑战的新水平。这将迫使行业如何进行质量保证以及如何设计和生成测试指标。

新的质量标准

相同的数据,多个模型,相同的AI场景

在这种情况下,使用相同的数据来生成多个AI模型,使用不同的AI技术为相同的AI场景/业务问题提供动力。不同的算法和技术以不同的方式利用嵌入的信号和数据结构来产生AI模型,从而可以表现得非常不同。

转换后的数据,多个AI场景

在这种情况下,数据集通过几种ETL机制转换为不同的AI场景/及业务问题。数据的转换可以在下列之间变化:

采样:数据集的一个子集在子集可以被使用,但不必随机生成。

过滤:训练数据集旨在包含或排除某些类型的行或信号。

预测:训练数据集旨在包含数据集中可用属性的子集。

聚合:训练数据集是通过聚合建立的,跨特定的一组属性或随着时间的推移。

派生:训练数据集是通过一个或多个属性级别转换(如字符串到整数,整数到分类,装箱等)构建的。

AI生产链

在这种情况下,建立了多个AI模型,并通过数字方式或通过模拟的人力连接相互连接。例如,用户可以使用AI模型的输出来确定结果。他们可以将结果输入到业务工作流程中,也可能输入第二个AI模型,或者人员可以使用第一个AI模型的结果来确定下一个输出。在这种情况下,第二个AI模型的结果的质量可以根据第一个AI模型的结果的质量而变化。

测试最佳实践

企业范围内的数据转换映射

企业需要确保他们建立和维护全面的企业级数据转换图。这个企业范围内的数据转换映射应该描述如何从原始数据源获取数据,并将其转换并提供给AI模型。

拥有企业范围的数据转换映射,可以轻松无缝地确定AI模型的出处。这是确定上游数据质量问题对AI模型和AI模型所影响的业务工作流程的影响所必需的。

数据转换语义分析

企业也需要投资于运营和语义上的数据转换。语义数据分析可以确定将数据转换应用于原始数据集后生成的输出数据集中的模式及其结构。

在数据的转换版本中确定这样的模式可以用于分析数据转换技术。当数据或其转换技术中的错误改变数据转换的概况时,可以生成警报,并且可以估计对下游AI模型的质量的影响。

AI生产链中的限制

企业应该投资人工智能工作流程功能,以便在下级业务工作流程中使用上级AI模型的输出的限制。另外,这些约束条件应该是可配置的,并且可以被严格监控,以确保上级AI模型的输出消费者能够理解和明智地使用输出。

AI测试指标

企业测试规范需要投资于AI 测试指标,这些指标能够精确地确定和测试不仅仅是单个转换或AI模型的质量,而是整个AI驱动的业务工作流程的质量。除了低级测试指标之外,测试指标还需要包括衡量整个AI驱动的业务工作流程是否实现其目标和客户需求的测量。

鉴于AI驱动的工作流程的预测性质,在整个工作流程完成之前,确定失败或不理想的结果可能并不明显。测试指标和收集数据并生成这样的测试指标的系统需要进行测试,以收集业务工作流程的最终结果,以定义和提供全面的测试指标和质量确定。

本文来自企鹅号 - 你的第一媒体

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文来自企鹅号 - 你的第一媒体

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档