如何让机器人智能生成报表回答问题

统计报表一般是企业各个部门的核心数据的汇总.各种管理经验被逐一抽象成报表的不同功能点,然后交由信息技术团队开发实现,并最终由行业专家来使用和解读报表.例如,在商品流通环节,不同品类、地区、团队、时间的销售流向,可以由纯销量和动销率等相关的报表来建模和可视化,资深的销售管理者通过几张报表就能了解情况.

但当前市面的报表系统在实际使用中存在下面的不足之处:

(1)每一项报表都要定制开发:在设计报表系统时,通常要预先设定好所有的分析维度和结果形式,然后从底层开始编程实现,但实际的业务场景却千变万化,很难形成一个固定的需求,因此报表系统经常会有大量的后续定制开发.

(2)报表的使用解读存在局限:在使用报表系统时,存在一些局限:一方面,报表系统常以可视化方式展现分析结果,但是如何看懂报表,还需要具有专业知识的人来进行解读;另一方面,手机屏幕太小的问题也使得报表系统难以在移动环境中便捷使用.

(3)无法处理多源异构的数据:报表系统的基础数据通常来源于多个不同的数据库系统,可能不仅表头和表格结构不同,甚至即便同一目标的名称在不同的系统中录入时因为简称、翻译、缩写等原因导致语言表述不同,使得统计时难以自动合并对齐.

那么有没有可能存在这样一种场景:不再需要报表定制开发,也不再需要专家解读报表,当普通人问报表系统一个问题,系统自动生成一个准确的答案,无论是以数字,还是表格,抑或是图表等合适的形式.比如下面的例子:

示例一:

示例二:

示例三:

答案是肯定的. 网感至察推出的“数据工厂”产品, 可以通过自然语言问答的方式, 来自动生成报表作为答案, 解决以上几个不足之处. 它集成了网感至察自主研发的“认知云”产品和“小感会话机器人”产品来实现这一酷炫功能.

“数据工厂”回答用户提问的基本过程如下:

(1) 将数据库中的表头和文本字段,进行语义理解,建立知识图谱,例如建立从数据“老百姓大药房万达广场店”到表头“零锁药店”再到类别“终端”的概念映射关系;

(2) 将用户所问的问题文本结构化, 与上述知识图谱匹配,从中抽取出用户的意图要素,例如从“龙牡壮骨颗粒去年在湖北省荆州市销量趋势如何”中抽取“龙牡壮骨颗粒”、“去年”、“湖北省荆州市”、“销量”、“趋势”等定义报表的要素;

(3) 根据用户所问问题中的查询意图要素, 构建后端数据库查询语句,获得基础数据集合,例如根据“龙牡壮骨颗粒”、“去年”、“湖北省荆州市”等要素查出流向数据;

(4) 根据用户所问问题中的结果和表现形式, 基于基础数据集合,渲染成相应的列表和图表等形式,例如在上一步的基础上对“销量”和“趋势”进行计算和展现.

“数据工厂”这套工作流程背后的核心技术是网感至察自主研发的TML平台为代表的认知计算技术,核心的工作包括对原始数据库中的表头和文本字段进行语义理解,对用户问答进行语义理解,并从中抽取出答案的产生过程也即生成一个报表的相关要素.

网感“数据工厂”旨在帮助企业客户提炼数据资产的价值,它实现了一套从数据采集、治理、分析、提炼到应用的通用型计算流水线,帮助企业在销售流向分析、商品选品定价、客服录音洞察、会员画像、文献情报分析等多个业务场景,对数据资产进行分析和利用.它目前服务着医药、能源、零售、金融等多个行业的客户.

相关阅读:

网感发布数据工厂产品 一 :打造企业级人工智能

如何解决药厂数千张EXCEL报表的合并问题

认知计算如何助力药品生产企业

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20180706A0TUIZ00?refer=cp_1026
  • 腾讯「云+社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。

扫码关注云+社区

领取腾讯云代金券

年度创作总结 领取年终奖励