基于知识图谐的问答(Knowledge Base Question Answering,KBQA)是指给定构建完成的知识图谱,通过对用户问题理解,将用户的问题转化为在知识图谱上的查询语句,并执行该查询语句得到答案返回的过程。由于目前知识图谱通常是基于事实的图谱,所以KBQA通常用来回答事实性或百科类等知识问题。
KBQA通常包含以下步骤:知识图谱构建与存储、语义解析、查询语句执行、答案与回复生成。KBQA也分为在线部分和离线部分。KBQA在线部分将语言理解的结果用于做语义解析。KBQA离线部分主要包括知识构建与存储(即通过知识图谱技术对数据的表示、抽取、挖掘、关联、推理等操作形成行业知识库)、语义解析模型数据准备与训练这两部分。
语义解析是基于知识图谱问答系统的核心,将用户基于自然语言问题转化为计算机能够理解且可执行查询语句,然后在构建好的知识图谱上进行查询,从而得到问题的答案。
目前已有的语义解析方法主要包括:基于模板的方法、基于深度学习端到端的方法、基于复述的方法、基于图搜索的方法和基于表示学习的方法等。目前市场上大部分产品都是采用单一策略的方式来完成知识问答。其中,基于模板的方法适合的问答类型有限,且通常需要领域专家设计模板,人工成本很高,通过自动学习模板的方式也不够成熟;端到端的深度学习需要依赖大量标注数据,人工介入的耗费同样十分巨大,虽然能够较好地解决单跳问题,却并不适用于复杂的多跳型问题,同时在面对小数据量的领域知识图谱时,由于标注数据缺失,通常无法完成令人满意的问答任务,并且深度学习的黑盒特性导致其并不具备可解释性与可控性,在真实落地场景下会存在问题;而基于复述、基于图搜索、基于表示学习等方法同样存在各自的受限领域。因此,虽然实现语义解析的策略多种多样,但是每种策略具有不同的特性,能够有效工作的作用域有限,无法适应多领域多样性的用户问题,导致系统鲁棒性不够强。
领取专属 10元无门槛券
私享最新 技术干货