首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
您找到你想要的搜索结果了吗?
是的
没有找到

【实践】HMM模型在贝壳对话系统中的应用

对话系统是一个庞大的系统,涉及的问题很多,本文主要讲解隐马尔可夫模型(Hidden Markov Model,HMM)在对话管理(Dialog Management,DM)中的应用。DM在对话系统中的作用是维护对话状态并根据当前对话状态选择下一步合适的动作。 在贝壳找房APP中,客户和经纪人的对话过程可以看作是一个时间序列。在对话过程中,经纪人需要基于当前的对话状态对客户的消息作出合适的回应,即选择合适的动作。因此,经纪人的动作决策是一个基于时间序列的问题。而HMM模型是比较经典的解决序列问题的机器学习模型,所以,在DM的动作决策问题上首先尝试了HMM模型。本文将结合实际案例从理论推导、模型构建、实验分析三个方面对HMM模型在DM中的应用进行详细解析。

01

系统比较RL与AIF

主动推理是一种建模生物和人工智能代理行为的概率框架,源于最小化自由能的原则。近年来,该框架已成功应用于多种旨在最大化奖励的情境中,提供了与替代方法相媲美甚至有时更好的性能。在本文中,我们通过展示主动推理代理如何以及何时执行最大化奖励的最优操作,澄清了奖励最大化与主动推理之间的联系。确切地说,我们展示了在何种条件下主动推理产生贝尔曼方程的最优解,该方程是模型驱动的强化学习和控制的几种方法的基础。在部分观察到的马尔可夫决策过程中,标准的主动推理方案可以产生规划时域为1时的贝尔曼最优操作,但不能超越。相反,最近开发的递归主动推理方案(精细推理)可以在任何有限的时间范围内产生贝尔曼最优操作。我们通过讨论主动推理与强化学习之间更广泛的关系,补充了这一分析。

01

Excel量化分析案例:投资组合收益与风险量化分析

证券和股票市场的投资决策本质上就是一种在回报收益和投资风险之间权衡的决策。投资者需要早不同的投资产品间做出选择,同时也要考虑在选择出的投资产品上投放的资金比例,选择结果组成了一个投资组合。传统的投资组合收益与风险分析集中在两个关键统计量上:均值和方差。均值是指投资组合的期望收益率,是组合中所有投资产品的收益率加权平均;方差指的是投资组合收益率的方差,用以刻画收益率的变化和风险程度。根据投资组合理论,一个理性的投资组会在给定方差水平下调整投资组合资金投放比例使得期望收益最大化,或收益方差最小化。

01
领券