我想预测一个地点(映射到lat/lng的邮政编码)会有多拥挤。我想对这样的问题作出预测:下周一下午6点至8点,围绕邮政编码12345的50米地区的人群密度会是怎样的?
首先,我正在处理包含时间戳和邮政编码的历史事务数据(作为人类活动的代理)。当新的事务数据发生时,我也想将它们合并到我的模型中。
这有道理吗?
我是否需要重新运行整个过程来解释实时到达的新数据(例如,每5分钟一次)?是否有适合的增量ML模型?
发布于 2018-05-12 02:46:45
是否有适合的增量ML模型?
当模型处于生产模式时,您必须能够访问它,并且实际上能够用一个新版本更新它。由于所谓的数据转移,当新数据出现时,所有的ML模型都应该进行调整。您可以定期评估模型的性能。
我建议将问题建模为序列模型,每天使用多个输出来预测每个邮政编码的密度。
https://datascience.stackexchange.com/questions/31558
复制相似问题